Qwen Logo 透明背景

这一成果无疑为AI大模型领域带来了新的惊喜。值得注意的是，DeepSeek也曾透露将DeepSeek-R1的推理能力蒸馏成6个模型并开源给社区，其中4个模型正是基于Qwen开发的。这些基于Qwen-32B蒸馏的模型，在多项能力上实现了与OpenAI o1-mini相当的效果。这一消息进一步凸显 ...

搜狐6 天

Qwen模型：AI开源新潮流的幕后英雄

那么，在这个技术大潮中，是否有一个高效、开源、且可以满足不同需求的解决方案呢? 科普知识最近，AI领域掀起了一股新技术热潮，李飞飞团队提出的Qwen模型受到了广泛的关注。Qwen模型作为AI大模型领域的重要一员，其背后体现了多个技术创新和重新设计。

GitHub4 天

47 lines (25 loc) · 2.16 KB

通义千问，是由阿里云推出的大语言模型，旗下同时开放 qwen-turbo,qwen-plus 等模型。我们支持对接通义千问里大部分可用的聊天大语言模型或嵌入模型。由于 API 限制，我们无法获取到通义千问的最新模型列表，所以当通义千问发布新模型时，我们滞后一段时间 ...

新浪网3 天

阿里巴巴的Qwen AI模型助力斯坦福、伯克利能够开发出低成本推理模型

这也解释了为什么越来越多的全球计算机科学家正在通过在Qwen模型上进行实验来增强AI系统。 OpenAI的GPT系列等顶级模型并非开源，因此无法下载用于 ...

IT之家3 天

权威榜单发布，全球开源大模型前十均为阿里通义千问衍生模型

近日，全球最大 AI 开源社区 Huggingface 发布了最新的开源大模型榜单（Open LLM Leaderboard），榜单显示，其排名前十的开源大模型全部是基于阿里通义千问（Qwen）开源模型二次训练的衍生模型。该榜单是目前全球最具权威性的开源大模型榜单，其测试维度涵盖阅读 ...

澎湃新闻5 天

李飞飞、DeepSeek为何偏爱这个国产模型？

【新智元导读】最近，李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型，而DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面：昔日称霸开源界Llama已悄然退位，新王加冕。斯坦福李飞飞团队的一篇论文，近来在AI圈子掀起了 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果