Logo Modelo Qwen - 搜索 News

这一成果无疑为AI大模型领域带来了新的惊喜。值得注意的是，DeepSeek也曾透露将DeepSeek-R1的推理能力蒸馏成6个模型并开源给社区，其中4个模型正是基于Qwen开发的。这些基于Qwen-32B蒸馏的模型，在多项能力上实现了与OpenAI o1-mini相当的效果。这一消息进一步凸显 ...

搜狐4 天

李飞飞、DeepSeek为何偏爱这个国产模型？

【新智元导读】最近，李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型，而DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面：昔日称霸开源界Llama已悄然退位，新王加冕。斯坦福李飞飞团队的一篇论文，近来在AI圈子掀起了 ...

站长之家3 天

李飞飞、DeepSeek为何偏爱这个国产模型？

声明:本文来自于微信公众号新智元，作者:新智元，授权站长之家转载发布。【新智元导读】最近，李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型，而DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面:昔日称霸开源界Llama已 ...

新浪网5 天

李飞飞团队s1模型基于Qwen训练？阿里云确认：基于Qwen2.5-32B-Instruct ...

不过很快，该s1模型被指“并非从零开始训练”，其基座模型为“阿里通义千问（Qwen）模型”。对此，新浪科技向阿里云方面求证，阿里云方面确认 ...

第一财经6 天

宝兰德：产品已接入DeepSeek、QWen等大模型适配昇腾NPU算力

宝兰德在互动平台表示，官网所示属实。随着行业进入大模型时代，公司相关产品目前已接入DeepSeek、QWen、ChatGLM、文心一言等通用大模型且已有成功 ...

新浪网5 天

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

今日一则关于人工智能领域的新闻引发广泛关注。据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了 ...

IT之家6 天

全球第一：阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI ...

IT之家2 月 5 日消息，1 月 29 日新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，号称在多个基准测试中超越 DeepSeek V3 等竞争对手。阿里云今日宣布，Qwen2.5-Max 在 Chatbot Arena 大模型盲测中超越 DeepSeek-V3、Open AI o1-mini 和 Claude-3.5-Sonnet 等模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果