site:www.51cto.com - 搜索 News

9 小时

DeepSeek 实现任务调度分片算法 , 灵性十足，远超预期

千问给我的答案非常简单，基于我的伪代码做了简单的润色，生成的结果有点呆，假如是以前的我，会觉得也能接受，但当我体验完 DeepSeek 之后，我的选择有了方向。

19 小时

硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了

它是一种模型压缩技术，通过将一个复杂的、计算开销大的大模型（称为教师模型）的知识“蒸馏”到一个更小、更高效的模型（称为学生模型）。这个过程的核心目标是让学生模型在轻量化的同时，尽量保留教师模型的性能。

19 小时

ChatGPT 被逼急了，连夜上线 o3-mini，并且还免费......

也许是迫于 DeepSeek 的压力，open ai 的负责人萨姆·奥尔特曼，连发多个 Twitter（现在是 X）推出了新的模型 o3-mini，并且包含三个版本：low、medium 和 high，分别针对不同的性能和资源需求优化。

19 小时

DeepSeek 火爆了，主打高性能低价格！

DeepSeek 横空出世，一下子受到全球关注，1 月 27 日美股闪崩，AI 第一股英伟达最高跌幅达 17%，国内 AI 用户这个春节都在体验 DeepSeek，DeepSeek 服务器甚至卡到宕机。这到底是什么力量在推动呢？

51CTO6 天

28年AGI撞上数据墙，以后全靠测试时计算？CMU详解优化原理

2028年，预计高质量数据将要耗尽，数据Scaling走向尽头。2025年，测试时计算将开始成为主导AI通向通用人工智能（AGI）的新一代Scaling Law。近日，CMU机器学习系博客发表新的技术文章，从元强化学习（meta RL）角度，详细解释了如何优化LLM测试时计算。 2025年主导AI ...

51CTO6 天

DeepSeek R1，如此火爆！

一时间，全球AI玩家纷纷快速推出自己的“DeepSeek-R1”复刻版。抱抱脸、伯克利、港科大很快就用实力证明了：DeepSeek R1 是名副其实的国产推理模型的巨大胜利！相信连DeepSeek的创始人梁文锋自己都没有想到，春节前的一次发布，让全球AI圈都陷入了“冰与火 ...

51CTO6 天

执行推理时能对齐语言模型吗？谷歌InfAlign带来一种对齐新思路

为了解决以下定义 5 中的语言模型对齐问题，该团队提出了一个通用框架。在根据某个奖励微调生成式语言模型时，使用 KL 正则化的强化学习（KL-RL）来对齐生成式语言模型是一种常用框架。而 KL-RL 通常需要训练一个奖励模型，然后使用一个强化学习求解器。

51CTO6 天

Video Depth Anything来了！字节开源首款10分钟级长视频深度估计模型 ...

近期，字节智能创作 AR 团队联合豆包大模型团队开发的 Video Depth Anything（VDA）成功解决这一难题。 Video Depth Anything 工作来自字节跳动智能创作 AR 团队与豆包大模型团队。字节跳动智能创作 AR 团队致力于建设领先的计算机视觉、音视频编辑、特效处理、3D 视觉 ...

51CTO6 天

闲来无事，我测了测国产大模型的RAG能力

RAG正重塑大模型的江湖，成为新的「智能引擎」。最近，AI界被推理模型刷屏了。国内各家的推理模型，在新年到来之际不断刷新我们的认知。不过，当我们在实际应用中考量大模型，衡量好不好用的标准，就绝不仅仅局限于其性能和规模了。尤其是对于那些 ...

51CTO6 天

让大模型互联网「冲浪」，通义实验室WebWalker解锁复杂信息检索新技能

在信息爆炸的时代，互联网就像一座庞大的迷宫，藏着无数宝藏。但传统搜索引擎往往只能触及表面，对于复杂、多层级的信息检索显得力不从心。本文主要作者来自通义实验室和东南大学，通讯作者是通义实验室蒋勇和东南大学周德宇。其中第一作者吴家隆 ...

51CTO6 天

DeepSeek在美超越ChatGPT！问鼎苹果免费App第一

DeepSeek的热，还在持续ing。就在刚刚过去的周末，DeepSeek反超ChatGPT，一举登顶美区苹果应用商店免费App排行第一！我甚至都不喜欢AI助手应用，但我已经下载了DeepSeek。至于原因，正是DeepSeek在前几天开源的推理模型R1，引发了一阵又一阵的舆论热潮。仅仅花费 ...

51CTO6 天

OpenAI推出Operator帮助用户自动浏览网站

OpenAI发布了一个新的用于预览的AI代理Operator，该代理可以控制计算机浏览器并代表你执行操作。该工具可以通过键入、单击和滚动与网页进行交互。 OpenAI发布了一个新的用于预览的AI代理Operator，该代理可以控制计算机浏览器并代表你执行操作。该工具可以通过 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果