Meta Llama3 Logo - 搜索 News

1 天

人们总是涨时看好、跌时看衰。从2024年10月初到一个月之前，阿里巴巴港股从118港元跌到78港元，三分之一市值灰飞烟灭。当时的阿里，在急着甩卖资产，以至于被广大投资者看空。

玩过大模型训练的都明白，这个花费确实太低了，比如Meta Llama3 405B的训练成本约3930万H100 GPU小时，是DeepSeek的14倍，而后者的671B的参数量更大。（花血本砸钱的6小虎和巨头们肯定哭晕在厕所，迎接他们的将是投资人的“拷打”）但是，需要特别说明的是 ...

4 天

生成式AI未来展望：GPT-5、DeepMind新科技与人机交互的革新

在人工智能技术迅猛发展的当下，生成式AI成为了科技界一个备受关注的热词。随着大模型技术的逐步成熟，各大公司纷纷在这一领域展开激烈竞争。本期腾讯研究院AI速递将为您深入解析近期在生成式AI领域的一系列重大进展，包括GPT-4.5的现身、DeepMind的独特创新、以及OpenAI品牌重塑的背后动因。

IT之家6 天

新王诞生：DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史

IT之家2 月 7 日消息，DeepSeek 旗下两大开源项目刚刚在 GitHub 平台实现历史性突破。截至IT之家发稿，DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper（7.58 万）；同门兄弟 DeepSeek-R1 以 6.64 万 Star 数超越 OpenAI 官方教程库 openai-cookbook（6.16 万）。这是 ...

51CTO6 天

在个人电脑上运行Llama 3 70B大规模模型指南精华

随着人工智能和机器学习技术的迅猛发展，像Llama 3 70B这样的庞大语言模型已经成为了研究、开发和应用中的重要工具。这篇文章将详细介绍如何在个人电脑上运行Llama 3 70B大模型，并涵盖硬件要求、软件环境配置、安装步骤、运行示例和常见问题的解决方案。

新浪网2 天

开源22万条DeepSeek R1的高质量数据！你也能复现DeepSeek了

自动过滤：Open R1 团队通过数学验证，只保留至少有一个正确答案的问题，还让 Llama3.3-70B-Instruct ... 这类似于 Meta 的 Coconut。这些方法的优势在于 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果