搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按时间排序
按相关度排序
35 分钟
DeepSeek团队神操作:用“汇编”取代CUDA让性能狂飙!
在人工智能领域,DeepSeek 引发了巨大轰动。它借助由 2048 块英伟达 H800 GPU 组成的集群,仅用约两个月时间就完成了拥有 6710 亿参数的混合专家(MoE)语言模型训练,效率比 Meta 等人工智能行业领军企业高出 10 倍。据 ...
1 小时
“DeepSeek甚至绕过了CUDA”,论文细节再引热议
原标题:“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗? 英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力? 硬件媒体Tom‘s Hardware带来开年最新热议: ...
1 小时
DeepSeek如何绕过CUDA引发业界震动:从新一代AI模型看编程未来
在人工智能领域,创新技术层出不穷,近年来DeepSeek的研究成果引起了广泛关注。最近发布的DeepSeek-V3论文更是以其独特的技术架构,再次引发了学术界和工业界的热议。因其声称能够绕过传统的英伟达CUDA,使用更底层的编程语言进行优化,Deep ...
1 小时
DeepSeek突破CUDA瓶颈:全新编程方式引发行业震动,或成AI发展的新引擎
来自韩国未来资产证券的分析指出,DeepSeek-V3在硬件效率上的显著提升,主要得益于其对GPU架构的大胆重建。具体来说,DeepSeek在英伟达H800 ...
1 小时
“DeepSeek 甚至绕过了英伟达 CUDA”,论文细节再引热议
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对自己的需求把 132 个流式多处理器(SMs)中的 20 个修改成负责服务器间的通信,而不是计算任务 。
腾讯网
1 小时
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问 ...
来自 Mirae Asset Securities Research(韩国未来资产证券) 的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器 (SMs) 中的 20个修改成负责服务器间的通信,而不是计算任务 。
15 小时
需求量巨大!NVIDIA:RTX 5090/5080预计会缺货
RTX 5090搭载GB202 GPU,内建21,760个CUDA核心,是第一款超过20,000个内核的 GeForce GPU。搭配512bit位宽的32GB GDDR7显存,TDP功耗575W。3个DP 2.1a接口,1个HDMI 2.1接口。
星島網
19 小时
DeepSeek未能击溃护城河 Nvidia被忽略的本质|晋佳
长线而言,假如AI晶片概念,一定要输剩1只、只得1只能够再破顶,就非Nvidia莫属。AI训练嘅发展仲需要几多年?假如最差情况、合理路线逐步迈向订阅制公司,反而会拉高PE?目前Nvidia今年预测PE 27倍。
3 天
on MSN
英伟达将冻结 Maxwell、Pascal、Volta 三代 GPU 架构 CUDA 支持
IT之家 1 月 26 日消息,英伟达本月公布的 CUDA 12.8 发行说明提及,对此前 Maxwell、Pascal、Volta 三代 GPU 的架构支持被认为已达到“功能完善”状态,将在即将发布的版本中冻结。 英伟达在 2014 年发布了 ...
3 天
on MSN
NVIDIA CUDA 12.8后,Maxwell、Pascal、Volta架构将止步不前?
NVIDIA近日在CUDA 12.8开发包的更新日志中,针对Maxwell、Pascal及Volta这三款较旧的GPU架构,做出了明确的未来规划。公司宣布,这些架构已完成了全部功能特性的集成,意味着在后续的CUDA版本中,它们将进入“功能冻结”状态。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈