cuda - 搜索 News

1 小时

原标题：“DeepSeek甚至绕过了CUDA”，论文细节再引热议，工程师灵魂提问：英伟达护城河还在吗？英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来，又面临新的压力？硬件媒体Tom‘s Hardware带来开年最新热议： ...

2 小时

DeepSeek如何绕过CUDA引发业界震动：从新一代AI模型看编程未来

在人工智能领域，创新技术层出不穷，近年来DeepSeek的研究成果引起了广泛关注。最近发布的DeepSeek-V3论文更是以其独特的技术架构，再次引发了学术界和工业界的热议。因其声称能够绕过传统的英伟达CUDA，使用更底层的编程语言进行优化，Deep ...

2 小时

DeepSeek突破CUDA瓶颈：全新编程方式引发行业震动，或成AI发展的新引擎

来自韩国未来资产证券的分析指出，DeepSeek-V3在硬件效率上的显著提升，主要得益于其对GPU架构的大胆重建。具体来说，DeepSeek在英伟达H800 ...

2 小时

“DeepSeek 甚至绕过了英伟达 CUDA”，论文细节再引热议

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3 的硬件效率之所以能比 Meta 等高出 10 倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时，他们针对自己的需求把 132 个流式多处理器（SMs）中的 20 个修改成负责服务器间的通信，而不是计算任务。

腾讯网2 小时

“DeepSeek甚至绕过了CUDA”，论文细节再引热议，工程师灵魂提问 ...

来自 Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的 20个修改成负责服务器间的通信，而不是计算任务。

2 小时

DeepSeek 团队神操作：用“汇编”取代CUDA 让性能狂飙！

在人工智能领域， DeepSeek 引发了巨大轰动。它借助由 2048 块英伟达 H800 GPU 组成的集群，仅用约两个月时间就完成了拥有 6710 亿参数的混合专家（MoE）语言模型训练，效率比 Meta 等人工智能行业领军企业高出 10 倍。据 ...

15 小时

需求量巨大！NVIDIA：RTX 5090/5080预计会缺货

RTX 5090搭载GB202 GPU，内建21,760个CUDA核心，是第一款超过20,000个内核的 GeForce GPU。搭配512bit位宽的32GB GDDR7显存，TDP功耗575W。3个DP 2.1a接口，1个HDMI 2.1接口。

星島網19 小时

DeepSeek未能击溃护城河 Nvidia被忽略的本质｜晋佳

长线而言，假如AI晶片概念，一定要输剩1只、只得1只能够再破顶，就非Nvidia莫属。AI训练嘅发展仲需要几多年？假如最差情况、合理路线逐步迈向订阅制公司，反而会拉高PE？目前Nvidia今年预测PE 27倍。

3 天on MSN

NVIDIA CUDA 12.8后，Maxwell、Pascal、Volta架构将止步不前？

NVIDIA近日在CUDA 12.8开发包的更新日志中，针对Maxwell、Pascal及Volta这三款较旧的GPU架构，做出了明确的未来规划。公司宣布，这些架构已完成了全部功能特性的集成，意味着在后续的CUDA版本中，它们将进入“功能冻结”状态。

3 天on MSN

GTX 9/10系列要走了！NVIDIA CUDA不再更新三大老架构

快科技1月25日消息，NVIDIA在最新的CUDA 12.8开发包更细日志中明确表示，针对Maxwell、Pascal、Volta三大老架构的支持，已经完成了所有功能特性，未来的新版本中奖处于“冻结”状态。

IT之家22 天

外星人 Area 51 旗舰游戏本再临：搭载英特尔酷睿 Ultra 9 275HX 处理器

IT之家对比其它英伟达显卡的 Geekbench OpenCL 测试结果发现，此处的 "Compute Units" 对应英伟达的 SM 单元。结合英伟达现行 GPU 层次架构，这张显卡应配备 7680 个 CUDA 核心。英伟达 GeForce RTX 4090 Laptop 和 RTX 4080 Laptop GPU 分别拥有 9728 和 7424 个 CUDA；结合此前有关英伟达 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果