cuda - 搜索 News

英伟达 ...

15 小时

而PTX在接近汇编语言的层级运行，允许进行细粒度的优化，如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护，所以行业通用的做法是使用CUDA这样的高级编程语言。

英伟达显卡的CUDA内核的英文为“Compute Unified Device Architecture”，简而言之，它是由英伟达开发的一种并行计算平台和编程模型，允许开发者利用NVIDIA ...

来自MSN17 小时

这个内容已经在X上讨论过了，很火热的问题我先翻译一下国外教授的详细回答，再讲清楚CUDA、PTX的关系。中文翻译：人们说“Deepseek 使用了 PTX，它打破了 CUDA 的护城河！”从根本上误解了这里发生的事情，以及 CUDA ...

15 小时

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优 ...

5 天

也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA（Compute Unified Device ...

5 天

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 ...

3 天

DeepSeek真的绕过了CUDA，那这件事意味着什么？对此，北京航空航天大学黄雷副教授接受采访时表示，绕过CUDA，可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度的操作。譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...

5 天

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3 的硬件效率之所以能比 Meta 等高出 10 倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的 H800 GPU 训练 ...

3 天

10 小时on MSN

DeepSeek公司近期在AI技术领域的动态引起了广泛关注。据Tom’s Hardware等外媒报道，该公司正在紧锣密鼓地开发一款大语言模型，而令人瞩目的是，该项目已经成功绕过了英伟达广受欢迎的CUDA框架。

尽管春节假期已经过半，但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。韩国 Mirae Asset Securities Research 的一名分析师在 X ...

一些您可能无法访问的结果已被隐去。