7d
Hosted on MSNDeepSeek's AI breakthrough bypasses Nvidia's industry-standard CUDA, uses assembly-like PTX programming insteadD eepSeek made quite a splash in the AI industry by training its Mixture-of-Experts (MoE) language model with 671 billion ...
19h
Hosted on MSNDeepSeek 绕开 CUDA 垄断,针对英伟达 PTX 进行优化实现最大性能,英伟达护城河还在吗?这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA 实际上是什么。 CUDA 是一种高级语言。它使代码库和与 NVIDIA GPU ...
这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。 假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
Hosted on MSN9d
Nvidia deprecates CUDA support for aging architecturesMaxwell, Pascal and Volta, oh my! But fear not, driver support is still safe The end of the road is nearing for a range of ...
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 ...
据外媒Tom’s Hardware报道,DeepSeek公司正在开发的大语言模型已经绕过了英伟达的CUDA框架,此举被视为为未来兼容国产GPU芯片所做的准备。DeepSeek在研发进程中采用了PTX(Parallel ...
也就是说 DeepSeek 在研发大模型时绕过了 CUDA。 CUDA(Compute Unified Device ...
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说,这无疑是一个绝佳的机会。事实上,在此前DeepSeek本地部署的文档中,已经明确支持华为昇腾芯片。可以预见的是,华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...
12hon MSN
DeepSeek公司近期在AI技术领域的动态引起了广泛关注。据Tom’s Hardware等外媒报道,该公司正在紧锣密鼓地开发一款大语言模型,而令人瞩目的是,该项目已经成功绕过了英伟达广受欢迎的CUDA框架。
尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。 韩国 Mirae Asset Securities Research 的一名分析师在 X ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results