这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
据外媒Tom’sHardware报道,DeepSeek公司正在开发的大语言模型已经绕过了英伟达的CUDA框架,此举被视为为未来兼容国产GPU芯片所做的准备。DeepSeek在研发进程中采用了PTX(ParallelThreadExecution)语言 ...
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。
DeepSeek公司近期在AI技术领域的动态引起了广泛关注。据Tom’s Hardware等外媒报道,该公司正在紧锣密鼓地开发一款大语言模型,而令人瞩目的是,该项目已经成功绕过了英伟达广受欢迎的CUDA框架。
DeepSeek做了PTX级别的优化不意味着完全脱离了CUDA生态,但确实代表他们有优化其他GPU的能力。来自Mirae Asset Securities ...
近日,英伟达正式公布了其最新的Blackwell GPU架构白皮书,揭示了GeForce RTX ...
也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA(Compute Unified Device ...
近期,有消息称DeepSeek在大模型研发领域取得了突破性进展,正着手适配国产GPU,这一消息在业界引起了广泛关注。据悉,DeepSeek在研发过程中成功绕过了英伟达CUDA的限制,直接基于GPU驱动函数进行新开发,这一创新举措为更加精细化的操作提供 ...
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
英伟达显卡的CUDA内核的英文为“Compute Unified Device Architecture”,简而言之,它是由英伟达开发的一种并行计算平台和编程模型,允许开发者利用NVIDIA ...
尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。 韩国 Mirae Asset Securities Research 的一名分析师在 X ...