DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
据外媒Tom’s Hardware报道,DeepSeek公司正在开发的大语言模型已经绕过了英伟达的CUDA框架,此举被视为为未来兼容国产GPU芯片所做的准备。DeepSeek在研发进程中采用了PTX(Parallel ...
DeepSeek公司近期在AI技术领域的动态引起了广泛关注。据Tom’s Hardware等外媒报道,该公司正在紧锣密鼓地开发一款大语言模型,而令人瞩目的是,该项目已经成功绕过了英伟达广受欢迎的CUDA框架。
这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。 假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
根据DeepSeek 研究人员的测试数据显示,在执行基于DeepSeek模型的推理任务中,昇腾910C性能可达到英伟达H100的60%。
快科技2月5日消息,华为(昇腾+CANN)+Deepseek,能解决英伟达GPU+CUDA的“卡脖子”吗?据tomshardware等多家媒体报道,华为最新的AI处理器昇腾910C(Ascend 910C)的推理性能已达N ...
谷歌母公司Alphabet公布的最新财报显示,Alphabet第四季度营收低于华尔街预期,且该公司还宣布将在2025年继续加大对人工智能基础设施的投资,市场对其后续盈利前景担忧再起。 美国芯片巨头AMD公布第四财季财报显示,营收同比增长69%,至38.6亿美元,但低于分析师预估的40.9亿美元。AMD预计当前季度总营收在68亿至74亿美元,分析师的平均预估为70.4亿美元。
DeepSeek与《哪吒》的成功案例共同揭示了一个深刻的道理:在信息爆炸的时代背景下,只有深耕核心价值、构建系统性优势的“难事”才能形成不可替代性。它们用实际行动证明了优秀终将被看见,也将得到应有的回报。更重要的是,这两个团队都怀揣着推动行业发展、让 ...
据报道,深圳北理莫斯科大学团队基于NVIDIACUDA编程技术,创建了新的PD-General框架,优化了算法设计和内存管理,充分利用了GPU的大规模并行计算能力。在一块普通的RTX4070显卡上,新的算法比传统串行算法速度提升了 ...
难而正确 ...
2月5日开工第一天,业界传来大消息, 百度智能云成功点亮自研昆仑芯三代万卡集群 , 这也是国内首个正式点亮的自研万卡集群 。除了解决自身算力供应问题之外,有望进一步降低大模型成本。