国产开源大模型DeepSeek凭借出色性价比,成为全球增速最快的AI应用,引发全球科技圈热切讨论和算力信仰震荡,也进一步增强对构建开放型人工智能生态的信心。目前,不仅英伟达、AMD、英特尔等国际芯片巨头宣布集成DeepSeek模型、提供算力支持等,国产GPU厂商、云计算厂商和应用厂商等AI产业链伙伴也火速支持调用DeepSeek,升级各自产品和技术。 引发算力巨震 作为幻方量化旗下的AI公司深度求 ...
据报道,深圳北理莫斯科大学团队基于NVIDIACUDA编程技术,创建了新的PD-General框架,优化了算法设计和内存管理,充分利用了GPU的大规模并行计算能力。在一块普通的RTX4070显卡上,新的算法比传统串行算法速度提升了 ...
DeepSeek公司近期在AI技术领域的动态引起了广泛关注。据Tom’s Hardware等外媒报道,该公司正在紧锣密鼓地开发一款大语言模型,而令人瞩目的是,该项目已经成功绕过了英伟达广受欢迎的CUDA框架。
根据DeepSeek 研究人员的测试数据显示,在执行基于DeepSeek模型的推理任务中,昇腾910C性能可达到英伟达H100的60%。
这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...