这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。
大陆AI新创公司DeepSeek(深度求索)开发的AI大模型,绕过了美国巨头辉达的CUDA(统一运算架构),这为未来DeepSeek与大陆国产GPU晶片的相容性做好准备。据快科技、Tom's Hardware报导,辉达开发的CUDA能大幅降低研 ...
近年来,人工智能技术发展迅猛,尤其在大语言模型(Large Language Models, LLMs)领域,各大公司纷纷角逐。近日,外媒Tom’s Hardware报道,DeepSeek公司在其最新研发的大语言模型中,成功绕过了英伟达的CUDA框架 ...
来源:量子位(ID: QbitAI)作者梦晨 西风英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力?硬件媒体Tom‘s ...
在人工智能日益渗透各个行业的今天,如何高效利用计算资源,成为了众多科技公司亟待解决的问题。在这种背景下,DeepSeek近期发布的两个模型——DeepSeek-V3和DeepSeek-R1,凭借其惊人的效率和创新技术,成为了业内的热门话题。和继续依赖 ...
对于长期苦于CUDA生态限制的AMD以及国内的GPU公司来说,这无疑是一个绝佳的机会。事实上,在此前DeepSeek本地部署的文档中,已经明确支持华为昇腾芯片。可以预见的是,华为等国内GPU公司针对DeepSeek训练的硬件升级已经在紧锣密鼓地攻克中 ...
这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元。业界认为这是受到中国AI大模型DeepSeek人工智能模型冲击,导致美国芯片股集体下跌,英伟达受到最严重冲击。DeepSeek-R1API服务定价为每百万输入tokens1元/4元 ...
当然,RTX50系显卡的性能提升并不能简单通过原始性能提升来做定论,毕竟DLSS4的多帧生成技术加持,能够为RTX5070带来非常显著的游戏帧数提升。不过相比当初英伟达发布会上提到的,RTX5070游戏性能等于RTX4090,只能说DLSS4所带来的帧数提升实在是太大了。
DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。 譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 ...
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。 韩国 Mirae Asset Securities Research 的一名分析师在 X ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果