这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。
也就是说 DeepSeek 在研发大模型时绕过了 CUDA。 CUDA(Compute Unified Device ...
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的H800 ...
来源:量子位(ID: QbitAI)作者梦晨 西风英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力?硬件媒体Tom‘s ...
随着 DeepSeek 的大火,也让人们对于英伟达 GPU 及其配套的统一计算设备架构 CUDA(Compute Unified Device Architecture)有了更多了解。而在近日,深圳北理莫斯科大学杨杨副教授和合作者,围绕英伟达 GPU ...
2月5日消息,DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。众所周知,英伟达的CUDA(Compute Unified ...
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力 ...
这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
这一技术选择被业内视为DeepSeek为未来兼容国产GPU芯片所做的前瞻布局。为了实现这一目标,DeepSeek在研发过程中采用了PTX(Parallel Thread ...
尽管春节假期已经过半,但“来自东方的神秘力量的 DeepSeek”仍在全球范围内引起热议。各路业内人士从不同角度分析 DeepSeek 的模型和技术。 韩国 Mirae Asset Securities Research 的一名分析师在 X ...
DeepSeek要适配国产GPU了?这确实是大好事一件。据报道,DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这意味着可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。例如DeepSeek在多节点通信时绕过了 ...
一位亚马逊工程师提出灵魂质问:CUDA是否还是护城河?这种顶尖实验室可以有效利用任何GPU。 首先要明确的是,PTX仍然是英伟达GPU架构中的技术 ...