搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
3 小时
“DeepSeek甚至绕过了CUDA”,工程师灵魂提问:英伟达护城河还在吗?
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的H800 ...
5 小时
“DeepSeek 甚至绕过了英伟达 CUDA”,论文细节再引热议
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 ...
腾讯网
17 小时
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问 ...
来源:量子位(ID: QbitAI)作者梦晨 西风英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力?硬件媒体Tom‘s ...
2 天
DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了
【新智元导读】DeepSeek模型开发竟绕过了CUDA?最新爆料称,DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示,CUDA护城河不存在了?
1 天
DeepSeek首创:打破CUDA垄断的PTX优化技术
这一颠覆性方法的关键在于,DeepSeek利用PTX进行细粒度优化,使得GPU性能发挥到极致。PTX作为接近底层的中间指令集,能够让开发者进行更加深层的控制,例如寄存器分配和线程级别优化,这些是标准CUDA编程所无法实现的。在训练V3语言模型时,De ...
2 天
DeepSeek 团队神操作:用“汇编”取代CUDA 让性能狂飙!
在人工智能领域, DeepSeek 引发了巨大轰动。它借助由 2048 块英伟达 H800 GPU 组成的集群,仅用约两个月时间就完成了拥有 6710 亿参数的混合专家(MoE)语言模型训练,效率比 Meta 等人工智能行业领军企业高出 10 倍。据 ...
1 天
DeepSeek甚至绕过了CUDA!英伟达护城河还在吗DeepSeek甚至绕过了CUDA ...
硬件媒体Tom‘s Hardware带来开年最新热议: 来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。
1 天
美国对 DeepSeek 开展国家安全调查;传 DS 训练模型绕过英伟达 CUDA ...
同时,美国新任白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)在首次简报会中也提及了中国人工智能初创公司深度求索(DeepSeek)。她表示,白宫正在努力确保美国人工智能的主导地位,美国国家安全委员会正在调查 DeepSeek ...
腾讯网
3 天
Nvidia 宣布终止对老旧架构的 CUDA 支持
Nvidia 在本月发布的最新 CUDA 运行时版本中,将多个老旧架构标记为功能完整,这意味着这些显卡系列即将迎来支持的终点。 "Maxwell、Pascal 和 Volta ...
5 天
on MSN
英伟达将冻结 Maxwell、Pascal、Volta 三代 GPU 架构 CUDA 支持
IT之家 1 月 26 日消息,英伟达本月公布的 CUDA 12.8 发行说明提及,对此前 Maxwell、Pascal、Volta 三代 GPU 的架构支持被认为已达到“功能完善”状态,将在即将发布的版本中冻结。 英伟达在 2014 年发布了 ...
1 天
on MSN
英伟达RTX5070/Ti规格曝光!性能翻倍 显存大升级
英伟达近日正式公布了Blackwell架构GeForce RTX 5070 Ti和RTX 5070显卡的完整规格。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈