随着 AI 工作负载和加速应用程序在复杂性和精密度上不断提升,企业和开发者需要更好的工具来评估其基础设施是否能够更高效地处理训练和推理的需求。为此,Nvidia 开发了一套名为 DGX Cloud 基准测试方案的性能测试工具,旨在帮助组织评估其硬件和云基础设施在运行当今最先进 AI 模型时的表现。我们 HotTech 团队最近有机会试用了其中的一些方案,发现它们能够捕获到极具洞察力的数据。
随着NVIDIA平台持续探索Blackwell Ultra GPU和Blackwell GPU架构的极限潜力,这些推理性能的天花板会不断被捅破。 图1. 在NVL8配置下运行TensorRT-LLM软件的NVIDIA B200 ...
如果说Blackwell Ultra是战术性过渡,那么2026年的Rubin GPU则是英伟达的战略重拳。以天文学家Vera Rubin命名的这款GPU,推理速度将达50 petaflops(比Blackwell的20 petaflops高出一倍多),配备288 GB HBM4内存。
导语:GTC2025,英伟达带来Blackwell Ultra、Rubin等全新发布。 雷峰网(公众号:雷峰网)消息,北京时间3月19日凌晨,英伟达公司创始人兼CEO黄仁勋在GTC会议上发表主题演讲。
因此,从DeepSeek R1引申出来的“蒸馏模型节省训练算力”已经被“推理模型消耗算力”抵消,这给了英伟达全新的机遇,可以说DeepSeek的出现为英伟达关上了一扇门,又打开了一扇窗。
在科技界的聚光灯下,英伟达CEO黄仁勋于GTC 2025大会上再度成为焦点。尽管近期英伟达股价遭遇重创,触及十年低点,但黄仁勋依旧以一身标志性的皮衣亮相,信心满满地展示着公司的最新GPU技术。
刚刚,黄仁勋再次发布了全新一代核弹级 AI 芯片,不过这场发布会的还有个隐藏主角——DeepSeek。 由于智能体 AI(Agentic AI)和推理能力的提升,现在所需的计算量至少是去年此时预估的 100 倍。 推理成本效率给 AI ...
小黑盒数码硬件 on MSN1 天
英伟达 Blackwell 创下 世界纪录
【本文由小黑盒作者@Player12736298于03月20日发布,未经许可不得转载!】 在2025年3月19日举办的NVIDIA GTC 2025大会上,英伟达(NVIDIA)宣布,其搭载Blackwell ...
今年的GTC 英伟达一次性推出了Quantum-X硅光共封芯片、Spectrum-X硅光共封芯片以及衍生出来的三款交换机产品:Quantum 3450-LD、Spectrum SN6810和Spectrum SN6800。
行业观察人士注意到,这场技术盛会释放出明确信号:随着AI应用场景向自动驾驶、工业数字孪生等领域拓展,全球算力军备竞赛正进入新阶段。英伟达同时宣布,采用Blackwell架构的GB200 Grace ...
黄仁勋表示,借助DGX Station和DGX Spark,用户可以在本地运行大模型。 英伟达GTC大会已经成了AI界超级碗,没有剧本也没有提词器,中途黄仁勋被线缆卡住,反而是这场高浓度AI发布会里最有人味的片段,在当今基本提前彩排或录播的科技发布会里已经很稀缺了。 刚刚,黄仁勋再次发布了全新一代核弹级AI芯片,不过这场发布会的还有个隐藏主角——DeepSeek。 由于智能体AI(Agentic ...
不过,投资者对此反应平淡,主题演讲结束后,英伟达的股价略有波动,股价下跌3.5%。英伟达生态内的概念股,如台积电、中电港、胜宏科技、鸿博股份君则有小幅下降。其中,英伟达国内算力板第一供应商胜宏科技,股价下跌5.75%。