GPU Cuda - 搜索 News

15 小时

从英伟达北京答谢会的影像资料中，可以看出，这不是一场严肃的交流会，而是一场轻松的“好友线下见面会”。比如开头的照片里，黄仁勋密切地与机器人公司创始人合影同框，照片中的嘉宾穿着十分休闲。

9 小时

DeepSeek震荡科技圈，国产算力搭配国产大模型的机会出现。沐曦CTO杨建认为，今年年底部分大模型的预训练可能会转入非英伟达的卡，明年这种趋势会更加明显。“中国市场会慢慢演变，届时英伟达会是一部分算力底座，其他国产芯片是另一部分算力底座。全球算力供 ...

在美国方面对deepseek不断质疑之时，美国芯片巨头Intel表态支持deepseek，指出它开发的AI芯片/GPU芯片可以支持deepseek，这意味着Intel有意与中国芯片合作打破AI芯片龙头NVIDIA打造的生态垄断，这对中国芯片来说无疑相当有利。

2 小时

其中，DeepSeek-V3中宣称的550万美元，是基于GPU成本、GPU小时数、数据集规模和模型规模等估算出来的。但DeepSeek团队从没公开过R1确切的GPU小时数或开发成本，目前已有的任何成本估算都只是猜测。

2 小时

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

12 小时

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1） ...

9 小时

DeepSeek是国产算力企业在春节看到的最大烟花。

什么值得买 on MSN1 小时

篇首语——AMD AI300 系列产品线简介在过去几年的时间，AMD 的移动端产品线一直采用新款+老款改名的方式铺开，每年更新一代新产品，同时将去年 ...

今日消息，吉利已率先宣布DeepSeek上车，主要集中在人车交互层面。后续则可能实现对用户需求的分析已经车端更强智能化的部署，对其原有的交互模型进行全面升级，将原有智能化的特定场景扩展到全车。

天翼云、联通云、移动云三大运营商云均已采用昇腾算力底座来支持DeepSeek模型。神州数码也特别提到其神州鲲泰推理服务器产品搭载昇腾硬件，可全面支持DeepSeek模型的快速部署。

什么值得买 on MSN13 小时

本以为Deepseek只会火几天就冷了，但不曾想，火了这么久后还是依然很火。并且这把火是越烧越旺了，全球AI界都被震慑到了。

13 小时on MSN

在这场AI领域的风暴中，英伟达意外地成为了首个受到冲击的巨头。Deepseek以实际行动证明，AI大模型并非必须依赖海量的芯片堆砌，芯片不再是决定性的唯一因素。这一发现，无疑在一定程度上戳破了AI芯片市场的泡沫。

一些您可能无法访问的结果已被隐去。