DeepSeek是国产算力企业在春节看到的最大烟花。
DeepSeek震荡科技圈,国产算力搭配国产大模型的机会出现。沐曦CTO杨建认为,今年年底部分大模型的预训练可能会转入非英伟达的卡,明年这种趋势会更加明显。“中国市场会慢慢演变,届时英伟达会是一部分算力底座,其他国产芯片是另一部分算力底座。全球算力供 ...
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1) ...
在美国方面对deepseek不断质疑之时,美国 芯片 巨头Intel表态支持deepseek,指出它开发的AI芯片/GPU芯片可以支持deepseek,这意味着Intel有意与中国芯片合作打破AI芯片龙头NVIDIA打造的生态垄断,这对中国芯片来说无疑相当有利。
从英伟达北京答谢会的影像资料中,可以看出,这不是一场严肃的交流会,而是一场轻松的“好友线下见面会”。比如开头的照片里,黄仁勋密切地与机器人公司创始人合影同框,照片中的嘉宾穿着十分休闲。
2月4日,国产全功能GPU创新企业摩尔线程宣布,实现了对 DeepSeek 蒸馏模型推理服务的部署。通过DeepSeek提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产GPU上实现高性能推理。
这风向,怎么一下子就变了,回答区真有多少是搞编程的? 越底层的模拟跟适配,性能越强,我以为这是大家都知道的真理。 我举个例子看大家能不能懂: Java 号称的跨平台,是构建了一个Java虚拟机,这个虚拟机本身作为一个平台。相对与计算机体系来说,这算是一个比较上层的指令。由于所有代码都基于 Java 虚拟机这个平台,它可以做到二进制跨平台。 而 C/C++ ...
快科技2月5日消息,华为(昇腾+CANN)+Deepseek,能解决英伟达GPU+CUDA的“卡脖子”吗? 据tomshardware等多家媒体报道,华为最新的AI处理器昇腾910C(Ascend 910C)的推理性能已达NVIDIA H100 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果