Model Distillation - 搜索 News

21 小时

DeepSeek成为现象级AI应用，也引发了对算力信仰的质疑。全球算力巨头英伟达股价1月27日一度下跌近17%，之后逐步企稳。对此，英伟达此前发表声明，表示DeepSeek所取得的进展显示出其芯片在中国市场的实用价值，且未来为满足DeepSeek的服 ...

腾讯网7 天

OpenAI指控DeepSeek“违规蒸馏” AI竞赛进入“规则制高点”争夺时代 ...

模型蒸馏是一种通过训练小型模型模仿大型模型行为的技术，广泛应用于提高AI效率与降低成本。然而， OpenAI 在声明中称，DeepSeek“通过技术手段不当获取了其模型的内部知识”，但拒绝透露具体技术细节或法律依据。

1 天

DeepSeek吹响“集结号” 国产AI生态伙伴火速适配

DeepSeek由幻方量化旗下的AI公司深度求索研发，是一款集成了先进机器学习和深度学习技术的开源大模型。其最新发布的DeepSeekV3和DeepSeek-R1模型，展现出卓越的性能与低廉的训练成本。在竞争激烈的市场中，DeepSeek通过提供高效 ...

16 小时

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey ...

2 天

【人工智能AI瞭望台】DeepSeek吹响生态开放“集结号” 国产AI生态伙伴 ...

国产开源大模型DeepSeek凭借出色性价比，成为全球增速最快的AI应用，引发全球科技圈热切讨论和算力信仰震荡，也进一步增强对构建开放型人工智能生态的信心。目前，不仅英伟达、AMD、英特尔等国际芯片巨头宣布集成DeepSeek模型、提供算力支持等，国产GPU厂商、云计算厂商和应用厂商等AI产业链伙伴也火速支持调用DeepSeek，升级各自产品和技术。

国际电子商情2 天

AI基建需求续成长，DeepSeek崛起凸显产业将更注重高成本效益

AI 行业过去依赖扩大模型、增加数据和提升硬件效能来发展，但成本与效率成为挑战。DeepSeek 采用蒸馏模型（Model Distillation）技术，压缩大型模型以提升推理速度并降低硬件需求，同时充分发挥 NVIDIA Hopper 降规版芯片的效益，最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及 API 开源策略，不仅优化技术与商业应用的平衡，也展现 AI ...

7 天

AI“盗火者”DeepSeek，正立于风雪

360 创始人周鸿祎则针尖对麦芒地宣布，将无偿为 DeepSeek 提供全方位网络安全防护，并同步在旗下纳米 AI 搜索开通 “DeepSeek 高速专线 ” ，启用最高规格的 R1 高速专线和专属防攻击机房。

8 天

集邦咨询：AI基建需求续成长，DeepSeek崛起凸显产业将更注重高成本效益

TrendForce集邦咨询表示，全球AI Server市场自2023年起快速成长，预期2025年占整体Server出货比例将逾15%，至2028年有望接近20%。近年大型CSP业者顺应AI训练需求积极扩建，自2025年起将重心扩展至边缘AI推理，除了采用NVIDIA ...

2 天

独家对话OpenAI原应用负责人卡斯： DeepSeek加速AI平价化

带着上述问题，在春节期间，第一财经记者独家专访OpenAI原全球市场应用负责人、人工智能与商业战略专家卡斯（Zack Kass）。他表示，DeepSeek是一个巨大的成功，令人兴奋。根据杰文斯悖论（Jevons ...

美国之音9 天

DeepSeek 震撼硅谷和华尔街，但内容审查恐令其在国际市场遇挑战

中国科技初创公司DeepSeek发布的人工智能新模型震撼了美国的硅谷和华尔街。专家告诉美国之音，DeepSeek之所以可以用较低端的硬件和成本打造出一流的产品，其秘诀之一是模型蒸馏(Model ...

8 天

研报|AI基建需求续成长，DeepSeek崛起凸显产业将更注重高成本效益

根据TrendForce集邦咨询最新研究，DeepSeek近期连续发布DeepSeek-V3、DeepSeek-R1等AI模型，将促使终端客户未来更审慎评估投入AI基础设施的合理性，采用更具效率的软件运算模型，以降低对GPU等硬件的依赖。CSP则可能扩大采用自家ASIC基础设施，以降低建置成本。因此，2025年以后产业对GPU AI芯片或半导体实际需求可能出现变化。 TrendForce集邦咨询表 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果