qwen - 搜索 News

来自MSN1 天

斯坦福的S1和伯克利的TinyZero是研究人员越来越多地使用阿里巴巴技术降低AI训练成本的两个例子。随着美国计算机科学家（包括著名的华裔“AI教母”李飞飞）利用阿里巴巴的开源Qwen2.5模型，以不到50美元的成本训练出一种新的推理模型，在中国De ...

5 天

Qwen模型：AI开源新潮流的幕后英雄

最近，AI领域掀起了一股新技术热潮，李飞飞团队提出的Qwen模型受到了广泛的关注。Qwen模型作为AI大模型领域的重要一员，其背后体现了多个技术创新和重新设计。以阿里云的通义千问Qwen2.5-32B-Instruct开源模型为基础，Qwen借助16 ...

2 天

阿里通义千问(Qwen)引领全球开源大模型时代：Huggingface最新榜单出炉

近年来，人工智能（AI）技术飞速发展，开源大模型已经成为这一领域中的重要力量。近日，全球最大的人工智能开源社区Huggingface发布了最新的开源大模型榜单（OpenLLMLeaderboard），这一榜单揭示了AI行业的一项显著趋势：排名前十的开源大模型均为基于阿里通义千问（Qwen）开源模型经过二次训练的衍生模型。这不仅足以体现Qwen在技术和应用上的深远影响力，也标志着中国在全球AI领域的 ...

华尔街见闻 on MSN5 天

50美元复现DeepSeek R1，李飞飞团队为何也选了阿里Qwen

通过持续开源领先模型，阿里云不仅繁荣了AI开发生态，更吸引越来越多的开发者和企业加入其云计算平台，形成了从技术创新到商业良性循环的完整闭环。

腾讯网6 天

Google三大模型齐发，均进Lmarena前十，实测对比Deepseek、Qwen推理能力大增

作者｜子川来源｜AI先锋官疯狂，Google连发三款模型！面对Deepseek的爆火出圈，OpenAI忍不住上线全新模型o3-mini，这不，Google也开始按耐不住了，就在今天，三款模型齐上线——Google目前最强大的模型：Gemini 2.0 ...

腾讯网5 天

50美元蒸馏成本，李飞飞团队用阿里云Qwen模型复刻DeepSeek的R1

众人拾柴火焰高，开源大模型再度发力。今日有报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与 OpenAI ...

美国之音13 天

阿里巴巴发布AI模型声称超越DeepSeek

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常，正值农历新年第一天，大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...

5 天

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

5 小时

DeepSeek并非完美，训练过程存在“深度诅咒”

“深度诅咒”现象的根源在于Pre-LN的特性。Pre-LN是一种在Transformer架构模型中广泛使用的归一化技术，它在每一层的输入上进行归一化，而不是在输出上。这种归一化方式虽然能够稳定模型的训练过程，但也带来了一个严重的问题，随着模型深度的增加，Pre-LN的输出方差会呈指数级增长。

11 天

阿里云百炼Qwen-Max系列模型价格大幅下调，智能设备行业将迎来新机遇

在日前的动态中，阿里云宣布对其百炼Qwen-Max系列模型进行价格调整，进一步引发行业关注。此次降价涉及Qwen-Max、Qwen-Max-2025-01-25以及Qwen-Max-Latest等三个模型的输入输出报价，同时Qwen-MaxBatch和Cache也同步降价。这一举措被许多业内人士视为阿里云在智能设备和AI领域中进一步深化竞争的策略，可能将重塑市场格局。

来自MSN8 小时

阿里巴巴涨超7%！李飞飞团队推出低成本模型s1，基座为阿里通义千问 ...

2月12日早盘，港股三大指数集体高开，恒生指数涨1.09%，报21526.41点，恒生科指涨1.4%，国企指数涨1.16%。开盘后，恒生科技指数涨幅持续扩大，一度涨超2%。主流ETF方面，恒生科技指数ETF（513180）跟随指数强势上扬，持仓股中， ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果