总结来看,AI的创造力评估已迎来新的变革,LoTbench作为测评工具,将推动更高效、更客观的AI创作能力提升。尽管DeepSeek和Qwen系列在创造力上存在差异,但它们都在不断地解锁AI的潜力,让我们期待未来更多的创新与突破。AI技术的进步不仅是 ...
近日,一项关于大语言模型创造力的研究引发了广泛关注。据机器之心报道,来自中大、哈佛、鹏城、新加坡管理大学的研究者提出了一种全新的评估范式LoTbench,用于衡量多模态大语言模型的创造力。研究结果显示,Qwen系列模型的创造力已接近人类顶尖水平,而D ...
过去大多数创造力测评在探索 LLM 的 Leap-of-Thought 能力的时候,仍然遵循普通大模型测评中的选择、排序等评估类型。尽管这种评估方式对逻辑思维能力的考察非常有效,但是在对创造力的评估中则不太合理。
来自MSN2 天
后DeepSeek时刻:阿里Qwen冲C端,腾讯元宝超越豆包作者|孙鹏越 编辑|大 风 如果说,2023年是“AI训练之年”,2024年是“AI推理之年”; 那么,2025年则是“DeepSeek之年”。
DeepSeek R1 可能是推动本地 AI 领域飞速发展的最大功臣。这款来自中国的 AI 模型免费、开源且功能强大,是任何想要尝试新 AI 应用的人的完美工具。 从基本的聊天搜索(例如“如何去除棉质 T 恤上的污渍”),到处理税务问题或其他个人事务 ...
新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,通义千问团队在官方社交媒体发文称,在Qwen ...
CODEI/O训练之后,Qwen-Coder在代码理解任务上取得了突破性进展,并且在阅读理解和推理任务 (如DROP) 上也有明显提升,这表明通过代码训练获得的推理能力确实 迁移到了其他领域 。
目前,国内的互联网巨头正纷纷借势DeepSeek的热度展开布局。继阿里、腾讯、字节、百度等旗下云计算平台上线DeepSeek大模型后。应用端也迅速跟进。百度搜索、腾讯元宝等产品均已接入DeepSeek,试图从这一波流量红利中抢占先机,争夺用户市场。
红板报 on MSN5 天
DeepSeek播种,阿里云“收割”?2月20日,阿里发布2025财年第三季度业绩报告(截至2024年12月31日止)。报告期内,阿里云实现营收317.42亿元,同比增长13%,相比上一季度7%的增速接近翻倍。整体收入(不计来自阿里巴巴并表业务的收入)实现双位数同比增长11%。调整后EB ...
(香港/北京综合讯)中国科技巨头阿里巴巴旗下通义千问(Qwen)团队星期二(2月25日)发布最新推理模型深度思考(QwQ)预览版,可能与OpenAI和深度求索(DeepSeek)等行业领先对手竞争,让全球人工智能(AI)竞赛进一步升温。
【超算互联网宣布上线DeepSeek-R1-Distill-Qwen-7B/14B API接口服务】《科创板日报》18日讯,国家超算互联网平台2月18日晚间宣布正式上线DeepSeek-R1-Distill-Qwen-7B/14B ...
包括 DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。 天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务 天数智芯 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果