总结来看,AI的创造力评估已迎来新的变革,LoTbench作为测评工具,将推动更高效、更客观的AI创作能力提升。尽管DeepSeek和Qwen系列在创造力上存在差异,但它们都在不断地解锁AI的潜力,让我们期待未来更多的创新与突破。AI技术的进步不仅是 ...
近日,一项关于大语言模型创造力的研究引发了广泛关注。据机器之心报道,来自中大、哈佛、鹏城、新加坡管理大学的研究者提出了一种全新的评估范式LoTbench,用于衡量多模态大语言模型的创造力。研究结果显示,Qwen系列模型的创造力已接近人类顶尖水平,而D ...
过去大多数创造力测评在探索 LLM 的 Leap-of-Thought 能力的时候,仍然遵循普通大模型测评中的选择、排序等评估类型。尽管这种评估方式对逻辑思维能力的考察非常有效,但是在对创造力的评估中则不太合理。
红板报 on MSN3 天
后DeepSeek时刻:阿里Qwen冲C端,腾讯元宝超越豆包作者|孙鹏越 编辑|大 风 如果说,2023年是“AI训练之年”,2024年是“AI推理之年”; 那么,2025年则是“DeepSeek之年”。
DeepSeek R1 可能是推动本地 AI 领域飞速发展的最大功臣。这款来自中国的 AI 模型免费、开源且功能强大,是任何想要尝试新 AI 应用的人的完美工具。 从基本的聊天搜索(例如“如何去除棉质 T 恤上的污渍”),到处理税务问题或其他个人事务 ...
新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,通义千问团队在官方社交媒体发文称,在Qwen ...
CODEI/O训练之后,Qwen-Coder在代码理解任务上取得了突破性进展,并且在阅读理解和推理任务 (如DROP) 上也有明显提升,这表明通过代码训练获得的推理能力确实 迁移到了其他领域 。
目前,国内的互联网巨头正纷纷借势DeepSeek的热度展开布局。继阿里、腾讯、字节、百度等旗下云计算平台上线DeepSeek大模型后。应用端也迅速跟进。百度搜索、腾讯元宝等产品均已接入DeepSeek,试图从这一波流量红利中抢占先机,争夺用户市场。
红板报 on MSN5 天
DeepSeek播种,阿里云“收割”?2月20日,阿里发布2025财年第三季度业绩报告(截至2024年12月31日止)。报告期内,阿里云实现营收317.42亿元,同比增长13%,相比上一季度7%的增速接近翻倍。整体收入(不计来自阿里巴巴并表业务的收入)实现双位数同比增长11%。调整后EB ...
就在刚刚,来自斯坦福、UC伯克利、华盛顿大学等机构联手发布了一款SOTA级推理模型——OpenThinker-32B,并同时开源了高达114k的训练数据。 数据集:https://huggingface.co/datasets/open-thoughts/OpenThoughts-114k ...
21 天
来自MSN50美元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen春节期间,中国AI的技术变革在全世界掀起浪潮。 继DeepSeek的低成本推理模型震惊硅谷和华尔街之后,昨日,李飞飞等斯坦福大学和华盛顿大学研究人员发布的最新研究成果再次引发业界热议:基于阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,仅使用16块H100 GPU,通过26分钟的监督微调,便打造出了性能卓越比肩OpenAI的O1和DeepSeek的R1等尖端推理模型的s1-32 ...
包括 DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。 天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务 天数智芯 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果