Cot函数 - 搜索 News

1 天

DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升

DeepSeek团队最新研究，利用300多万个实例，将代码转换成思考过程，构建出数据集 CODEI/O ，对Qwen、Llama等模型进行了训练。

2 天

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞

过去一个月，DeepSeek以大约十分之一的训练成本，推出与OpenAIo1性能接近的开源模型R1，“小力出奇迹”的新范式震撼全球AI大模型行业。外界对于大型科技公司动辄数百亿美元的AI研发开支，也产生了越来越多的质疑。高性价比路线与“大力出奇迹”路 ...

知识蒸馏方法探究：Google Distilling Step-by-Step 论文深度分析

点击上方“Deephub Imba”,关注公众号,好文章不错过 !大型语言模型 (Large Language Models, LLMs) 的发展日新月异。从最初的简单对话系统，到如今能够执行文本生成、语言翻译和代码编写等复杂任务的先进模型，LLM ...

来自MSN6 天

Open R1放出220k高质量DeepSeek R1数据及处理技术细节，冲～

Open R1由huggingface出品，当前最火的DeepSeek-R1全开源复现，已经18.8k了，这两天该项目发布了最新进展：开源了包含由 DeepSeek R1生成的用于数学推理的全新大规模数据集OpenR1 -220k-Math合成数据处理技术细节汇总开源社在R1技术上的探索：Unsloth、李飞飞s1、AIME ...

7 天

开源22万条DeepSeek R1的高质量数据！你也能复现DeepSeek了

DeepSeek R1 的一个重要优势在于它能够将高级推理能力迁移到较小的模型中。DeepSeek 团队生成了 60 万条推理数据，在 Qwen 和 Llama 等开源模型上证明了这种迁移能力。即使不使用强化学习，直接从 R1 ...

10 天

SFT并非必需！清华CMU团队揭示大模型长思维链推理的黑盒机制

近日，清华大学、卡内基梅隆大学和IN.AI的研究团队发布了一篇备受关注的论文，揭示了大模型中长思维链推理（Long ...

腾讯网11 天

超越CoT！微软剑桥中科院提出MVoT，直接可视化多模态推理过程

2025-02-08 11:33发布于北京新智元官方账号 ...

腾讯网25 天

Meta-CoT：通过元链式思考增强大型语言模型的推理能力

大型语言模型（LLMs）在处理复杂推理任务时面临挑战，这突显了其在模拟人类认知中的不足。尽管 LLMs 擅长生成连贯文本和解决简单问题，但在需要 ...

51CTO28 天

Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

短CoT模型的上下文压缩与业界普遍采用复杂技术做法不同，Kimi团队选择了一条更为优雅的技术路线——回归第一性原理。他们证明了，无需依赖蒙特卡洛树搜索、价值函数、过程奖励模型，也能让模型取得卓越的性能。如上所见，我们已经看到了Kimi k1.5在多个 ...

新浪网29 天

追平满血版o1的国产多模态模型终于来了！训练细节全部公开

无需依赖蒙特卡洛树搜索、价值函数和过程奖励模型等更复杂的技术也能取得优异的性能。此外，他们还提出了有效的 long2short 技术，利用 Long-CoT ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果