r1 github - 搜索 News

资讯

最近好多人使用，都是 DeepSeek服务器繁忙，请稍后再试的提示，严重影响使用！为解决服务器繁忙、不稳定的问题，本指南提供全面的 DeepSeek 使用说明轻松使用 DeepSeek R1 满血版，快速稳定、不卡顿，支持 DeepSeek R1 满血版以及 ChatGPT o1、o3 大模型。包含 DeepSeek ...

14 小时

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。从报告中可以看到，这是一个拥有 200B 总参数的 MoE 模型，每次工作时会激活其中 20B 参数。其表现非常惊艳，在各个领域的基准上都超过了拥有 671B ...

GitHub1 天

DeepSeek 官网入口、下载及使用教程~ | DeepSeek 最新使用指南~【2025年4月 ...

轻松使用 DeepSeek 网页版，快速稳定、不卡顿，支持 DeepSeek R1 满血版以及 ChatGPT o1、o3 大模型本指南提供最全面的 DeepSeek 使用指南，包含 DeepSeek 官网入口、DeepSeek 网页版、deepseek 下载、DeepSeek 平替网站，助您顺畅使用 DeepSeek~ DeepSeek 是由深度求索（DeepSeek ...

腾讯网3 天

类R1强化学习迁移到视觉定位！全开源Vision-R1将图文大模型性能提升50％

图文大模型通常采用「预训练 + ...

12 小时

震撼登场！豆包新模型Seed-Thinking-v1.5成功击败DeepSeek-R1！

在科技日新月异的今天，字节旗下的豆包团队刚刚发布了最新的推理模型Seed-Thinking-v1.5，其成果无疑将引爆业界讨论。这一新模型不仅在参数量上仅为DeepSeek-R1（671B）的三分之一，甚至达到200B参数，表现却令人惊艳！

腾讯网3 天

阿里开源R1-Omni，多模态情感识别

阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni，并首次将强化学习与可验证奖励应用在多模态大模型，显著提升了模型在情感识别任务中的推理能力、准确性和泛化能力。根据测试数据显示R1-Omni的识别能力非常优秀，在MAFW数据集上，R1 ...

4 小时

大模型推理无损加速6.5倍！EAGLE-3碾压一切、延续Scaling Law能力

自回归解码已然成为大语言模型的推理标准。大语言模型每次前向计算需要访问它全部的参数，但只能得到一个 token，导致其生成昂贵且缓慢。近日，EAGLE 团队的新作《EAGLE-3: Scaling up Inference Acceleration ...

3 天

Vision-R1：强化学习助力视觉定位，图文模型性能提升 50%

近日，中国科学院自动化研究所与中科紫东太初团队联手推出了一种新方法 ——Vision-R1，利用类 R1强化学习技术，显著提升了视觉定位的能力。这个方法不仅在目标检测和视觉定位等复杂任务上实现了50% 的性能提升，甚至超过了参数规模超过10倍的现有最优模型（SOTA）。

红板报 on MSN21 小时

字节新推理模型逆袭DeepSeek，200B参数战胜671B，豆包史诗级加强？

梦晨发自凹非寺量子位 | 公众号 QbitAI 字节最新深度思考模型，在数学、代码等多项推理任务中超过DeepSeek-R1了？而且参数规模更小。同样是MoE架构，字节新模型Seed-Thinking-v1.5有200B总参数和20B激活参数。

红板报 on MSN2 天

媲美OpenAI-o3，刚刚开源模型DeepCoder，训练方法、数据集大公开

今天凌晨4点，著名大模型训练平台Together AI和智能体平台Agentica，联合开源了新模型DeepCoder-14B-Preview。该模型只有140亿参数，但在知名代码测试平台LiveCodeBench的测试分为60.6%，高于OpenAI的o1模型（59.5%），略低于o3-mini（60.9%）。在Codeforces、AIME2024上的评测数据同样非常出色，几乎与o1、o3- ...

腾讯网6 天

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

近年来，大语言模型（LLM）的性能提升逐渐从训练时规模扩展转向推理阶段的优化，这一趋势催生了「测试时扩展（test-time scaling）」的研究热潮。OpenAI 的 o1 系列与 DeepSeek 的 R1 ...

1 天

腾讯云上线「AI开发套件」：5分钟搭建AI Agent小程序，支持MCP托管

腾讯云提供「现成的」UI组件，涵盖了AI对话、Agent智能代理所需要的大部分前端交互功能（比如对话气泡、Markdown渲染、流式输出效果、图片/文件上传等），直接接入就能用。一个「好用」的AI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果