资讯
Fin-R1 是一款针对金融领域复杂推理的大型语言模型,由上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合财跃星辰研发并开源发布。该模型以 Qwen2.5-7B-Instruct 为基座,通过高质量的可验证金融问题微调训练 ...
最近好多人使用,都是 DeepSeek服务器繁忙,请稍后再试 的提示,严重影响使用! 为解决服务器繁忙、不稳定的问题,本指南提供全面的 DeepSeek 使用说明 轻松使用 DeepSeek R1 满血版,快速稳定、不卡顿,支持 DeepSeek R1 满血版 以及 ChatGPT o1、o3 大模型。 包含 DeepSeek ...
在人工智能的革新浪潮中,DeepSeek团队近日正式发布了其全新开源AI模型DeepSeek-R1。该模型一经推出,便迅速在Github平台上赢得了超过4000颗星的关注,成为大模型领域的一颗璀璨新星。DeepSeek-R1不仅展现出强劲的性能,甚至 ...
字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。从报告中可以看到,这是一个拥有 200B 总参数的 MoE 模型,每次工作时会激活其中 20B 参数。其表现非常惊艳,在各个领域的基准上都超过了拥有 671B ...
21 天
财联社 on MSN上海财经大学联合财跃星辰开源首个金融领域R1类推理大模型Fin-R1 ...财联社3月21日讯,近日,上海财经大学张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合界面财联社旗下大模型科技公司财跃星辰开源发布首款金融领域R1类推理大模型Fin-R1。
11 天on MSN
在人工智能界掀起波澜的DeepSeek团队,于近日震撼发布了其最新力作——DeepSeek-R1模型。这款开源模型一经问世,便在Github平台上迅速积累了超过4000颗星的瞩目成绩,成为大模型领域的一颗璀璨新星。
阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni,并首次将强化学习与可验证奖励应用在多模态大模型,显著提升了模型在情感识别任务中的推理能力、准确性和泛化能力。根据测试数据显示R1-Omni的识别能力非常优秀,在MAFW数据集上,R1 ...
该项目由上海财经大学统计与数据科学学院张立文教授与上海财经大学统计与数据科学学院博士生郭鑫、硕士生刘赵伟和课题组核心成员蔡维格、牛晋怡、曾凌峰、娄方齐、王子璇、胥佳杰、赵学前、杨子纬,以及财跃星辰白祚博士和团队成员陈德智、许晟、李超共同完成。近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金 ...
近日,中国科学院自动化研究所与中科紫东太初团队联手推出了一种新方法 ——Vision-R1,利用类 R1强化学习技术,显著提升了视觉定位的能力。这个方法不仅在目标检测和视觉定位等复杂任务上实现了50% 的性能提升,甚至超过了参数规模超过10倍的现有 最优 模型(SOTA)。
21 天
知乎专栏 on MSN老显卡福音!美团开源首发INT8无损满血版DeepSeek R1美团搜推团队 投稿量子位 | 公众号 QbitAI 满血版DeepSeek R1部署A100,基于INT8量化,相比BF16实现50%吞吐提升! 美团搜推机器学习团队最新开源,实现对DeepSeek R1模型基本无损的INT8精度量化。 要知道,DeepSeek ...
强化学习(RL)领域再迎技术革新。继上周发布大模型慢思考推理技术获系列成果之后,九章云极DataCanvas联合研究团队再次发布新一代AI强化学习框架R1-Searcher及全链路工程代码。近日,中国人民大学STILL项目团队、九章云极DataCanvas研究人员联合发布新技术论文称,提出了一种全新的强化学习方法R1-Searcher。据官方论文介 ...
IT之家3 月 17 日消息,@小米技术 官微今日发文称,小米大模型团队在音频推理领域取得突破性进展。受 DeepSeek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首,现同步 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果