Nlp模型 - 搜索 News

近日，针对以上痛点，清华大学THUNLP团队联合东北大学NEUIR、面壁智能及9#AISoft团队共同推出了UltraRAG框架，该框架革新了传统RAG系统的开发与配置方式，极大降低了学习成本和开发周期。

3 天

随着人工智能技术的飞速发展，各类AI解决方案在配备强大硬件的基础上，更需要适合开发者的高效模型。2025年2月4日，华为计算官方公众号宣布，DeepSeek系列新模型正式上线昇腾社区，这是一个引发广泛关注的技术讯息。此次上线的模型包括DeepSeek ...

搜狐16 天

豆包大模型1.5 Pro发布：打破AI边界，超越GPT-4o

它不仅在已有技术基础上进行升级，还在多个评测基准上展示了比GPT-4o更强的综合能力。豆包大模型1.5 Pro的推出标志着豆包科技在自然语言处理（NLP）领域的一次重大跨越。官方声明指出，该模型在知识、代码、推理和中文处理等方面都有显著的性能提升 ...

11 小时

东方通：大模型中间件产品已完成与DeepSeek R1适配，助力企业智能化转型

近年来，人工智能技术迅猛发展，特别是大模型的应用场景逐步丰富，成为各行业数字化转型的重要推动力。近日，东方通在其互动平台上宣布，其大模型中间件产品TongLMM已成功完成与DeepSeek ...

19 小时

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。