Nlp模型 - Search News

随着人工智能技术的快速发展，深度学习已经演变为推动自然语言处理（NLP）、计算机视觉（CV）和多模态应用的核心动力。特别是近年来，基于Transformer架构的多语言模型（LLMs）如DeepSeek、Kimi与Qwen等取得了显著的进展。这些模型不仅在语言生成和推理能力方面表现优异，还在多语言支持和多模态融合等领域展示出强大的潜力。一、深度学习的演变深度学习，作为现代人工智能的基石，通过模 ...

14h

东方通：大模型中间件产品已完成与DeepSeek R1适配，助力企业智能化转型

近年来，人工智能技术迅猛发展，特别是大模型的应用场景逐步丰富，成为各行业数字化转型的重要推动力。近日，东方通在其互动平台上宣布，其大模型中间件产品TongLMM已成功完成与DeepSeek ...

腾讯网9d

清华NLP开源RAG开箱即用框架，自动适配知识库无需纠结模型选型

近日，针对以上痛点，清华大学THUNLP团队联合东北大学NEUIR、面壁智能及9#AISoft团队共同推出了UltraRAG框架，该框架革新了传统RAG系统的开发与配置方式，极大降低了学习成本和开发周期。

22h

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。

Hosted on MSN1mon

36氪研究院 | 2024年中国人工智能之自然语言处理（NLP）技术洞察

这一时期重新定位了NLP研究方向，使得语言处理更加依赖于统计模型和算法，为后续深度学习时代的到来积累了数据和算法基础。（4）深度学习 ...

14h

阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型

IT之家 2 月 7 日消息，阿里巴巴（中国）有限公司今日发文宣布，阿里云 PAI Model Gallery 已经支持 DeepSeek-V3 、 DeepSeek-R1 以及所有蒸馏小参数模型（ DeepSeek-R1-Distill ）一键部署 ...

腾讯网25d

23 年爆火的大模型综述，如今出纸质书了丨文末送书

在 24 年暑假，我们和清华 NLP 实验室、OpenBMB、Huggingface 有个合作，将其录制的大模型公开课进行推广和内容二创。我们认为那是当下国内最好的最新 ...

品高AISTACK创新采用显存复用和算力切割技术，助力DeepSeek大模型应用

AISTACK大模型训推一体机平台是广州市品高软件股份有限公司推出的一款面向企业的软硬结合的AI产品，旨在帮助企业轻松构建适合自身业务的垂直领域大模型应用。它将繁琐的技术细节隐藏起来，让企业聚焦于业务本身。此次集成DeepSeek-R1模型，为企业提供了更强大的AI能力。

14hon MSN

阿里云 PAI 支持云上部署 DeepSeek-V3、DeepSeek-R1 系列模型

IT之家 2 月 7 日消息，阿里巴巴（中国）有限公司今日发文宣布，阿里云 PAI Model Gallery 已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型（DeepSeek-R1-Distill）一键部署。

Some results have been hidden because they may be inaccessible to you

Show inaccessible results