qwen - 搜索 News

阿里巴巴 Qwen 团队近日发布了题为《数学推理中过程奖励模型的开发经验教训》的论文，并推出了 Qwen2.5-Math-PRM 系列中的两个新模型，分别具有7B 和72B 参数。这些模型在数学推理中突破了现有 PRM 框架的限制，通过创新技术显著提高了推理模型的准确性和泛化 ...

GitHub27 天

142 lines (108 loc) · 5.53 KB

本项目是对 QwenLM的 OCR 功能进行逆向工程的实现。通过调用 QwenLM 的 API，你可以从图片中提取文字内容，并且该项目支持一键部署到 Cloudflare Workers (CF) 上。图片 OCR：使用 QwenLM 强大的 OCR 功能从图片中提取文字。拖拽上传：直接将图片拖拽到页面即可识别 ...

新浪网29 天

微软开源最强小模型Phi-4，超GPT-4o、可商用

在美国数学竞赛AMC的测试中phi-4更是达到了91.8分，超过了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名开闭源模型，甚至整体性能可以与4050亿参数 ...

51CTO1 个月

LLaMA-Factory 微调与部署详细流程：从入门到实践

也可点击预览命令查看在终端运行的命令。我一般不使用可视化窗口训练模型。我喜欢直接运行训练模型的命令 llamafactory-cli train \ --stage sft \ --do_train True \ --model_name_or_path qwen/Qwen2.5-7B-Instruct \ --preprocessing_num_workers 16 \ ...

51CTO1 个月

鸿蒙开发者社区

尤其是一些私有化的系统，可能会阻碍合作和创新，导致更加通用和多功能的人工智能系统难以发展。然而，随着Qwen团队发布QvQ这一开源大模型，情况正在发生转变。QvQ作为一款专为多模态推理设计的开源模型，成功地解决了这一系列难题，突破了现有的技术 ...

17173游戏网1 个月

阿里发布 Qwen-Agent 框架，赋能开发者构建复杂 AI 智能体

阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent，基于现有 Qwen 语言模型，支持智能体执行复杂任务，并提供多种高级功能，赋能开发者构建更强大的 AI ...

搜狐1 个月

阿里Qwen-Agent正式发布，赋能开发更强AI智能体

如果你也在为如何快速、有效地开发AI应用而感到困扰，那么阿里巴巴最新推出的Qwen-Agent框架，无疑是一个解决方案。在这篇文章中，我们将探讨Qwen-Agent究竟是什么，它背后的技术原理，以及如何帮助开发者更轻松地构建智能应用。科普知识：什么是Qwen-Agent？

搜狐1 个月

阿里Qwen-Agent框架上新，助力开发者打造全能AI智能体

阿里巴巴近日在人工智能领域迈出了重要的一步，推出了全新的开发框架——Qwen-Agent。这一框架建立在通义千问模型Qwen的基础之上，旨在为开发者提供构建功能更为强大AI智能体的全面平台。Qwen-Agent不仅仅是一个工具，更是一个蕴含无限可能的开发生态 ...

腾讯网1 个月

阿里发布 Qwen-Agent 框架，赋能开发者构建复杂 AI 智能体

IT之家 1 月 4 日消息，阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent，基于现有 Qwen 语言模型，支持智能体执行复杂任务，并提供多种高级功能 ...

IT之家1 个月

谷歌 DeepMind 推 CAT4D：AI 魔法突破次元壁，普通视频活变 3D 大片

IT之家1 月 4 日消息，科技媒体 The Decoder 昨日（1 月 3 日）发布博文，报道称谷歌 DeepMind 联合哥伦比亚大学、加州大学圣地亚哥分校的研究人员，开发了一款名为 CAT4D 的 AI 系统，可以将普通视频转化为动态 3D 场景，降低了 3D 内容创作的门槛，为多个行业带来了 ...

腾讯网1 个月

阿里通义千问 Qwen 推 CodeElo，o1-mini 夺冠超 90%人类程序员

IT之家 1 月 4 日消息，阿里通义千问 Qwen 最新推出 CodeElo 基准测试，通过和人类程序员对比的 Elo 评级系统，来评估大语言模型（LLM）的编程水平。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果