Openai 图表 - 搜索 News

来自MSN9 天

从十二天发布来看OpenAI的2025战略布局

在去年底的十二天发布会期间，OpenAI以新一代推理模型o1正式上线激活揭开序幕。首席执行官Sam Altman表示，OpenAI的模型技术，开始从通用型的LLM，转向具有复杂推理能力的新一代模型系列。第一天：新一代推理模型o1正式上线 ...

51CTO16 天

ChatGPT全年更新大总结！重看「大模型风向标」进化之路

免费用户可以使用一些之前仅限付费用户使用的工具和GPTs，如互联网访问、图像上传和分析、创建图表、高级数据分析、启用记忆功能、访问 GPT 商店等。苹果在2024年全球开发者大会（WWDC）上，宣布与OpenAI达成合作，将ChatGPT集成到Siri中；用户请求不会被OpenAI ...

51CTO16 天

打脸！GPT-4o输出长度8k都勉强，陈丹琦团队新基准测试：所有模型 ...

最近，陈丹琦团队提出了一个全新的基准测试工具LONGPROC，专门用于检测长上下文模型处理复杂信息并生成回复的能力。很多大模型的官方参数都声称自己可以输出长达32K tokens的内容，但这数字实际上是存在水分的？？最近，陈丹琦团队提出了一个全新的基准 ...

虎嗅网16 天

OpenAI发布首个AI Agent，ChatGPT能自动帮你干活了

今天凌晨，OpenAI 正式宣布推出一项名为 Tasks 的测试版功能。无论是一次性提醒还是重复性任务，现在你只需要向 ChatGPT 说明需求和时间，它就能实现自动化处理。比方说，你可以设置每天早晨 7 点获取天气预报，或定时提醒遛狗等日常事项。看到这，有没有 ...

艾瑞网16 天

OpenAI的A推理模型有时会用中文“思考” 但没人知道为什么

导语：专家表示，o1 和其他推理模型可能只是使用他们认为最有效的语言来实现目标（或幻觉）。 OpenAI 发布其首个"推理"人工智能模型 o1 后不久，人们开始注意到一个奇怪的现象。该模型有时会开始用中文、波斯语或其他语言进行"思考"--即使被问到的是英语 ...

爱范儿17 天

OpenAI 发布首个 AI Agent！ChatGPT 能自动帮你干活了

使用微信扫码将网页分享到微信今天凌晨，OpenAI 正式宣布推出一项名为 Tasks 的测试版功能。无论是一次性提醒还是重复性任务，现在你只需要向 ...

36氪17 天

OpenAI发布经济蓝图，奥特曼急呼AI让美国先赢，打造AI版「美国梦」

OpenAI蓝图建议美放松AI监管，促进发展。 AI时代，美国如何继续保持全球领先？在最新发布的「经济蓝图」中，OpenAI对美国的AI安全战略、产业竞争力 ...

凤凰网25 天

OpenAI CEO奥特曼专访：如何应对特朗普与马斯克这对“执政”搭档？

对于OpenAI的崛起，作为CEO的萨姆·奥特曼 ... 但这次是其中之一。 YC有一张著名的图表，是创始人保罗·格雷厄姆(Paul Graham)画的。图上有产品发展 ...

虎嗅网25 天

OpenAI CEO发布长文：我们已经知道如何构建AGI

就在刚刚，OpenAI CEO Sam Altman 在 X 平台发布了一篇反思博客。在这篇文章中，他以一位亲历者和领导者的视角，带我们走进了 OpenAI 自成立以来的发展历程，特别是过去两年来的重要时刻。这当中，包括但不限于 ChatGPT 的诞生、他被解雇又复职的风波，以及 OpenAI ...

腾讯网25 天

深度｜OpenAI预演o3模型：推理能力实现飞跃，在ARC AGI挑战取得突破性 ...

我最近的一篇文章解释了这如何通过大规模强化学习训练实现，并说明了为什么OpenAI的一些图表在推理阶段的计算成本上具有误导性。OpenAI的员工也 ...

澎湃新闻27 天

OpenAI再招华人研究员，高中入围美国“少年诺贝尔奖”，还在哈佛教书

在从加利福尼亚一所高中毕业后，Jeffrey Wang于2021年本科入学哈佛，专业为数学和计算机科学，同时辅修了英语。从今年9月开始，他就已经在为OpenAI工作，也许是这几个月的经历，让他最终决定现在加入OpenAI。实际上，在哈佛期间，还是学生的Jeffrey Wang已经开始 ...

IT之家27 天

AI 编程能力哪家强？阿里通义千问 Qwen 推 CodeElo 基准，OpenAI o1-mini ...

测试结果在对 30 个开源 LLM 和 3 个专有 LLM 进行测试后，OpenAI 的 o1-mini 模型表现最佳，Elo 评分为 1578，超过了 90% 的人类参与者；开源模型中，QwQ-32B-Preview 以 1261 分位居榜首。然而，许多模型在解决简单问题时仍显吃力，通常排名在人类参与者的后 20%。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果