搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
来自MSN
9 天
从十二天发布来看OpenAI的2025战略布局
在去年底的十二天发布会期间,OpenAI以新一代推理模型o1正式上线激活揭开序幕。首席执行官Sam Altman表示,OpenAI的模型技术,开始从通用型的LLM,转向具有复杂推理能力的新一代模型系列。 第一天:新一代推理模型o1正式上线 ...
51CTO
16 天
ChatGPT全年更新大总结!重看「大模型风向标」进化之路
免费用户可以使用一些之前仅限付费用户使用的工具和GPTs,如互联网访问、图像上传和分析、创建图表、高级数据分析、启用记忆功能、访问 GPT 商店等。 苹果在2024年全球开发者大会(WWDC)上,宣布与OpenAI达成合作,将ChatGPT集成到Siri中;用户请求不会被OpenAI ...
51CTO
16 天
打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型 ...
最近,陈丹琦团队提出了一个全新的基准测试工具LONGPROC,专门用于检测长上下文模型处理复杂信息并生成回复的能力。 很多大模型的官方参数都声称自己可以输出长达32K tokens的内容,但这数字实际上是存在水分的?? 最近,陈丹琦团队提出了一个全新的基准 ...
虎嗅网
16 天
OpenAI发布首个AI Agent,ChatGPT能自动帮你干活了
今天凌晨,OpenAI 正式宣布推出一项名为 Tasks 的测试版功能。 无论是一次性提醒还是重复性任务,现在你只需要向 ChatGPT 说明需求和时间,它就能实现自动化处理。比方说,你可以设置每天早晨 7 点获取天气预报,或定时提醒遛狗等日常事项。 看到这,有没有 ...
艾瑞网
16 天
OpenAI的A推理模型有时会用中文“思考” 但没人知道为什么
导语:专家表示,o1 和其他推理模型可能只是使用他们认为最有效的语言来实现目标(或幻觉)。 OpenAI 发布其首个"推理"人工智能模型 o1 后不久,人们开始注意到一个奇怪的现象。 该模型有时会开始用中文、波斯语或其他语言进行"思考"--即使被问到的是英语 ...
爱范儿
17 天
OpenAI 发布首个 AI Agent!ChatGPT 能自动帮你干活了
使用微信扫码将网页分享到微信 今天凌晨,OpenAI 正式宣布推出一项名为 Tasks 的测试版功能。 无论是一次性提醒还是重复性任务,现在你只需要向 ...
36氪
17 天
OpenAI发布经济蓝图,奥特曼急呼AI让美国先赢,打造AI版「美国梦」
OpenAI蓝图建议美放松AI监管,促进发展。 AI时代,美国如何继续保持全球领先?在最新发布的「经济蓝图」中,OpenAI对美国的AI安全战略、产业竞争力 ...
凤凰网
25 天
OpenAI CEO奥特曼专访:如何应对特朗普与马斯克这对“执政”搭档?
对于OpenAI的崛起,作为CEO的萨姆·奥特曼 ... 但这次是其中之一。 YC有一张著名的图表,是创始人保罗·格雷厄姆(Paul Graham)画的。图上有产品发展 ...
虎嗅网
25 天
OpenAI CEO发布长文:我们已经知道如何构建AGI
就在刚刚,OpenAI CEO Sam Altman 在 X 平台发布了一篇反思博客。 在这篇文章中,他以一位亲历者和领导者的视角,带我们走进了 OpenAI 自成立以来的发展历程,特别是过去两年来的重要时刻。 这当中,包括但不限于 ChatGPT 的诞生、他被解雇又复职的风波,以及 OpenAI ...
腾讯网
25 天
深度|OpenAI预演o3模型:推理能力实现飞跃,在ARC AGI挑战取得突破性 ...
我最近的一篇文章解释了这如何通过大规模强化学习训练实现,并说明了为什么OpenAI的一些图表在推理阶段的计算成本上具有误导性。OpenAI的员工也 ...
澎湃新闻
27 天
OpenAI再招华人研究员,高中入围美国“少年诺贝尔奖”,还在哈佛教书
在从加利福尼亚一所高中毕业后,Jeffrey Wang于2021年本科入学哈佛,专业为数学和计算机科学,同时辅修了英语。 从今年9月开始,他就已经在为OpenAI工作,也许是这几个月的经历,让他最终决定现在加入OpenAI。 实际上,在哈佛期间,还是学生的Jeffrey Wang已经开始 ...
IT之家
27 天
AI 编程能力哪家强?阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini ...
测试结果 在对 30 个开源 LLM 和 3 个专有 LLM 进行测试后,OpenAI 的 o1-mini 模型表现最佳,Elo 评分为 1578,超过了 90% 的人类参与者;开源模型中,QwQ-32B-Preview 以 1261 分位居榜首。 然而,许多模型在解决简单问题时仍显吃力,通常排名在人类参与者的后 20%。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈