Openai O1 - 搜索 News

资讯

中时新闻网7 小时

美研究报告：中美AI差距缩小、对中明显领先趋势已不復存在

美国史坦福大学人工智慧研究中心（HAI）在其发布的人工智慧索引 (AI Index)报告中指出，中国与美国在人工智慧模型方面的差距正在显着缩小，关键时间点则是2024年底，美国AI研究的领先趋势已不復存在。

7 小时

斯坦福456页AI报告划重点：中美AI竞争格局变了！

智东西4月8日报道，今天，斯坦福大学以人为本AI研究院（HAI）发布长达456页的《AI指数报告2025》，全面介绍了中美AI竞争态势、开源模型、模型技术性能、大模型投融资、AI for Science等领域的最新数据和进展，其中 ...

7 小时

斯坦福 2025 年 HAI 报告出炉，国产大模型仅讯飞星火入围 Mix-Eval 前十

2025 年 4 月 8 日，斯坦福大学与加拿大国立大学、卡内基梅隆大学联合发布的《2025 年人工智能指数报告》（HAI 报告）正式出炉，在众多顶尖大模型的技术性能评测中，来自中国的讯飞星火 4.0（Spark 4.0）凭借其在“MixEval-Hard”测试中的出色表现，成为国内唯一入围前十的中文大模型，在所有国产大模型中排名第一，展示出强劲的技术实力与国际竞争力。

10 小时on MSN

中美AI差距急剧缩小，美国领先地位不再稳固？

近期，斯坦福大学人本人工智能研究中心（HAI）公布的一份AI Index报告揭示了中美两国在人工智能模型发展上的新态势。报告指出，中国在AI模型领域的进步迅速，与美国之间的差距已显著缩小。

17 小时

OpenAI：将在几周内发布o3和o4-mini，几个月后推出GPT-5

知名博主维斯·罗斯：突然之间，奥特曼宣布OpenAI将在未来几周内发布O3和O4-mini，并在年底前推出GPT-5。我猜测这次调整是为了在继续推进高性能中间模型的同时，为完善GPT-5争取更多时间。

知乎专栏 on MSN21 小时

DeepSeek V3深夜低调升级，代码进化令人震惊，网友实测可媲美Claude 3.5 ...

机器之心报道。昨夜，DeepSeek V3 毫无征兆地来了一波更新，升级到了「DeepSeek-V3-0324」版本。目前，新版本在 Hugging Face 上可以下载并部署。 Hugging Face ...

腾讯网1 天

多语言软件工程基准测试新突破：大模型离「全栈工程师」还有多远？

Multi-SWE-bench的价值超越传统基准测试范畴：它既是多语言能力的测量仪，更是软件工程知识的结构化沉淀。通过将1632个真实问题的解决过程转化为可计算的评估单元，研究团队实质上构建了一个"软件工程技能图谱"。

1 天

{中美AI“考生”东大入学考：英语超群数学短板，能否预示AI未来？）

近期，据日经新闻披露的一项联合研究成果显示，中美两国的新型生成式人工智能（AI）已经展现出令人瞩目的学术能力，成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业Dee ...

腾讯网1 天

中美 AI 挑战东京大学入学考试：双双合格，英语优异，数学欠佳

IT之家 4 月 7 日消息，据日经新闻 4 月 5 日报道，日本经济新闻与民间企业、大型补习班的联合研究发现，中美两国新型生成式 AI 已具备通过日本最难关东京大学理科 3 ...

1 天

奥特曼官宣：免费GPT-5性能惊人，o3和o4-mini抢先上线，Llama 4也鸽了

奥特曼接连抛出重磅消息：GPT-5不仅将免费开放，还将整合多项尖端技术。o3和o4-mini即将在几周内亮相，还有一个神秘的开源推理模型要来。然而，另一边Meta的Llama 4却因性能瓶颈屡次延期，AI竞赛的格局愈发扑朔迷离。

China.com on MSN1 天

OpenAI深夜开源AI评测新基准，顶尖人类如何逆袭AI？

深夜的硅谷灯火通明，一场没有硝烟的“科研大战”正悄然打响。这回他们没有发布新品，也不是在开大会，而是“整了个大活”——正式开源了一份新鲜出炉的AI智能体评测基准，名字叫做PaperBench。这个听起来略带学术气息的东西，背后藏着的却是AI科学家们的“期末大考”。简单说，它就是一套考核AI智能体能否从零开始复现顶级AI论文的“期末试题”。目标很明确：让AI像个博士生一样，看懂复杂论文、搭建项 ...

知乎专栏 on MSN1 天

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台 ...

编辑：桃子好困【新智元导读】AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。 AI智能体，能否复现顶会中重磅的AI研究？

一些您可能无法访问的结果已被隐去。

显示无法访问的结果