资讯
美国史坦福大学人工智慧研究中心(HAI)在其发布的人工智慧索引 (AI Index)报告中指出,中国与美国在人工智慧模型方面的差距正在显着缩小,关键时间点则是2024年底,美国AI研究的领先趋势已不復存在。
智东西4月8日报道,今天,斯坦福大学以人为本AI研究院(HAI)发布长达456页的《AI指数报告2025》,全面介绍了中美AI竞争态势、开源模型、模型技术性能、大模型投融资、AI for Science等领域的最新数据和进展,其中 ...
2025 年 4 月 8 日,斯坦福大学与加拿大国立大学、卡内基梅隆大学联合发布的《2025 年人工智能指数报告》(HAI 报告)正式出炉,在众多顶尖大模型的技术性能评测中,来自中国的讯飞星火 4.0(Spark 4.0)凭借其在“MixEval-Hard”测试中的出色表现,成为国内唯一入围前十的中文大模型,在所有国产大模型中排名第一,展示出强劲的技术实力与国际竞争力。
10 小时on MSN
近期,斯坦福大学人本人工智能研究中心(HAI)公布的一份AI Index报告揭示了中美两国在人工智能模型发展上的新态势。报告指出,中国在AI模型领域的进步迅速,与美国之间的差距已显著缩小。
知名博主维斯·罗斯:突然之间,奥特曼宣布OpenAI将在未来几周内发布O3和O4-mini,并在年底前推出GPT-5。我猜测这次调整是为了在继续推进高性能中间模型的同时,为完善GPT-5争取更多时间。
21 小时
知乎专栏 on MSNDeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5 ...机器之心报道。 昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face ...
Multi-SWE-bench的价值超越传统基准测试范畴:它既是多语言能力的测量仪,更是软件工程知识的结构化沉淀。通过将1632个真实问题的解决过程转化为可计算的评估单元,研究团队实质上构建了一个"软件工程技能图谱"。
近期,据日经新闻披露的一项联合研究成果显示,中美两国的新型生成式人工智能(AI)已经展现出令人瞩目的学术能力,成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业Dee ...
IT之家 4 月 7 日消息,据日经新闻 4 月 5 日报道,日本经济新闻与民间企业、大型补习班的联合研究发现,中美两国新型生成式 AI 已具备通过日本最难关东京大学理科 3 ...
奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要来。然而,另一边Meta的Llama 4却因性能瓶颈屡次延期,AI竞赛的格局愈发扑朔迷离。
1 天
China.com on MSNOpenAI深夜开源AI评测新基准,顶尖人类如何逆袭AI?深夜的硅谷灯火通明,一场没有硝烟的“科研大战”正悄然打响。 这回他们没有发布新品,也不是在开大会,而是“整了个大活”——正式开源了一份新鲜出炉的AI智能体评测基准,名字叫做PaperBench。 这个听起来略带学术气息的东西,背后藏着的却是AI科学家们的“期末大考”。 简单说,它就是一套考核AI智能体能否从零开始复现顶级AI论文的“期末试题”。目标很明确:让AI像个博士生一样,看懂复杂论文、搭建项 ...
1 天
知乎专栏 on MSNClaude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台 ...编辑:桃子 好困 【新智元导读】AI若能自主复现顶尖科研论文,未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生,让AI智能体从头开始复现ICML 2024 20篇优秀论文,只有Claude 3.5 Sonnet拔得头筹,但仍无法超越ML博士水平。 AI智能体,能否复现顶会中重磅的AI研究?
一些您可能无法访问的结果已被隐去。
显示无法访问的结果