资讯

近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。
4月21日,生数科技全新视频大模型Vidu Q1官宣全球上线,凭借性能提升与全新功能,该模型一经上线即引发行业高度关注,力证其用实力再次搅动市场风云。据视频生成模型权威测评基准VBench-1.0以及VBench-2.0刚刚发布的测评结果,Vidu ...
腾讯宣布将于明日正式揭晓混元3D AI引擎2.5(Hunyuan3D AI Engine2.5),进一步推动AI驱动的3D内容创作革新。据AIbase了解,作为混元3D2.0的升级版本,2.5预计在几何生成、纹理合成与生成速度上实现重大突破,为游戏开发、虚拟现实与创意设计等领域带来更高效的解决方案。腾讯官方预告引发了全球开发者与创作者的热烈期待,相关细节将在明日发布会公布。AIbase为您带来 ...
4月21日,生数科技全新视频大模型Vidu Q1官宣全球上线。据视频生成模型权威测评基准VBench-1.0以及VBench-2.0刚刚发布的测评结果,Vidu Q1在VBench系列的两个榜单上都超越了Runway Gen-3、OpenAI ...
生数科技 Vidu Q1发布,超OpenAI Sora夺下 VBench 双榜第一,openai,vidu,vbench,sora ...
4月21日,生数科技全新视频大模型Vidu Q1官宣全球上线。据视频生成模型权威测评基准VBench-1.0以及VBench-2.0刚刚发布的测评结果,Vidu Q1在VBench系列的两个榜单上都超越了Runway Gen-3、OpenAI ...