此次推出的新模型拥有240亿参数,在标准基准测试中的准确率达81%,并且每秒能够处理150个Token。Mistral AI在发布该模型时采用了适用性更加广泛的Apache ...
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理 ...
Meta总裁Mark Zuckerberg在第四季财报会议上回应DeepSeek模型带来的市场震荡,表示这“强化了我们专注AI开发的信念”。他指出公司正在消化DeepSeek的创新技术,并计划将其进展集成到Llama模型中。
中国AI创业公司DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。Meta的Llama 3系列模型的计算预算多达3930万H100 GPU Hours—— ...
IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 的过程中,高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标,并在内部讨论中表现出极强的竞争意识。 Meta ...
尽管Meta CEO马尔克·扎克伯格曾公开表示希望缩小Llama模型与其他闭源模型的差距,公司内部也因此承受着巨大的压力。扎克伯格在2024年7月的一封信中信心满满地指出,Llama 3已经能与最先进的模型一争高下,并在某些领域处于领先。最终在2024年4月,Meta正式推出了Llama 3,这款开源模型在性能上与市场上的闭源模型不相上下,甚至打败了Mistral的开源模型。
扎克伯格还表示,DeepSeek在技术上具有多项创新,这些创新不仅值得Meta学习,也可能对整个人工智能行业的发展产生深远影响。这些技术使得DeepSeek能够在较低的计算资源需求下实现高性能,这对于资源有限的团队来说具有重要意义。
截至2024财年第四季度,Meta公司在人工智能(AI)领域的持续投入引发广泛关注。在财报电话会上,CEO马克·扎克伯格谈到中国公司深度求索(DeepSeek)发布的AI大模型DeepSeek-R1时表示,虽然公司仍在消化这一技术的成果,但显然对其应 ...
本案检察官指控 Meta 高管在匆忙推出 AI 模型的过程中,存在使用受版权保护的书籍进行训练的行为。Touvron 在一份消息中指出,用于训练 Llama 2 的 ...