此次推出的新模型拥有240亿参数,在标准基准测试中的准确率达81%,并且每秒能够处理150个Token。Mistral AI在发布该模型时采用了适用性更加广泛的Apache ...
截至2024财年第四季度,Meta公司在人工智能(AI)领域的持续投入引发广泛关注。在财报电话会上,CEO马克·扎克伯格谈到中国公司深度求索(DeepSeek)发布的AI大模型DeepSeek-R1时表示,虽然公司仍在消化这一技术的成果,但显然对其应 ...
DeepSeek的出现,也引发了对AI技术研发成本的反思。扎克伯格指出,尽管研发所需的资源可能低于预想,但实际运作中的AI技术仍需要强大的服务器能力,以实现高效的智能服务。据其介绍,Meta正在研发的AI助手将达到与优秀工程师相当的编程和解决问题的能 ...
Meta总裁Mark Zuckerberg在第四季财报会议上回应DeepSeek模型带来的市场震荡,表示这“强化了我们专注AI开发的信念”。他指出公司正在消化DeepSeek的创新技术,并计划将其进展集成到Llama模型中。
2025年将是Meta AI战略的重要发展之年,发展方向将在年底前明确。 Llama 4系列将在今年发布,目标是成为业内领先的大模型。 DeepSeek等新竞争对手的出现,进一步证明了开源模型的潜力和价值。
朱克伯格赞DeepSeek在基础设施优化方面取得了新颖进展,这些创新已公开发表,Meta可以学习并采用相关方法。他表示,看到其他公司做得更好总是很有趣,这也激励著Meta保持警惕,吁员工准备迎接紧张的一年。
另请阅读:希腊开始对公务员进行人工智能培训 Meta 对 Llama 3 的开源方法是在他们最后一次发布(即 2023 年的 Llama 2)之后进行的。尽管有些人批评他们限制了为竞争对手公司工作的开发人员,并且因为该特定模型中可能存在安全过滤器, Meta 仍然致力于透明度 ...
IT之家 1 月 15 日消息,周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 的过程中,高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标,并在内部讨论中表现出极强的竞争意识。 Meta ...
PANews 1月30日消息,阿里巴巴在春节期间紧急推出升级版AI模型Qwen 2.5-Max,以应对快速变化的行业竞争。公司声称,该模型在性能上“几乎全面超越”ChatGPT、DeepSeek和Meta的Llama。根据阿里巴巴的测试,Qwen ...
中国AI创业公司DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。Meta的Llama 3系列模型的计算预算多达3930万H100 GPU Hours—— ...
Facebook母企Meta(META)公布去年第四季业绩收入及盈利均好过预期,其中收入按年升21%至483.85亿元;盈利升49%至208.38亿元(美元,下同);经调整后每股盈利为8.02元。至于包括Quest ...