截至IT之家发稿,DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper(7.58 万);同门兄弟 DeepSeek-R1 以 6.64 万 Star 数超越 OpenAI 官方教程库 openai-cookbook(6.16 万)。
DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果