DeepSeek所推出的V3版本自2024年12月26日正式发布以来,在多项评测中均超越了目前市场流行的开源模型,如Qwen2.5和Llama-3等。其超大型MoE模型(混合专家模型)参数量达到671B,激活参数量为37B,这意味着它能够处理更大规模 ...
在全球人工智能技术快速发展的背景下,中国的AI企业逐渐崭露头角,DeepSeek便是其中一颗闪亮的星星。最新消息显示,DeepSeek旗下的两个开源项目——DeepSeek-V3和DeepSeek-R1在GitHub平台上实现了历史性的里程碑,分别超过了OpenAI的业内明星项目Whisper和官方教程库openai-cookbook。这一突破不仅彰显出中国AI技术的实力,也为整个科技界带来了新的 ...
据技术报告介绍,DeepSeek-V3 的预训练过程只花费 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练共为 278.8 H800 GPU Hours(训练成本 557.6 万美元)。相较之下,Llama 3 ...
智东西(公众号:zhidxcom)作者 | 程茜编辑 | ...
IT之家 2 月 7 日消息,DeepSeek 旗下两大开源项目刚刚在 GitHub 平台实现历史性突破。截至IT之家发稿,DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper(7.58 ...
截至IT之家发稿,DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper(7.58 万);同门兄弟 DeepSeek-R1 以 6.64 万 Star 数超越 OpenAI 官方教程库 ...
OpenAI开源的Whisper一直是很多开发者首选的语音识别模型。但它使用固定长度的编码器来处理 30 秒的音频块,对于较短的音频序列需要进行零填充。
DeepSeek旗下两大开源项目在GitHub平台迎来了历史性时刻,收获了令人瞩目的成就。近日,DeepSeek-V3与DeepSeek-R1的Star数量双双实现了对OpenAI旗下明星项目的超越。
OpenAI表示,新模型的大小仅为1.6GB,便于用户下载和使用。同时,公司将继续遵循MIT许可证,提供包括代码和模型权重在内的Whisper资源,以支持开发 ...
开年第一剑,OpenAI Agent闪亮登场! ChatGPT新功能「Tasks」,让AI有了执行力,可以替你完成各种任务。 无论是一次性提醒还是重复执行的动作 ...
这款AI电视将结合OpenAI的多项技术,包括文本生成(ChatGPT)、图像生成(DALL-E)以及语音识别(Whisper)。通过这些先进的AI模型,用户将能够享受到 ...