deepseek v3 重磅发布，ai 届「拼多多」

云牧2024-12-31 21:43

视频看：www.bilibili.com/video/BV1MD...

奥特曼强调"复制容易，创新很难"，高度疑似在暗讽 deepseek，我感觉奥特曼有点破防，因为 deepseek 用低成本保持了与 gpt-4o 相当甚至更优的性能，这无疑给他融资带来困难。

他说这句话的原因是，此前 deepseek 说自己是 chatgpt，这是我在官网之前问的：

但其实之前 gemini 也被爆过说自己的是文心一言：

这背后的原因一个是deepseek 训练过程中，使用了 chatgpt 的数据，也没有做好训练数据的清洗，后期也没有做好模型对齐。

说实话目前模型之间相互"借鉴学习"也很常见，不存在什么道德压力，你 openai 使用广大互联网数据，这么多侵权咋不说呢？

而且据说 deepseek v3 发布不在预期内，我是倾向这个观点的，因为 v2.5 也是 12月更新了一波，deepseek 是觉得模型能力够了，先放出来一波，后面会持续进行优化的。

deepseek v3 ** **2024年12月26日正式发布，仅耗费 557.6 万美元完成预训练。

依旧是混合专家架构，总参数量高达6710亿（之前 v2.5 是2360 亿），每次推理激活370亿参数。

DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲：

livebench 排名第 5，去掉推理模型，排名第2：

聊天机器人竞技场排行榜排名第 7：

模型权重和代码完全开源，支持在 Hugging Face 下载：

官网和 api 默认都已经切换到 v3 版本了，v2.5 已经下线。

模型性能：国内第一，综合性价比：世界第一。

这是 aider 评测简介：