deepseek v3 重磅发布,ai 届「拼多多」

视频看:www.bilibili.com/video/BV1MD...

奥特曼强调"复制容易,创新很难",高度疑似在暗讽 deepseek,我感觉奥特曼有点破防,因为 deepseek 用低成本保持了与 gpt-4o 相当甚至更优的性能,这无疑给他融资带来困难。

他说这句话的原因是,此前 deepseek 说自己是 chatgpt,这是我在官网之前问的:

但其实之前 gemini 也被爆过说自己的是文心一言:

这背后的原因一个是deepseek 训练过程中,使用了 chatgpt 的数据,也没有做好训练数据的清洗,后期也没有做好模型对齐。

说实话目前模型之间相互"借鉴学习"也很常见,不存在什么道德压力,你 openai 使用广大互联网数据,这么多侵权咋不说呢?

而且据说 deepseek v3 发布不在预期内,我是倾向这个观点的,因为 v2.5 也是 12月更新了一波,deepseek 是觉得模型能力够了,先放出来一波,后面会持续进行优化的。

deepseek v3 ** **2024年12月26日 正式发布,仅耗费 557.6 万美元完成预训练。

依旧是混合专家架构,总参数量高达6710亿(之前 v2.5 是2360 亿),每次推理激活370亿参数。

DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲:

livebench 排名第 5,去掉推理模型,排名第2:

聊天机器人竞技场排行榜排名第 7:

模型权重和代码完全开源,支持在 Hugging Face 下载:

官网和 api 默认都已经切换到 v3 版本了,v2.5 已经下线。

最大亮点

  • 完全开源
  • 相对优惠的价格维持目前优惠价格到 2025 年 2 月 8日:
  • 模型规模扩大近三倍,而且因为是国产模型,中文训练数据更多,会对中文用户更加友好:
  • 生成速度提升至 3 倍,从 20 TPS(每秒 20 个 token)大幅提高至 60 TPS(每秒 60 个 token):

相对缺点

  • 在非推理模型中,代码能力可能还是比不上 claude 3.5 sonnet,虽然aider 代码榜上现在是第 2名:
  • api 价格后续会上升,最重要的目前 api 还没有多模态和推理模型的选项。

模型性能:国内第一,综合性价比:世界第一。

这是 aider 评测简介:

相关推荐
KY_chenzhao7 小时前
ChatGPT与DeepSeek在科研论文撰写中的整体科研流程与案例解析
人工智能·机器学习·chatgpt·论文·科研·deepseek
win4r14 小时前
🚀企业级最强开源大模型Qwen3震撼发布!本地部署+全面客观测评!Qwen3-235B-A22B+Qwen3-32B+Qwen3-14B谁是王者?ollama
llm·aigc·openai
掉鱼的猫16 小时前
qwen3 惊喜发布,用 ollama + solon ai (java) 尝个鲜
java·openai·deepseek
康斯坦丁师傅17 小时前
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1
aigc·openai
来自星星的坤20 小时前
如何优雅地解决AI生成内容粘贴到Word排版混乱的问题?
人工智能·chatgpt·word
新智元21 小时前
52 页 PPT,谷歌 Gemini 预训练负责人首次揭秘!扩展定律最优解
人工智能·openai
新智元21 小时前
深夜突袭,阿里 Qwen3 登顶全球开源王座!暴击 DeepSeek-R1,2 小时狂揽 17k 星
人工智能·openai
CF14年老兵1 天前
别被忽悠!从入门到年薪百万 AI 工程师的真实成长路径
python·aigc·openai
新加坡内哥谈技术1 天前
MCP:人工智能时代的HTTP?探索AI通信新标准
人工智能·自然语言处理·chatgpt
新智元2 天前
100 年企业知识超 10 万文件,「内网版 ChatGPT」血洗最卷行业!全员 70% 和 AI 共事
人工智能·openai