DeepSeek 节前突袭发布 V3.2-Exp:长文本推理成本直降75%!

刚传完节前会有更新,DeepSeek 傍晚就甩出 DeepSeek-V3.2-Exp ------ 这次直接把长文本推理成本砍掉四分之三

该版本是一个引入了 DeepSeek Sparse Attention(一种稀疏注意力机制)的实验性(Experimental)版本,主要针对长文本的训练和推理效率进行了探索性的优化和验证。

说白了,本次升级能力提升还在其次,但"提速降本"肯定拉满。

提速:稀疏注意力机制

传统的注意力机制是逐字逐句,通读全文,记住每个字与其他字的关系。

DSA稀疏注意力则是先看目录(全局关键token ),再仔细阅读重点部分(局部窗口),跳过无关内容。

这样 AI 在面对长文本时,可以大幅提升处理性能。

降本:费用减少3/4

由于新的架构升级,算力成本大幅降低,官方 API 价格直接跳水。

单张图可能不太直观,我们拿 V3.1V3.2 直接对比下。

计费项 V3.1 V3.2 降幅
输入(缓存命中) 0.5元 0.2元 60%
输入(未命中) 4元 2元 50%
输出 12元 3元 75%
典型场景成本 100万输入+50万输出≈10元 100万输入+50万输出≈2.5元 75%

结语

现在 DeepSeek 的所有环境都已经更新为 V3.2-Exp,虽然新版本已经在公开评测集上得到了验证,但大家使用的时候依然要谨慎。

好在,这次 DeepSeek 提供了旧版本接口的回滚 API,只需要把 API 改为如下接口即可。

ini 复制代码
base_url="https://api.deepseek.com/v3.1_terminus_expires_on_20251015"

注意:该接口仅保留到北京时间 2025 年 10 月 15 日 23:59

如果你的场景正好需要长文本处理,那就趁假期赶紧试试吧~

相关推荐
Coder_Boy_6 小时前
技术发展的核心规律是「加法打底,减法优化,重构平衡」
人工智能·spring boot·spring·重构
会飞的老朱8 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º10 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算
Codebee12 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º13 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys13 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_567813 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子13 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
智驱力人工智能13 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_1601448714 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能