DeepSeek 节前突袭发布 V3.2-Exp:长文本推理成本直降75%!

刚传完节前会有更新,DeepSeek 傍晚就甩出 DeepSeek-V3.2-Exp ------ 这次直接把长文本推理成本砍掉四分之三

该版本是一个引入了 DeepSeek Sparse Attention(一种稀疏注意力机制)的实验性(Experimental)版本,主要针对长文本的训练和推理效率进行了探索性的优化和验证。

说白了,本次升级能力提升还在其次,但"提速降本"肯定拉满。

提速:稀疏注意力机制

传统的注意力机制是逐字逐句,通读全文,记住每个字与其他字的关系。

DSA稀疏注意力则是先看目录(全局关键token ),再仔细阅读重点部分(局部窗口),跳过无关内容。

这样 AI 在面对长文本时,可以大幅提升处理性能。

降本:费用减少3/4

由于新的架构升级,算力成本大幅降低,官方 API 价格直接跳水。

单张图可能不太直观,我们拿 V3.1V3.2 直接对比下。

计费项 V3.1 V3.2 降幅
输入(缓存命中) 0.5元 0.2元 60%
输入(未命中) 4元 2元 50%
输出 12元 3元 75%
典型场景成本 100万输入+50万输出≈10元 100万输入+50万输出≈2.5元 75%

结语

现在 DeepSeek 的所有环境都已经更新为 V3.2-Exp,虽然新版本已经在公开评测集上得到了验证,但大家使用的时候依然要谨慎。

好在,这次 DeepSeek 提供了旧版本接口的回滚 API,只需要把 API 改为如下接口即可。

ini 复制代码
base_url="https://api.deepseek.com/v3.1_terminus_expires_on_20251015"

注意:该接口仅保留到北京时间 2025 年 10 月 15 日 23:59

如果你的场景正好需要长文本处理,那就趁假期赶紧试试吧~

相关推荐
小鸡吃米…7 分钟前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫1 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)1 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan1 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维1 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS1 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd1 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟2 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然2 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~2 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1