AI洞察 | DeepSeek-V3.1发布,自进化智能体诞生!

欢迎关注微信公众号:科技洞察者 📌

今天,我们将深入探讨三款前沿 AI 技术:深度求索的 DeepSeek-V3.1 模型、字节跳动的 Seed-OSS-36B 开源大模型,以及中科院等机构的自进化编程智能体 SE-Agent,它们共同描绘了 AI 智能体与大模型技术的新图景。

DeepSeek-V3.1:迈向 Agent 时代的混合推理新范式

深度求索科技有限公司近期发布了其最新 AI 模型 DeepSeek-V3.1,标志着公司向 Agent 时代迈出的重要一步。这款模型旨在为用户提供一个更加强大、高效且多功能的人工智能解决方案。

混合推理与效率革新

DeepSeek-V3.1 最核心的创新在于引入了混合推理架构,使其能够同时支持思考模式(Think)与非思考模式。

在思考模式下,DeepSeek-V3.1-Think 相较于旧版模型显著提高了思考效率,能在更短时间内给出答案。通过后训练优化,新模型在工具使用和智能体任务中的表现也得到了大幅提升,尤其在需要多步推理的复杂搜索测试和多学科专家级难题测试中表现突出。

V3.1-Think 在输出 token 减少 20%-50%的情况下,各项任务平均表现与旧版持平;非思考模式下,V3.1 也能有效控制输出长度并保持相同模型性能。

API 与生态整合

模型已同步升级至官方 App 和网页端,用户可便捷地在思考与非思考模式间切换。

DeepSeek API 也进行了同步升级,其中deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文容量已扩展至128K 。API Beta 接口还新增了对strict模式的 Function Calling 支持,并增强了对 Anthropic API 格式的支持,便于开发者将其能力接入 Claude Code 框架,进一步降低了开发门槛。

官方文档:

api-docs.deepseek.com/zh-cn/guide...

api-docs.deepseek.com/zh-cn/guide...

开源与未来展望

为推动技术开源与共享,DeepSeek-V3.1 的 Base 模型已在 Huggingface 和魔搭平台开源,该 Base 模型在 V3 基础上增加了 840B tokens 的训练量。此外,深度求索宣布自 2025 年 9 月 6 日起调整 DeepSeek 开放平台 API 接口调用价格,在此之前仍按原价格政策计费,并进一步扩容 API 服务资源以满足用户需求。

HuggingFace:

huggingface.co/deepseek-ai...

huggingface.co/deepseek-ai...

ModelScope:

modelscope.cn/models/deep...

modelscope.cn/models/deep...

Seed-OSS-36B:字节跳动开源大模型,长上下文能力瞩目

字节跳动旗下的 Seed 团队近日在 Hugging Face 上发布了全新的开源大型语言模型 Seed-OSS-36B,该模型专注于高级推理和开发者友好性。

超长上下文的突破

Seed-OSS-36B 最显著的特点是支持处理长达512,000 个 token的输入文本,这一能力远超当前市场上的主要竞争产品,为处理超长文档、代码库或对话历史提供了前所未有的可能性。

多版本与开源策略

Seed-OSS-36B 系列包含三个主要变体:用于通用目的的 Seed-OSS-36B-Base(含合成数据)、为研究提供纯粹基础的 Seed-OSS-36B-Base(不含合成数据),以及专注于任务执行和指令遵循的 Seed-OSS-36B-Instruct。

所有模型均采用Apache-2.0 许可协议,允许用户免费使用、修改和重新分发,这标志着中国公司在开源模型领域的又一重要进展。该模型拥有 360 亿参数和 64 层架构,并在多项基准测试中表现出色,尤其在数学和编程任务上取得了领先成绩。

开发者友好与易用性

Seed 团队还特别关注模型的可访问性,支持通过 Hugging Face Transformers 进行部署,并提供 4 位和 8 位量化格式以减少内存需求,同时提供推理、提示自定义和工具集成脚本,大大降低了小团队的操作门槛。

通过提供高性能且灵活部署的开放模型,字节跳动的 Seed 团队为企业、研究人员和开发者带来了新的选择。

GitHub:github.com/ByteDance-S...

HuggingFace:huggingface.co/collections...

SE-Agent:自进化智能体,改写 AI 编程新篇章

由中科院、清华大学和阶跃星辰等机构联合开发的 SE-Agent,是一款革命性的自进化智能体,旨在解决传统 AI 编程智能体重复错误、思维僵化且易陷入局部最优解的痛点。

达尔文式的"三位一体"进化机制

SE-Agent 将达尔文进化论的精髓融入算法设计,其核心在于 "修订(Revision)、重组(Reorganization)、精炼(Refinement)" 的"三位一体"进化机制:通过修订操作进行深度自省和改进,重组操作促进知识跨界融合,以及精炼操作进行严格评估以优胜劣汰。

这种机制使智能体能够自主学习和持续改进,显著减少了达到最优解所需的迭代次数。

编程能力的新标杆

在编程界权威的 SWE-Bench Verified 基准测试中,SE-Agent 展现出突破性成果,使 Claude-3.7-Sonnet 模型的解题成功率提升20.6% ,首次尝试成功率更是达到创纪录的61.2%,刷新了该领域历史纪录。

这不仅突破了 Claude-4 模型的编程瓶颈,还在开源社区创造了 SOTA 新纪录,标志着 AI 编程思维模式的根本性变革。

赋能未来 AI 发展

SE-Agent 以更高的智能化水平,实现了效率与质量的双重提升,为复杂推理能力开辟了新空间,证明了智能体协同工作的巨大潜力,并为通用人工智能(AGI)发展指明方向。

项目团队计划将此自进化思想扩展到强化学习和智能规划等前沿领域。SE-Agent 的开源将赋能全球开发者,共同推动人工智能编程边界的拓展,预示着一个智能体能够自主学习和持续改进的新时代到来。

团队主页:quantaalpha.github.io/

GitHub:github.com/JARVIS-Xs/S...
如果对你有帮助的话,请点赞、分享。关注微信公众号 科技洞察者,第一时间获取 前沿科技讯息,还有 数字人播客、演示视频 等丰富内容,我们下期再见。

相关推荐
DigitalOcean10 小时前
DeepSeek 推理接近 4 倍提速,这家 AI 推理云是怎么做到的?
gpt·claude·deepseek
小星AI10 小时前
Claude Code Agent SDK 从入门到精通,一步到位
人工智能·agent·cursor
沅柠-AI营销11 小时前
小品牌的GEO优化落地策略:2026年AI搜索时代的低成本突围指南
人工智能·agent·ai搜索优化·geo优化·品牌策略·中小品牌营销·geo优化技巧
薛定谔的猫36911 小时前
深度解析:大语言模型 (LLM) Agent 的架构与演进趋势
ai·llm·agent·技术趋势·artificial intelligence
louisliao_198111 小时前
Agent 项目落地模板
agent
阿瑞说项目管理11 小时前
2026 实战入门指南:企业 Agent 到底能解决哪些工作问题?
大数据·人工智能·agent·智能体·企业级ai
han_11 小时前
一篇看懂国内外主流大模型:GPT、Claude、Gemini、DeepSeek、通义千问有什么区别?
前端·人工智能·llm
懷淰メ12 小时前
【AI加持】基于PyQt+YOLO+DeepSeek的钢材焊接缺陷检测系统(详细介绍)
yolo·目标检测·计算机视觉·pyqt·缺陷检测·deepseek·钢材缺陷
阿瑞说项目管理12 小时前
2026 智造升级:制造企业 Agent 从 0 到 1 落地指南,五大场景拆解实战路径
人工智能·agent·智能体·企业级ai
程序员鱼皮13 小时前
我用 DeepSeek V4 + Claude Code 开发了个「提肛助手」,这波给我爽麻了。。。
ai·程序员·编程·ai编程·deepseek