【特别缅怀】在本期 AI Weekly 发布之际,沉痛悼念昨日逝世的杨振宁先生(1922-2025)。这位首位华人诺贝尔物理学奖得主,用一生探索宇宙的对称之美。谨此致敬。
📢 本周 AI 快讯 | 1 分钟速览🚀
1️⃣ 🧠 通义千问上线记忆功能 :Qwen Chat Memory
正式发布,基于万亿参数 Qwen3-Max
模型,可记住用户偏好和对话习惯,对标 ChatGPT 补齐体验短板。
2️⃣ ⚡ Manus 1.5 速度飙升 :Monica 推出 Manus 1.5
,任务执行速度提升 4 倍至 4 分钟内,新增无限上下文处理和一键生成全栈应用能力。
3️⃣ 📊 火山引擎市场霸主 :豆包大模型日均调用量破 30 万亿 Tokens,公有云市场份额达 49.2%,超阿里云和百度智能云总和。
4️⃣ 🔄 智谱 AI 组织调整 :产研中心十余人调整,从私有化交付转向 MaaS 平台化服务,为 IPO 盈利结构优化做准备。
5️⃣ 💾 ChatGPT 记忆自动管理 :OpenAI 推出自动记忆清理功能,智能保留相关信息,解决"memory full"困扰,Plus 和 Pro 用户可用。
6️⃣ 🔓 OpenAI 推成人模式 :12 月向成年用户开放成人内容生成,通过年龄验证系统把关,引发心理健康防护争议。
7️⃣ 💰 Claude Haiku 4.5 发布 :Anthropic 推出小型模型,性能接近 Sonnet 4
但价格仅为其 1/3,速度快 4-5 倍,支持扩展思考模式。
8️⃣ 🛠️ Claude Skills 对标 OpenAI AgentKit :Anthropic 推出 Skills 功能,支持动态加载和多技能协同,Rakuten 称工作效率提升 24 倍。
9️⃣ 🎬 谷歌 Veo 3.1 音视频同步 :首次实现原生音频生成,支持 60 秒 1080p 视频,Flow 平台已生成超 2.75 亿个视频。
🔟 🎯 HuggingChat Omni 智能路由 :基于 Arch-Router-1.5B
模型,从 115 个开源模型中自动选择最优解,准确率超 GPT-4 级别。
01|通义千问上线记忆功能,对标 ChatGPT 补齐体验短板
10 月 16 日,通义千问宣布 Qwen Chat Memory
正式上线,能够记住用户偏好、对话习惯及过往内容,并在后续对话中主动调用。该功能已通过 chat.qwen.ai 向所有用户开放,无需额外设置。这是国产 AI 在产品体验层面追赶国际竞品的关键一步------ChatGPT、Gemini、Grok 等产品已在今年 4 月前后陆续上线类似功能。

该功能基于上月发布的 Qwen3-Max
模型(参数超 1 万亿,预训练 36 万亿 Tokens),能自动识别并保存关键信息,减少用户重复说明背景的次数。值得注意的是,字节跳动旗下豆包也在 10 月 10 日更新隐私政策并上线记忆功能 FAQ 页面,显示国内厂商正同步发力长期对话体验。用户可随时删除或管理记忆内容以保护隐私。
02|Manus 1.5 发布:任务执行速度提升 4 倍,可一键生成全栈应用
10 月 16 日,中国 AI 创业公司 Monica 推出 Manus 1.5
,这款被称为"全球首个通用 AI Agent"的产品迎来重大升级。最亮眼的是速度提升------平均任务完成时间从 15 分钟骤降至 4 分钟以内,提速近 4 倍。新版本引入"无限上下文"处理能力,能在庞大信息量和复杂工作流中保持连贯性。另一核心亮点是其全栈应用开发能力:用户一句话描述,Manus 1.5
就能自动生成包含后端、数据库、用户认证的完整 Web 应用,还内置浏览器进行自动测试和修复。

Monica 同时推出两个版本:Manus-1.5
完整版(订阅用户)和 Manus-1.5-Lite
轻量版(所有用户),后者每天提供一次免费任务。内部基准测试显示任务质量提升 15%,用户满意度提升 6%。值得注意的是,Monica 团队此前因开发浏览器插件 AI 助手在海外积累千万用户,这次 Manus 虽主打英文市场,但在中文互联网引发更大反响。今年 3 月首发时,Manus 曾因"邀请码难求"和实测效果争议陷入"套壳"质疑,此次大版本更新能否扭转口碑,仍待市场检验。
03|火山引擎豆包日均调用量破 30 万亿 Tokens,公有云市场份额近半
IDC 最新报告显示,2025 年上半年中国公有云大模型服务市场中,火山引擎以 49.2% 的市场份额位居第一,阿里云和百度智能云分别占 27%、17%------火山引擎一家份额已超后两者总和。同期披露数据显示,截至 9 月底,豆包大模型日均 Tokens 调用量突破 30 万亿,相比去年 5 月的 1200 亿增长 253 倍。IDC 统计口径为云厂商对外部客户提供的服务调用量,不含字节系自有产品消耗。

同期,火山引擎全新发布并升级四款豆包大模型:豆包大模型 1.6
升级版原生支持四档思考长度调节,是国内首个支持该功能的模型,可在效果、时延与成本之间实现平衡;豆包大模型 1.6 Lite
更轻量且性价比更高;豆包语音合成模型 2.0
与 声音复刻模型 2.0
能理解情感、调节音调风格,并可准确朗读公式。
04|智谱 AI 回应"部门解散":组织调整涉及十余人,聚焦 MaaS 战略转型
10 月 17 日,针对"产研中心 60 人团队解散"传闻,智谱 AI 向第一财经回应称,目前公司产品和研发相关部门运转正常,组织调整涉及人员十余人。据蓝鲸新闻报道,9 月 23 日智谱商业化部门旗下产研中心确实进行调整,原 60 人团队一半离职、一半分流至交付部门,赔偿标准为 N+1。接近智谱人士透露,此次调整主要围绕 MaaS(Model-as-a-Service)战略转型展开------从原先偏重人力的私有化交付模式,转向更轻量的平台化服务。

有意思的是,就在 10 月 10 日智谱刚发布 47 个热招岗位,包括多模态算法工程师、Agent 产品经理等核心职位,显示公司在优化结构的同时仍在扩充关键技术团队。作为"AI 六小龙"中首家启动 IPO 流程的公司,智谱原计划 10 月完成上市辅导,最早 2026 年登陆 A 股。此前公司已完成超 10 轮融资,最新估值达 400 亿元,投资方包括美团、阿里、腾讯等互联网巨头及多地国资。这次 IPO 前的组织调整,更像是为盈利结构优化做准备。
05|ChatGPT 升级记忆管理,自动清理冗余信息
10 月 16 日,OpenAI 宣布 ChatGPT 推出自动记忆管理功能,彻底解决困扰用户的"memory full"提示。新系统会自动保持最相关细节的优先级,将次要信息移至后台,防止记忆容量达到上限。系统会根据信息的时效性和话题频率等因素决定保留哪些记忆,旧的或未使用的记忆将被自动删除。此外,用户现在可以搜索保存的记忆,并按最新或最旧排序查看,还能在设置中查看当前优先记忆并手动调整特定记忆的优先级。

该功能目前面向 Plus 和 Pro 用户开放,用户仍保持完全控制权,可通过聊天要求 ChatGPT 记住或忘记信息,也可在设置中查看和删除特定记忆。值得注意的是,ChatGPT 的记忆功能现在分为两部分:用户明确要求记住的"保存记忆"与从过往聊天中自动提炼洞察的"聊天历史"。
06|OpenAI 宣布 12 月向成年用户推出 ChatGPT "成人模式"
10 月 14 日,OpenAI CEO Sam Altman 宣布,将于 12 月向通过年龄验证的成年用户开放成人内容生成功能。此前,ChatGPT 对此类内容设置了严格限制。Sam Altman 称,此举是为了防范心理健康风险,但现有策略让无相关问题的用户感到过度受限。OpenAI 表示,已开发新工具以缓解心理健康隐患,从而能在安全前提下放松限制。年龄验证将通过自动预测系统实现,若发生误判,用户需上传身份证件完成验证。

今年 8 月,OpenAI 曾因青少年自杀诉讼而加强心理健康防护措施,包括阻止涉及自杀与自残的对话。仅两个月后便宣布放松限制,引发业界质疑其是否过早宣称"已解决心理健康问题"。竞争压力或是关键推动因素之一------Elon Musk 旗下 xAI 的 Grok 已提供类似功能,Character.AI 等平台也凭此吸引了大量用户(日均使用时长 2 小时)。OpenAI 同时宣布成立 8 人专家委员会,为 AI 心理健康影响提供长期建议,但尚未披露具体安全措施细节。
07|Anthropic 发布 Claude Haiku 4.5,性能接近 Sonnet 4 但价格仅为 1/3
10 月 15 日,Anthropic 推出小型模型 Claude Haiku 4.5
,定价为 1 美元 / 百万输入 Tokens 和 5 美元 / 百万输出 Tokens,仅为 Sonnet 4.5
(3 美元 / 15 美元)的三分之一。官方基准测试显示,其在 SWE-bench Verified 测试中得分 73.3%,略高于此前的 Sonnet 4
(72.7%),在部分计算机操作任务中甚至超过 Sonnet 4
。速度方面比 Sonnet 4.5
快 4--5 倍,适合需要低延迟的实时场景,如客服、编程辅助等。

该模型是 Haiku 系列首个支持扩展思考模式的版本,支持 20 万 Tokens 上下文。Anthropic 建议在多智能体系统中,将 Sonnet 4.5
作为主控,由多个 Haiku 4.5
子智能体并行处理子任务以提升效率。模型已通过 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 立即可用。不过,相比 OpenAI 的 GPT-5 Nano
(0.05 美元 / 0.40 美元)和 Gemini 2.5 Flash Lite
(0.1 美元 / 0.4 美元),Haiku 4.5
的价格仍高出 10--20 倍。
08|Anthropic 推出 Skills 功能:Claude 正面对标 OpenAI AgentKit
10 月 16 日,就在 OpenAI 发布 AgentKit 工具包 10 天后,Anthropic 立即跟进推出 Claude Skills 功能。Skills 本质是包含指令、脚本和资源的文件夹,Claude 在执行任务时按需动态加载,无需手动选择。这项功能已向 Pro、Max、Team 和 Enterprise 付费用户开放,内置 PDF、Word、Excel、PPT 等文档创建能力,用户可创建自定义 Skills 来适配企业品牌规范或专业工作流。

Skills 的核心优势在于"可组合性"------多个 Skills 可自动协同工作,且采用"渐进式披露" 机制,仅在需要时加载相关技能,避免无关 token 消耗。早期用户反馈亮眼:Rakuten 表示"原本需要 1 天的工作,现在 1 小时完成",Notion 则称"结果更可预测,减少了反复调整提示词"。不过 Anthropic 特别提醒,Skills 具备代码执行权限,用户应仅安装来自可信来源的 Skills,避免潜在安全风险。
09|谷歌发布 Veo 3.1 视频模型,首次实现视频与音频同步生成
10 月 15 日,谷歌推出视频生成模型 Veo 3.1
,首次支持原生音频生成,可自动为视频添加环境音、对话和音效,实现视听同步。相比 5 月发布的 Veo 3
,新版本在纹理真实感、叙事控制和提示词理解上显著提升,支持生成最长 60 秒的 1080p 横竖屏视频。定价为 Fast 版 0.15 美元 / 秒和 Standard 版 0.40 美元 / 秒,已集成至 Flow 平台、Gemini API、Vertex AI 和 Gemini 应用。

Flow 平台同步更新编辑工具,新增 Insert 功能,可向场景插入物体并自动调整光影与阴影;Remove 功能(即将上线)可无痕移除元素。用户可通过"Ingredients to Video"使用多张参考图定义角色和场景风格,"Frames to Video"生成首尾帧之间的流畅过渡,"Extend"功能则可基于末尾帧延展视频至 1 分钟以上。自 5 月推出以来,Flow 已生成超 2.75 亿个视频。此次升级直接对标 OpenAI,Promise Studios 和 Latitude 等创作平台已开始将 Veo 3.1
集成至故事板预览和交互叙事引擎中。
10|HuggingChat Omni 发布:智能路由从 115 个开源模型中挑选最优解
10 月 16 日,Hugging Face 发布 HuggingChat Omni
,这是一个智能路由系统,能根据用户查询内容自动从 115 个开源模型中选择最合适的一个来回答。系统基于 Katanemo 的 Arch-Router-1.5B
轻量级路由模型,仅用 15 亿参数就能精准分析查询的领域和任务类型,实现类似 OpenAI 新模型路由的效果。支持的模型包括 DeepSeek-V3
、Qwen
系列、Llama
系列等主流开源模型,覆盖代码生成、数学推理、多语言对话等场景。

实测显示,路由选择准确率超过 GPT-4
级别模型,而且完全开源可自定义路由策略。用户可以选择让系统自动挑选(Omni 模式),也可以手动指定具体模型。Hugging Face 联合创始人 Clément Delangue 表示这只是开始,平台已有超过 200 万个开源模型,未来将扩展到图像、音频、视频等多模态领域。目前已在 huggingface.co/chat 上线,免费使用。
我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。
相信 AI 是普通人的"外挂",致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。
欢迎关注"AI信息Gap",用 AI 为你的未来加速。