阿里千问上线记忆，Manus 1.5 全栈升级，ChatGPT 将推成人模式！| AI Weekly 10.13-10.19

【特别缅怀】在本期 AI Weekly 发布之际，沉痛悼念昨日逝世的杨振宁先生（1922-2025）。这位首位华人诺贝尔物理学奖得主，用一生探索宇宙的对称之美。谨此致敬。

📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🧠 通义千问上线记忆功能 ：Qwen Chat Memory 正式发布，基于万亿参数 Qwen3-Max 模型，可记住用户偏好和对话习惯，对标 ChatGPT 补齐体验短板。

2️⃣ ⚡ Manus 1.5 速度飙升 ：Monica 推出 Manus 1.5，任务执行速度提升 4 倍至 4 分钟内，新增无限上下文处理和一键生成全栈应用能力。

3️⃣ 📊 火山引擎市场霸主 ：豆包大模型日均调用量破 30 万亿 Tokens，公有云市场份额达 49.2%，超阿里云和百度智能云总和。

4️⃣ 🔄 智谱 AI 组织调整 ：产研中心十余人调整，从私有化交付转向 MaaS 平台化服务，为 IPO 盈利结构优化做准备。

5️⃣ 💾 ChatGPT 记忆自动管理 ：OpenAI 推出自动记忆清理功能，智能保留相关信息，解决"memory full"困扰，Plus 和 Pro 用户可用。

6️⃣ 🔓 OpenAI 推成人模式 ：12 月向成年用户开放成人内容生成，通过年龄验证系统把关，引发心理健康防护争议。

7️⃣ 💰 Claude Haiku 4.5 发布 ：Anthropic 推出小型模型，性能接近 Sonnet 4 但价格仅为其 1/3，速度快 4-5 倍，支持扩展思考模式。

8️⃣ 🛠️ Claude Skills 对标 OpenAI AgentKit ：Anthropic 推出 Skills 功能，支持动态加载和多技能协同，Rakuten 称工作效率提升 24 倍。

9️⃣ 🎬 谷歌 Veo 3.1 音视频同步 ：首次实现原生音频生成，支持 60 秒 1080p 视频，Flow 平台已生成超 2.75 亿个视频。

🔟 🎯 HuggingChat Omni 智能路由 ：基于 Arch-Router-1.5B 模型，从 115 个开源模型中自动选择最优解，准确率超 GPT-4 级别。

01｜通义千问上线记忆功能，对标 ChatGPT 补齐体验短板

10 月 16 日，通义千问宣布 Qwen Chat Memory 正式上线，能够记住用户偏好、对话习惯及过往内容，并在后续对话中主动调用。该功能已通过 chat.qwen.ai 向所有用户开放，无需额外设置。这是国产 AI 在产品体验层面追赶国际竞品的关键一步------ChatGPT、Gemini、Grok 等产品已在今年 4 月前后陆续上线类似功能。

该功能基于上月发布的 Qwen3-Max 模型（参数超 1 万亿，预训练 36 万亿 Tokens），能自动识别并保存关键信息，减少用户重复说明背景的次数。值得注意的是，字节跳动旗下豆包也在 10 月 10 日更新隐私政策并上线记忆功能 FAQ 页面，显示国内厂商正同步发力长期对话体验。用户可随时删除或管理记忆内容以保护隐私。

02｜Manus 1.5 发布：任务执行速度提升 4 倍，可一键生成全栈应用

10 月 16 日，中国 AI 创业公司 Monica 推出 Manus 1.5，这款被称为"全球首个通用 AI Agent"的产品迎来重大升级。最亮眼的是速度提升------平均任务完成时间从 15 分钟骤降至 4 分钟以内，提速近 4 倍。新版本引入"无限上下文"处理能力，能在庞大信息量和复杂工作流中保持连贯性。另一核心亮点是其全栈应用开发能力：用户一句话描述，Manus 1.5 就能自动生成包含后端、数据库、用户认证的完整 Web 应用，还内置浏览器进行自动测试和修复。

Monica 同时推出两个版本：Manus-1.5 完整版（订阅用户）和 Manus-1.5-Lite 轻量版（所有用户），后者每天提供一次免费任务。内部基准测试显示任务质量提升 15%，用户满意度提升 6%。值得注意的是，Monica 团队此前因开发浏览器插件 AI 助手在海外积累千万用户，这次 Manus 虽主打英文市场，但在中文互联网引发更大反响。今年 3 月首发时，Manus 曾因"邀请码难求"和实测效果争议陷入"套壳"质疑，此次大版本更新能否扭转口碑，仍待市场检验。

03｜火山引擎豆包日均调用量破 30 万亿 Tokens，公有云市场份额近半

IDC 最新报告显示，2025 年上半年中国公有云大模型服务市场中，火山引擎以 49.2% 的市场份额位居第一，阿里云和百度智能云分别占 27%、17%------火山引擎一家份额已超后两者总和。同期披露数据显示，截至 9 月底，豆包大模型日均 Tokens 调用量突破 30 万亿，相比去年 5 月的 1200 亿增长 253 倍。IDC 统计口径为云厂商对外部客户提供的服务调用量，不含字节系自有产品消耗。

同期，火山引擎全新发布并升级四款豆包大模型：豆包大模型 1.6 升级版原生支持四档思考长度调节，是国内首个支持该功能的模型，可在效果、时延与成本之间实现平衡；豆包大模型 1.6 Lite 更轻量且性价比更高；豆包语音合成模型 2.0 与 声音复刻模型 2.0 能理解情感、调节音调风格，并可准确朗读公式。

04｜智谱 AI 回应"部门解散"：组织调整涉及十余人，聚焦 MaaS 战略转型

10 月 17 日，针对"产研中心 60 人团队解散"传闻，智谱 AI 向第一财经回应称，目前公司产品和研发相关部门运转正常，组织调整涉及人员十余人。据蓝鲸新闻报道，9 月 23 日智谱商业化部门旗下产研中心确实进行调整，原 60 人团队一半离职、一半分流至交付部门，赔偿标准为 N+1。接近智谱人士透露，此次调整主要围绕 MaaS（Model-as-a-Service）战略转型展开------从原先偏重人力的私有化交付模式，转向更轻量的平台化服务。

有意思的是，就在 10 月 10 日智谱刚发布 47 个热招岗位，包括多模态算法工程师、Agent 产品经理等核心职位，显示公司在优化结构的同时仍在扩充关键技术团队。作为"AI 六小龙"中首家启动 IPO 流程的公司，智谱原计划 10 月完成上市辅导，最早 2026 年登陆 A 股。此前公司已完成超 10 轮融资，最新估值达 400 亿元，投资方包括美团、阿里、腾讯等互联网巨头及多地国资。这次 IPO 前的组织调整，更像是为盈利结构优化做准备。

05｜ChatGPT 升级记忆管理，自动清理冗余信息

10 月 16 日，OpenAI 宣布 ChatGPT 推出自动记忆管理功能，彻底解决困扰用户的"memory full"提示。新系统会自动保持最相关细节的优先级，将次要信息移至后台，防止记忆容量达到上限。系统会根据信息的时效性和话题频率等因素决定保留哪些记忆，旧的或未使用的记忆将被自动删除。此外，用户现在可以搜索保存的记忆，并按最新或最旧排序查看，还能在设置中查看当前优先记忆并手动调整特定记忆的优先级。

该功能目前面向 Plus 和 Pro 用户开放，用户仍保持完全控制权，可通过聊天要求 ChatGPT 记住或忘记信息，也可在设置中查看和删除特定记忆。值得注意的是，ChatGPT 的记忆功能现在分为两部分：用户明确要求记住的"保存记忆"与从过往聊天中自动提炼洞察的"聊天历史"。

06｜OpenAI 宣布 12 月向成年用户推出 ChatGPT "成人模式"

10 月 14 日，OpenAI CEO Sam Altman 宣布，将于 12 月向通过年龄验证的成年用户开放成人内容生成功能。此前，ChatGPT 对此类内容设置了严格限制。Sam Altman 称，此举是为了防范心理健康风险，但现有策略让无相关问题的用户感到过度受限。OpenAI 表示，已开发新工具以缓解心理健康隐患，从而能在安全前提下放松限制。年龄验证将通过自动预测系统实现，若发生误判，用户需上传身份证件完成验证。

今年 8 月，OpenAI 曾因青少年自杀诉讼而加强心理健康防护措施，包括阻止涉及自杀与自残的对话。仅两个月后便宣布放松限制，引发业界质疑其是否过早宣称"已解决心理健康问题"。竞争压力或是关键推动因素之一------Elon Musk 旗下 xAI 的 Grok 已提供类似功能，Character.AI 等平台也凭此吸引了大量用户（日均使用时长 2 小时）。OpenAI 同时宣布成立 8 人专家委员会，为 AI 心理健康影响提供长期建议，但尚未披露具体安全措施细节。

07｜Anthropic 发布 Claude Haiku 4.5，性能接近 Sonnet 4 但价格仅为 1/3

10 月 15 日，Anthropic 推出小型模型 Claude Haiku 4.5，定价为 1 美元 / 百万输入 Tokens 和 5 美元 / 百万输出 Tokens，仅为 Sonnet 4.5（3 美元 / 15 美元）的三分之一。官方基准测试显示，其在 SWE-bench Verified 测试中得分 73.3%，略高于此前的 Sonnet 4（72.7%），在部分计算机操作任务中甚至超过 Sonnet 4。速度方面比 Sonnet 4.5 快 4--5 倍，适合需要低延迟的实时场景，如客服、编程辅助等。

该模型是 Haiku 系列首个支持扩展思考模式的版本，支持 20 万 Tokens 上下文。Anthropic 建议在多智能体系统中，将 Sonnet 4.5 作为主控，由多个 Haiku 4.5 子智能体并行处理子任务以提升效率。模型已通过 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 立即可用。不过，相比 OpenAI 的 GPT-5 Nano（0.05 美元 / 0.40 美元）和 Gemini 2.5 Flash Lite（0.1 美元 / 0.4 美元），Haiku 4.5 的价格仍高出 10--20 倍。

08｜Anthropic 推出 Skills 功能：Claude 正面对标 OpenAI AgentKit

10 月 16 日，就在 OpenAI 发布 AgentKit 工具包 10 天后，Anthropic 立即跟进推出 Claude Skills 功能。Skills 本质是包含指令、脚本和资源的文件夹，Claude 在执行任务时按需动态加载，无需手动选择。这项功能已向 Pro、Max、Team 和 Enterprise 付费用户开放，内置 PDF、Word、Excel、PPT 等文档创建能力，用户可创建自定义 Skills 来适配企业品牌规范或专业工作流。

Skills 的核心优势在于"可组合性"------多个 Skills 可自动协同工作，且采用"渐进式披露" 机制，仅在需要时加载相关技能，避免无关 token 消耗。早期用户反馈亮眼：Rakuten 表示"原本需要 1 天的工作，现在 1 小时完成"，Notion 则称"结果更可预测，减少了反复调整提示词"。不过 Anthropic 特别提醒，Skills 具备代码执行权限，用户应仅安装来自可信来源的 Skills，避免潜在安全风险。

09｜谷歌发布 Veo 3.1 视频模型，首次实现视频与音频同步生成

10 月 15 日，谷歌推出视频生成模型 Veo 3.1，首次支持原生音频生成，可自动为视频添加环境音、对话和音效，实现视听同步。相比 5 月发布的 Veo 3，新版本在纹理真实感、叙事控制和提示词理解上显著提升，支持生成最长 60 秒的 1080p 横竖屏视频。定价为 Fast 版 0.15 美元 / 秒和 Standard 版 0.40 美元 / 秒，已集成至 Flow 平台、Gemini API、Vertex AI 和 Gemini 应用。

Flow 平台同步更新编辑工具，新增 Insert 功能，可向场景插入物体并自动调整光影与阴影；Remove 功能（即将上线）可无痕移除元素。用户可通过"Ingredients to Video"使用多张参考图定义角色和场景风格，"Frames to Video"生成首尾帧之间的流畅过渡，"Extend"功能则可基于末尾帧延展视频至 1 分钟以上。自 5 月推出以来，Flow 已生成超 2.75 亿个视频。此次升级直接对标 OpenAI，Promise Studios 和 Latitude 等创作平台已开始将 Veo 3.1 集成至故事板预览和交互叙事引擎中。

10｜HuggingChat Omni 发布：智能路由从 115 个开源模型中挑选最优解

10 月 16 日，Hugging Face 发布 HuggingChat Omni，这是一个智能路由系统，能根据用户查询内容自动从 115 个开源模型中选择最合适的一个来回答。系统基于 Katanemo 的 Arch-Router-1.5B 轻量级路由模型，仅用 15 亿参数就能精准分析查询的领域和任务类型，实现类似 OpenAI 新模型路由的效果。支持的模型包括 DeepSeek-V3、Qwen 系列、Llama 系列等主流开源模型，覆盖代码生成、数学推理、多语言对话等场景。

实测显示，路由选择准确率超过 GPT-4 级别模型，而且完全开源可自定义路由策略。用户可以选择让系统自动挑选（Omni 模式），也可以手动指定具体模型。Hugging Face 联合创始人 Clément Delangue 表示这只是开始，平台已有超过 200 万个开源模型，未来将扩展到图像、音频、视频等多模态领域。目前已在 huggingface.co/chat 上线，免费使用。

我是木易，一个专注 AI 领域的技术产品经理，国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的"外挂"，致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注"AI信息Gap"，用 AI 为你的未来加速。