阿里千问上线记忆,Manus 1.5 全栈升级,ChatGPT 将推成人模式!| AI Weekly 10.13-10.19

【特别缅怀】在本期 AI Weekly 发布之际,沉痛悼念昨日逝世的杨振宁先生(1922-2025)。这位首位华人诺贝尔物理学奖得主,用一生探索宇宙的对称之美。谨此致敬。

📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🧠 通义千问上线记忆功能Qwen Chat Memory 正式发布,基于万亿参数 Qwen3-Max 模型,可记住用户偏好和对话习惯,对标 ChatGPT 补齐体验短板。

2️⃣ ⚡ Manus 1.5 速度飙升 :Monica 推出 Manus 1.5,任务执行速度提升 4 倍至 4 分钟内,新增无限上下文处理和一键生成全栈应用能力。

3️⃣ 📊 火山引擎市场霸主 :豆包大模型日均调用量破 30 万亿 Tokens,公有云市场份额达 49.2%,超阿里云和百度智能云总和。

4️⃣ 🔄 智谱 AI 组织调整 :产研中心十余人调整,从私有化交付转向 MaaS 平台化服务,为 IPO 盈利结构优化做准备。

5️⃣ 💾 ChatGPT 记忆自动管理 :OpenAI 推出自动记忆清理功能,智能保留相关信息,解决"memory full"困扰,Plus 和 Pro 用户可用。

6️⃣ 🔓 OpenAI 推成人模式 :12 月向成年用户开放成人内容生成,通过年龄验证系统把关,引发心理健康防护争议。

7️⃣ 💰 Claude Haiku 4.5 发布 :Anthropic 推出小型模型,性能接近 Sonnet 4 但价格仅为其 1/3,速度快 4-5 倍,支持扩展思考模式。

8️⃣ 🛠️ Claude Skills 对标 OpenAI AgentKit :Anthropic 推出 Skills 功能,支持动态加载和多技能协同,Rakuten 称工作效率提升 24 倍。

9️⃣ 🎬 谷歌 Veo 3.1 音视频同步 :首次实现原生音频生成,支持 60 秒 1080p 视频,Flow 平台已生成超 2.75 亿个视频。

🔟 🎯 HuggingChat Omni 智能路由 :基于 Arch-Router-1.5B 模型,从 115 个开源模型中自动选择最优解,准确率超 GPT-4 级别。


01|通义千问上线记忆功能,对标 ChatGPT 补齐体验短板

10 月 16 日,通义千问宣布 Qwen Chat Memory 正式上线,能够记住用户偏好、对话习惯及过往内容,并在后续对话中主动调用。该功能已通过 chat.qwen.ai 向所有用户开放,无需额外设置。这是国产 AI 在产品体验层面追赶国际竞品的关键一步------ChatGPT、Gemini、Grok 等产品已在今年 4 月前后陆续上线类似功能。

该功能基于上月发布的 Qwen3-Max 模型(参数超 1 万亿,预训练 36 万亿 Tokens),能自动识别并保存关键信息,减少用户重复说明背景的次数。值得注意的是,字节跳动旗下豆包也在 10 月 10 日更新隐私政策并上线记忆功能 FAQ 页面,显示国内厂商正同步发力长期对话体验。用户可随时删除或管理记忆内容以保护隐私。


02|Manus 1.5 发布:任务执行速度提升 4 倍,可一键生成全栈应用

10 月 16 日,中国 AI 创业公司 Monica 推出 Manus 1.5,这款被称为"全球首个通用 AI Agent"的产品迎来重大升级。最亮眼的是速度提升------平均任务完成时间从 15 分钟骤降至 4 分钟以内,提速近 4 倍。新版本引入"无限上下文"处理能力,能在庞大信息量和复杂工作流中保持连贯性。另一核心亮点是其全栈应用开发能力:用户一句话描述,Manus 1.5 就能自动生成包含后端、数据库、用户认证的完整 Web 应用,还内置浏览器进行自动测试和修复。

Monica 同时推出两个版本:Manus-1.5 完整版(订阅用户)和 Manus-1.5-Lite 轻量版(所有用户),后者每天提供一次免费任务。内部基准测试显示任务质量提升 15%,用户满意度提升 6%。值得注意的是,Monica 团队此前因开发浏览器插件 AI 助手在海外积累千万用户,这次 Manus 虽主打英文市场,但在中文互联网引发更大反响。今年 3 月首发时,Manus 曾因"邀请码难求"和实测效果争议陷入"套壳"质疑,此次大版本更新能否扭转口碑,仍待市场检验。


03|火山引擎豆包日均调用量破 30 万亿 Tokens,公有云市场份额近半

IDC 最新报告显示,2025 年上半年中国公有云大模型服务市场中,火山引擎以 49.2% 的市场份额位居第一,阿里云和百度智能云分别占 27%、17%------火山引擎一家份额已超后两者总和。同期披露数据显示,截至 9 月底,豆包大模型日均 Tokens 调用量突破 30 万亿,相比去年 5 月的 1200 亿增长 253 倍。IDC 统计口径为云厂商对外部客户提供的服务调用量,不含字节系自有产品消耗。

同期,火山引擎全新发布并升级四款豆包大模型:豆包大模型 1.6 升级版原生支持四档思考长度调节,是国内首个支持该功能的模型,可在效果、时延与成本之间实现平衡;豆包大模型 1.6 Lite 更轻量且性价比更高;豆包语音合成模型 2.0声音复刻模型 2.0 能理解情感、调节音调风格,并可准确朗读公式。


04|智谱 AI 回应"部门解散":组织调整涉及十余人,聚焦 MaaS 战略转型

10 月 17 日,针对"产研中心 60 人团队解散"传闻,智谱 AI 向第一财经回应称,目前公司产品和研发相关部门运转正常,组织调整涉及人员十余人。据蓝鲸新闻报道,9 月 23 日智谱商业化部门旗下产研中心确实进行调整,原 60 人团队一半离职、一半分流至交付部门,赔偿标准为 N+1。接近智谱人士透露,此次调整主要围绕 MaaS(Model-as-a-Service)战略转型展开------从原先偏重人力的私有化交付模式,转向更轻量的平台化服务。

有意思的是,就在 10 月 10 日智谱刚发布 47 个热招岗位,包括多模态算法工程师、Agent 产品经理等核心职位,显示公司在优化结构的同时仍在扩充关键技术团队。作为"AI 六小龙"中首家启动 IPO 流程的公司,智谱原计划 10 月完成上市辅导,最早 2026 年登陆 A 股。此前公司已完成超 10 轮融资,最新估值达 400 亿元,投资方包括美团、阿里、腾讯等互联网巨头及多地国资。这次 IPO 前的组织调整,更像是为盈利结构优化做准备。


05|ChatGPT 升级记忆管理,自动清理冗余信息

10 月 16 日,OpenAI 宣布 ChatGPT 推出自动记忆管理功能,彻底解决困扰用户的"memory full"提示。新系统会自动保持最相关细节的优先级,将次要信息移至后台,防止记忆容量达到上限。系统会根据信息的时效性和话题频率等因素决定保留哪些记忆,旧的或未使用的记忆将被自动删除。此外,用户现在可以搜索保存的记忆,并按最新或最旧排序查看,还能在设置中查看当前优先记忆并手动调整特定记忆的优先级。

该功能目前面向 Plus 和 Pro 用户开放,用户仍保持完全控制权,可通过聊天要求 ChatGPT 记住或忘记信息,也可在设置中查看和删除特定记忆。值得注意的是,ChatGPT 的记忆功能现在分为两部分:用户明确要求记住的"保存记忆"与从过往聊天中自动提炼洞察的"聊天历史"。


06|OpenAI 宣布 12 月向成年用户推出 ChatGPT "成人模式"

10 月 14 日,OpenAI CEO Sam Altman 宣布,将于 12 月向通过年龄验证的成年用户开放成人内容生成功能。此前,ChatGPT 对此类内容设置了严格限制。Sam Altman 称,此举是为了防范心理健康风险,但现有策略让无相关问题的用户感到过度受限。OpenAI 表示,已开发新工具以缓解心理健康隐患,从而能在安全前提下放松限制。年龄验证将通过自动预测系统实现,若发生误判,用户需上传身份证件完成验证。

今年 8 月,OpenAI 曾因青少年自杀诉讼而加强心理健康防护措施,包括阻止涉及自杀与自残的对话。仅两个月后便宣布放松限制,引发业界质疑其是否过早宣称"已解决心理健康问题"。竞争压力或是关键推动因素之一------Elon Musk 旗下 xAI 的 Grok 已提供类似功能,Character.AI 等平台也凭此吸引了大量用户(日均使用时长 2 小时)。OpenAI 同时宣布成立 8 人专家委员会,为 AI 心理健康影响提供长期建议,但尚未披露具体安全措施细节。


07|Anthropic 发布 Claude Haiku 4.5,性能接近 Sonnet 4 但价格仅为 1/3

10 月 15 日,Anthropic 推出小型模型 Claude Haiku 4.5,定价为 1 美元 / 百万输入 Tokens 和 5 美元 / 百万输出 Tokens,仅为 Sonnet 4.5(3 美元 / 15 美元)的三分之一。官方基准测试显示,其在 SWE-bench Verified 测试中得分 73.3%,略高于此前的 Sonnet 4(72.7%),在部分计算机操作任务中甚至超过 Sonnet 4。速度方面比 Sonnet 4.5 快 4--5 倍,适合需要低延迟的实时场景,如客服、编程辅助等。

该模型是 Haiku 系列首个支持扩展思考模式的版本,支持 20 万 Tokens 上下文。Anthropic 建议在多智能体系统中,将 Sonnet 4.5 作为主控,由多个 Haiku 4.5 子智能体并行处理子任务以提升效率。模型已通过 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 立即可用。不过,相比 OpenAI 的 GPT-5 Nano(0.05 美元 / 0.40 美元)和 Gemini 2.5 Flash Lite(0.1 美元 / 0.4 美元),Haiku 4.5 的价格仍高出 10--20 倍。


08|Anthropic 推出 Skills 功能:Claude 正面对标 OpenAI AgentKit

10 月 16 日,就在 OpenAI 发布 AgentKit 工具包 10 天后,Anthropic 立即跟进推出 Claude Skills 功能。Skills 本质是包含指令、脚本和资源的文件夹,Claude 在执行任务时按需动态加载,无需手动选择。这项功能已向 Pro、Max、Team 和 Enterprise 付费用户开放,内置 PDF、Word、Excel、PPT 等文档创建能力,用户可创建自定义 Skills 来适配企业品牌规范或专业工作流。

Skills 的核心优势在于"可组合性"------多个 Skills 可自动协同工作,且采用"渐进式披露" 机制,仅在需要时加载相关技能,避免无关 token 消耗。早期用户反馈亮眼:Rakuten 表示"原本需要 1 天的工作,现在 1 小时完成",Notion 则称"结果更可预测,减少了反复调整提示词"。不过 Anthropic 特别提醒,Skills 具备代码执行权限,用户应仅安装来自可信来源的 Skills,避免潜在安全风险。


09|谷歌发布 Veo 3.1 视频模型,首次实现视频与音频同步生成

10 月 15 日,谷歌推出视频生成模型 Veo 3.1,首次支持原生音频生成,可自动为视频添加环境音、对话和音效,实现视听同步。相比 5 月发布的 Veo 3,新版本在纹理真实感、叙事控制和提示词理解上显著提升,支持生成最长 60 秒的 1080p 横竖屏视频。定价为 Fast 版 0.15 美元 / 秒和 Standard 版 0.40 美元 / 秒,已集成至 Flow 平台、Gemini API、Vertex AI 和 Gemini 应用。

Flow 平台同步更新编辑工具,新增 Insert 功能,可向场景插入物体并自动调整光影与阴影;Remove 功能(即将上线)可无痕移除元素。用户可通过"Ingredients to Video"使用多张参考图定义角色和场景风格,"Frames to Video"生成首尾帧之间的流畅过渡,"Extend"功能则可基于末尾帧延展视频至 1 分钟以上。自 5 月推出以来,Flow 已生成超 2.75 亿个视频。此次升级直接对标 OpenAI,Promise Studios 和 Latitude 等创作平台已开始将 Veo 3.1 集成至故事板预览和交互叙事引擎中。


10|HuggingChat Omni 发布:智能路由从 115 个开源模型中挑选最优解

10 月 16 日,Hugging Face 发布 HuggingChat Omni,这是一个智能路由系统,能根据用户查询内容自动从 115 个开源模型中选择最合适的一个来回答。系统基于 Katanemo 的 Arch-Router-1.5B 轻量级路由模型,仅用 15 亿参数就能精准分析查询的领域和任务类型,实现类似 OpenAI 新模型路由的效果。支持的模型包括 DeepSeek-V3Qwen 系列、Llama 系列等主流开源模型,覆盖代码生成、数学推理、多语言对话等场景。

实测显示,路由选择准确率超过 GPT-4 级别模型,而且完全开源可自定义路由策略。用户可以选择让系统自动挑选(Omni 模式),也可以手动指定具体模型。Hugging Face 联合创始人 Clément Delangue 表示这只是开始,平台已有超过 200 万个开源模型,未来将扩展到图像、音频、视频等多模态领域。目前已在 huggingface.co/chat 上线,免费使用。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的"外挂",致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注"AI信息Gap",用 AI 为你的未来加速。


精选推荐

相关推荐
姓刘的哦5 小时前
基于线程池的配电房图像检测
人工智能·计算机视觉·目标跟踪
机器之心5 小时前
谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了
人工智能·openai
DKunYu5 小时前
PyTorch入门
人工智能·pytorch·python·深度学习
机器之心5 小时前
谷歌重大突破!量子计算首次可验证,登《Nature》封面
人工智能·openai
gustt5 小时前
每天一杯科技资讯咖啡,用 n8n 喂给 AI
人工智能·node.js
技术闲聊DD5 小时前
深度学习(8)- PyTorch 数据处理与加载
人工智能·pytorch·深度学习
Juchecar5 小时前
从LLM训练和推理角度,区分 “知识”与“智慧”
人工智能
小虎AI生活5 小时前
别光盯着Claude,CodeBuddy的Codex才是AI编程爱好者的下一个效率神器!
chatgpt·ai编程·codebuddy
掘金一周5 小时前
一个前端工程师的年度作品:从零开发媲美商业级应用的后台管理系统 | 掘金一周 10.23
前端·人工智能·后端