1. 小米发布并开源具身大模型MiMo-Embodied
小米正式发布具身大模型MiMo-Embodied并宣布全面开源,该模型打通了自动驾驶与具身智能两大领域,实现任务统一建模,完成从"垂直领域专用"到"跨域能力协同"的关键跨越,其核心技术亮点包括覆盖具身智能与自动驾驶核心任务的跨域能力、室内外智能的知识转移协同效应以及多阶段训练策略,该模型在涵盖感知、决策与规划的29项核心基准测试中表现优异,不仅在具身智能17个基准、自动驾驶12个基准上取得卓越成绩,还在通用视觉语言领域展现出出色泛化性。
Hugging Face:
https://huggingface.co/XiaomiMiMo/MiMo-Embodied-7B
2. 腾讯混元团队发布Moral RolePlay基准,揭示大模型难以胜任反派角色扮演
腾讯混元数字人团队与中山大学联合推出"Moral RolePlay"评估基准,首次系统化测试大模型在多元道德角色(尤其是反派)中的扮演能力。研究发现,尽管主流模型能较好演绎正面角色,但在扮演反派时普遍表现不佳,负面特质(如伪善、欺诈)成为最大难点,且模型的通用能力与反派扮演水平无显著相关性。该研究暴露了AI因安全训练过度"善良"而难以模拟复杂人性,为下一代模型的情境化对齐提供了重要方向。
论文:
https://arxiv.org/pdf/2511.04962
GitHub:
https://github.com/Tencent/digitalhuman
3. Meta提出类专家Soup方法,通过非均匀权重融合实现模型性能SOTA
Meta超级智能实验室联合伦敦大学学院提出"类专家Soup"方法,通过分析基准测试中不同任务类别的弱相关性,为每个类别挑选专家模型并进行非均匀权重融合,在Berkeley函数调用等基准上取得SOTA性能。该方法相比传统均匀融合显著提升模型在多语言、数学推理等任务的表现,为高效整合模型互补能力提供了新思路。
论文:
https://arxiv.org/pdf/2511.13254
GitHub:
https://github.com/facebookresearch/llm_souping
4. Karpathy警示:大模型并非"更聪明的人类",而是全新非生物智能形式
Andrej Karpathy指出大模型是人类首次接触的"非生物智能",其进化压力、学习机制和运行方式与动物智能存在根本差异:大模型基于文本统计模拟和商业优化目标进化,缺乏生物本能与持续学习能力,因此不应将其视为具备欲望或情绪的"数字人类",而需建立全新的认知框架来理解这种智能形态。
推文:
https://x.com/karpathy/status/1991910395720925418
5. 腾讯混元开源HunyuanVideo 1.5:8.3B参数轻量级视频生成模型,支持文生视频与图生视频
腾讯混元大模型团队开源基于DiT架构的HunyuanVideo 1.5模型,以仅8.3B参数实现高清视频生成,支持5-10秒的文生视频和图生视频功能,并在14G显存消费级显卡上可运行。该模型通过轻量化架构与多模态优化,在运动流畅性、电影级美学和指令遵循方面表现优异,显著降低了高质量视频生成的技术门槛。
项目主页:
https://hunyuan.tencent.com/video/zh
GitHub:
https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5
ModelScope:
https://modelscope.cn/models/Tencent-Hunyuan/HunyuanVideo-1.5
6. AgentEvolver:突破智能体自进化瓶颈,实现任务生成与经验复用闭环
AgentEvolver通过整合自我任务生成、自我经验导航与自我反思归因三大机制,构建了智能体自主进化系统:该系统能够主动生成探索任务、复用历史经验并精细化归因奖励信号,在AppWorld等基准测试中以更少参数实现更高任务成功率,推动智能体从被动执行向持续学习的范式转变。
GitHub:
https://github.com/modelscope/AgentEvolver
技术报告:
https://arxiv.org/abs/2511.10395
参考
- https://www.aibase.com/zh/news
- https://mp.weixin.qq.com/s/eK7_pQv10RKXBEW-mclRiw
- https://mp.weixin.qq.com/s/mK2E3qs0E2hs7SpKuJZcIA
- https://mp.weixin.qq.com/s/Ni9dQRnNS8ZErY4vvJqt_Q
- https://mp.weixin.qq.com/s/JZ9OeywW0bqY1ypO1ehsUQ
- https://mp.weixin.qq.com/s/LJIwIjuqnREwJkX2ghH3ng
