阿里上线千问“最强学习模型”,中兴发布EmbodiedBrain具身智能模型,OpenAI提出忏悔训练新方法

1. 阿里上线千问"最强学习模型",免费提供全学段拍题答疑与作业批改

阿里基于Qwen3推出专为学习场景打造的"最强"大模型Qwen3-Learning,正式上线拍题答疑与作业批改两大核心功能,覆盖小学至大学全学科知识,支持印刷体与手写体识别,依托5亿级资料库实现高准确率解题和多题批量批改,且全部免费向用户开放。

2. 魔搭开源Flowra:AI工作流开发引擎,支持可视化与分布式调度

ModelScope联合呜哩团队开源了Flowra------FlowBench背后的核心图执行引擎和节点包开发工具链。它通过有向无环图(DAG)组织工作流,提供类型安全的组件系统、智能缓存、并行调度和分布式执行能力,支持图像、音频、视频等多模态数据处理。开发者可用简洁API快速创建、调试和发布节点包,并无缝集成ModelScope的千余模型,旨在降低AI工作流开发门槛,实现从原型验证到生产部署的全流程覆盖。

GitHub:
https://github.com/modelscope/flowra

客户端:
https://modelscope.cn/flowbench/download

3. AWS re:Invent大会发布十大AI升级:自研芯片性能提升6倍,集成多款中国大模型

在AWS re:Invent大会上,亚马逊云科技推出十大AI核心更新,包括第四代自研AI芯片Trainium4(性能较前代提升6倍)、3nm芯片驱动的Trainium3服务器、第二代自研大模型Nova 2系列(含Lite/Pro/Sonic/Omni四款),以及Agent开发工具升级。平台新增18款开源模型,集成阿里通义千问、Kimi、MiniMax等中国模型,并推出AI工厂定制服务、智能体策略管理等功能,强化从基础设施到应用层的全链路AI能力,助力企业高效部署智能体与分布式计算。

4. Mistral AI发布第三代开源模型系列,全线回归Apache 2.0许可协议

法国AI公司Mistral AI发布新一代Mistral 3系列模型,包括675B参数的混合专家模型Mistral Large 3及小型边缘模型Ministral 3(14B/8B/3B),全线采用Apache 2.0开源协议,支持多模态理解与多语言对话,并在NVIDIA H200集群上训练,通过与vLLM、Red Hat等合作优化部署效率,即日在多家云平台上线。

博客:
https://mistral.ai/news/mistral-3

Hugging Face:
https://huggingface.co/collections/mistralai/ministral-3

5. 中兴发布EmbodiedBrain具身智能模型,突破复杂任务规划能力

中兴星云大脑团队推出具身视觉-语言基础模型EmbodiedBrain,提供7B与32B两种参数规格,通过模块化编码器-解码器架构实现感知-推理-行动闭环,创新采用Step-GRPO强化学习方法提升长程规划能力,在14项基准测试中刷新多项SOTA,尤其在空间推理与任务规划领域表现突出,并开源全部模型权重与评估工具。

论文:
https://arxiv.org/abs/2510.20578

项目主页:
https://zterobot.github.io/EmbodiedBrain.github.io/

GitHub:
https://github.com/ZTERobot/EmbodiedBrain1.0/

Hugging Face:
https://huggingface.co/ZTE-AIM/EmbodiedBrain-7B
https://huggingface.co/ZTE-AIM/EmbodiedBrain-32B

6. OpenAI提出忏悔训练新方法,让GPT-5-Thinking学会主动承认错误

OpenAI最新研究提出"忏悔训练"方法,在GPT-5-Thinking模型完成主任务后要求其生成忏悔报告,通过独立奖励信号使模型主动承认违规行为。实验显示模型在11/12测试场景中能如实交代错误,且训练不影响原有性能,该方法可作为监控工具与思维链等技术配合提升AI安全性。

论文:
https://openai.com/index/how-confessions-can-keep-language-models-honest/


参考

  1. https://mp.weixin.qq.com/s/bBK0OHAhmm4CU8YU7hRhgA
  2. https://mp.weixin.qq.com/s/ghmemiYZVH4RNx6htHkVCA
  3. https://mp.weixin.qq.com/s/a7XjU7LRBYyQmTeuA2kSaw
  4. https://mp.weixin.qq.com/s/Ojkk_fHYcCU5CyZGGb4bPQ
  5. https://mp.weixin.qq.com/s/OQkaZAPLMu3Oj5ESgaclLQ
  6. https://mp.weixin.qq.com/s/orE5ti175bv7DQ9EOpg3Gg
相关推荐
WangN21 天前
【通识】宇树G1_29DOF速度跟踪训练—逐章学习手册
人工智能·python·学习·机器人·具身智能
chen_zn951 天前
VLA 的 Co-training:通过多源数据提升机器人泛化能力
人工智能·深度学习·具身智能·vla
君为先-bey1 天前
NWM----导航世界模型
transformer·扩散模型·导航·具身智能·世界模型·条件扩散
万俟淋曦2 天前
【论文速递】2026年第04周(Jan-18-24)(Robotics/Embodied AI/LLM)
人工智能·ai·机器人·大模型·llm·具身智能·vla
万俟淋曦2 天前
【论文速递】2026年第03周(Jan-11-17)(Robotics/Embodied AI/LLM)
人工智能·ai·机器人·大模型·论文·robotics·具身智能
竹叶青lvye2 天前
ROS2自定义接口消息、参数服务案例
人工智能·ros2·具身智能·接口消息·参数服务
Godspeed Zhao2 天前
跨越天际:从智能汽车到 eVTOL 的适航与系统级开发25——智能负载卸载策略
科技·汽车·航空·具身智能·evtol
chen_zn952 天前
OpenPi、GR00T的视觉语言模型与动作模型连接方式差异分析总结
人工智能·深度学习·具身智能·vla
REDcker3 天前
TidyBot2 完整文档
机器人·开源项目·具身智能
chen_zn953 天前
RLinf复现RECAP(一):从轨迹回报到优势标签
人工智能·强化学习·具身智能·vla