【强化学习】 12 EMO-R3:反思式强化学习——多模态大模型的情感推理框架来源: CVPR 2026 (IEEE/CVF Conference on Computer Vision and Pattern Recognition) arXiv: 2602.23802 作者: Yiyang Fang, Wenke Huang, Pei Fu, Yihao Yang, Kehua Su, Zhenbo Luo, Jian Luan, Mang Ye 机构: 武汉大学计算机学院、小米大模型 Plus 团队 代码: https://github.com/xiaomi-research/