探索 InternVL3.5：从权重解析到多模态推理的全栈实践笔记

AI视觉网奇2026-04-16 10:35

InternVL3.5-241B 使用笔记

除了在线测试，该模型也以开源形式提供，你可以通过以下方式使用或部署：

资源类型	链接地址	说明
官方在线体验	chat.intern-ai.org.cn	官方提供的聊天界面，可直接测试模型效果
Hugging Face 模型库	OpenGVLab/InternVL3_5-241B-A28B	下载模型权重，适合开发者进行本地部署和推理
GitHub 代码仓库	github.com/OpenGVLab/InternVL	获取模型的使用代码、微调脚本和详细文档
ModelScope 魔搭社区	modelscope.cn/.../InternVL3_5-241B-A28B-HF	国内镜像，下载和加载模型更方便

根据官方公告，InternVL3.5 系列模型在通用多模态能力、推理能力以及效率方面相比前代均有显著提升，旗舰版 InternVL3.5-241B-A28B 在多个基准测试中表现优异。如果你想快速体验其多模态理解和推理能力，直接访问在线聊天网站是最便捷的方式。

模型：

OpenGVLab/InternVL3_5-241B-A28B

切换模型要新建对话。

InternVL3.5-241B-A28B的性能可与顶尖商业模型比肩，甚至在某些领域实现了超越。

能力维度	关键基准	得分及对比	意义
多学科推理	MMMU	77.7分	开源模型最高分，超越GPT-5（75.7分）
通用多模态感知	MMStar / OCRBench	77.9分 / 90.7分	通用感知能力超越GPT-5（80.7分）
综合推理能力	综合推理基准	66.9分	超越Claude-3.7-Sonnet（53.9分），数学、逻辑推理突出
纯文本推理	AIME25 / MMLU-Pro	75.6分 / 81.3分	文本能力领跑主流开源多模态模型
GUI智能体	ScreenSpot-v2	92.9分	超越同类模型，支持跨平台自动化操作
具身空间推理	VSI-Bench	69.5分	超过Gemini-2.5-Pro，具备物理空间关系理解能力
矢量图形处理	SGP-Bench	70.7分	刷新开源纪录，在图形生成任务上优于GPT-4o

InternVL3.5-241B-A28B