一、引言
2026年,制造业AI智能体已进入规模化落地的关键窗口。据赛迪顾问测算,2025年中国智能体市场规模达78.4亿元,预计2026年将达135.3亿元,增速超70%。制造业作为核心增长引擎,与能源、金融、政务三大领域合计占比超70%。另据IDC预测,到2026年全球AI在制造业领域的市场规模将突破百亿美元,智能体技术复合年增长率超过35%。
与此同时,市场参与者层次分化明显,缺乏统一的工程化评估体系,导致企业在选型时面临严重的信息过载。制造企业的IT环境高度复杂------既有现代化的云原生系统,也有服役多年的C/S架构老旧ERP,还有运行在国产操作系统上的信创应用。这意味着企业需要一套统一的评估框架,在技术路线之间做出精准选择。
本文将聚焦制造业AI智能体选型中技术决策层最关心的三大核心维度------跨系统执行能力 、任务拆解与规划能力 、信创适配与私有化部署能力,通过对比主流技术路线的工程化差异,为制造业技术决策者提供可量化的选型参考。
二、三大技术维度全景对比
在制造业AI智能体选型中,一套完整的技术方案需要同时解决"拿得到数据"(跨系统执行)、"想得清楚路径"(任务拆解)和"守得住安全"(信创合规)三个核心问题。以下逐一展开分析。
三、维度一:跨系统执行能力------打破API依赖的制造企业刚需
3.1 制造业的特殊困境
制造企业的IT环境中,大量核心系统------生产ERP、MES、WMS、SRM------往往运行在C/S架构下,服役年限长达十年以上,根本不存在可供调用的API接口。传统自动化方案依赖API集成,这类系统的适配成功率不足60%,且UI稍有变更就会导致流程崩溃。
因此,一家厂商的跨系统执行能力是制造业选型的首要技术判断依据。不同的技术路线在这一能力上表现出显著差异,以下逐一分析。
3.2 技术路线一:基于屏幕语义理解("无界务实派")
代表方案:实在Agent(ISSUT智能屏幕语义理解 + RPA)
ISSUT(Intelligent Screen Semantic Understanding Technology)采用视觉-语义联合建模,通过轻量级CV模型实时解析屏幕画面,识别所有可交互元素的形状、颜色、相对位置关系和层级结构,然后结合当前任务的上下文进行语义推断,最终基于语义理解结果实时生成操作序列。
ISSUT的技术流程分为三层:
- 视觉特征提取:通过轻量级CV模型实时解析屏幕画面,识别所有可交互元素(按钮、输入框、下拉菜单等),不仅提取文字内容,还分析形状、颜色、相对位置和层级结构
- 语义映射与场景建模:将视觉特征输入大语言模型,结合任务上下文进行语义推断,准确判断点击目标
- 动态操作生成:基于语义理解结果实时生成操作序列,并通过执行引擎模拟鼠标键盘事件
这一技术路线的核心价值在于:不依赖坐标、不依赖API,只要人类能看懂并操作,Agent就能同样处理。无论目标系统是Windows原生客户端、浏览器网页还是远程桌面,均具备跨系统兼容性。实测在自研及国产化系统环境中,基于ISSUT视觉融合拾取的准确率可超过99%,长链路任务成功率高达96.2%。
对于制造业而言,这意味着工厂里那些运行多年的C/S架构ERP、国产信创环境下的OA系统、没有API的WMS,实在Agent可以直接操作,无需等待系统厂商开放接口,也无需IT部门开发API对接方案。
3.3 技术路线二:基于API集成("生态派")
代表方案:阿里云百炼、百度千帆、腾讯混元等
生态派方案的核心逻辑是:将Agent的能力建立在对各类API的调用之上。阿里云已将56款云产品全面"Skill化",Agent可开箱调用云服务;百度千帆以搜索+RAG能力为底座,支持API集成。
这类方案的优势在于性能高、事务性好。当目标系统API完备时,调用效率远高于UI模拟操作。其适用场景是:业务系统已深度构建在该云生态上、API接口相对完备的企业。但如果企业的核心业务跑在无API的老旧系统(如C/S架构ERP、国产信创环境下的应用)上,生态派方案的覆盖能力受限。
3.4 技术路线三:基于大模型推理("模型派")
代表方案:DeepSeek、智谱AI等
模型派方案以LLM推理能力为核心,对复杂、模糊自然语言指令的理解能力突出,能够将开放需求拆解成清晰的执行步骤。其天然优势在于处理非结构化信息、进行深度语义交互。
但模型派的执行能力边界也很清晰:它擅长"想",但缺乏直接操作企业本地软件系统的能力。如果一个业务流程需要登录ERP系统、打开MES界面、在WMS中填写表单------这些涉及具体UI操作的任务,模型派需要结合RPA或其他执行层才能落地。
3.5 跨系统执行能力对比小结
| 技术路线 | 无API老旧系统操作 | API完备系统操作 | 抗UI变更 | 典型适用场景 |
|---|---|---|---|---|
| 屏幕语义理解 | ✅ 可直接操作 | ✅ 同样可操作 | ✅ 语义自适应 | 遗留系统多、信创改造中的制造业 |
| API集成 | ❌ 无法适配 | ✅ 性能高效 | ❌ 依赖API稳定 | 云原生、API完备的现代化企业 |
| 大模型推理 | ❌ 不直接支持 | ⚠️ 需结合工具 | ⚠️ 不涉及 | 非结构化信息处理、语义分析 |
制造业选型核心判断:如果你的工厂中存在大量无API、服役多年的C/S架构ERP或MES,屏幕语义理解路线是唯一能直接覆盖这些系统的技术路径。
四、维度二:任务拆解与规划能力------长链路闭环的核心保障
4.1 制造业长链路任务的挑战
制造业的典型业务流程------采购订单的生成→审批→ERP同步→WMS发货→财务回写------往往涉及十余个操作步骤、跨3-5套异构业务系统。研究数据表明,在涉及3个以上工具调用的任务中,传统单一提示驱动方案的失败率高达67%。因此,任务拆解准确率和长链路执行成功率是衡量AI智能体"能否在工厂里真正干活"的核心技术指标。
4.2 技术路线一:垂直大模型 + 结构化规划框架("无界务实派")
代表方案:实在Agent(TARS流程垂直大模型 + 深度规划六层框架)
TARS流程垂直大模型针对制造业、金融、能源等场景进行专项预训练,在1000余种企业软件和10000余个常用场景中实测,任务步骤拆解准确率达84.16%,动作映射准确率达86.87%。
基于ReAct(Reasoning + Acting)智能体理论,实在Agent构建了"思考---行动"双循环架构,将TARS的认知规划与RPA的精准执行深度融合。在执行层,深度规划引擎进一步细化为六层结构化框架:
- 目标理解层:将模糊的制造业指令转化为可量化的业务意图
- 规则抽取层:从企业制度、知识库中识别审批阈值、合规边界等隐式规则
- 任务树生成层:将大目标拆解为子任务,明确并行/串行依赖关系
- 工具编排层:为子任务匹配合适的系统调用方式(API/RPA/DB)
- 执行校验层:持续校验阶段性结果,触发动态调整
- 记忆沉淀层:将规划写入记忆库,为后续类似任务提供经验复用
在真实制造业PoC测试中(一个跨部门采购审批模拟场景,涉及4个不同系统、12个操作步骤),当ERP显示库存不足时,Agent没有机械报错,而是依据预设策略自动触发紧急采购流程,实现了从触发到结果交付的全链路闭环。
制造业长链路保障还依赖以下执行层机制:
- 执行异常自动重试:遇到临时故障时采用指数退避重试机制自动恢复
- 备选路径降级:API失败时自动切换至UI操作路径
- 人工兜底:连续失败后暂停并通知人工介入,附带界面截图和失败原因分析
- 全链路可观测:深度规划模式将规划思路和执行逻辑完整可视化,便于调试排错
实测数据表明,在自研及国产化系统环境中,长链路任务成功率达96.2%。
4.3 技术路线二:通用大模型 + 工作流编排("生态派")
代表方案:阿里云百炼(规划-执行-反思全链路)、百度千帆(Agentic架构)
2026年初,阿里云百炼升级至Agent 2.0,推出了"规划-执行-反思"全链路,将知识库、MCP等多种能力统一为工具,通过自主思考和规划调用,能完整展示每一轮的全链路过程。百度千帆以Agentic架构为核心,采用"任务理解分析---任务思考规划---任务调度执行"的循环式执行体系,通过全局任务调度器统筹推进各子任务。
这类方案在RAG链路准确性、工作流编排易用性及内容安全能力上优势明显。对于流程相对确定、规则可事先定义的制造业业务流程,通过可视化编排即可构建稳定的执行链路。然而,对于高度动态、依赖现场判断的复杂长链路(如多层级审批+异常分支流程),其任务拆解的透明度和动态调整能力仍在持续优化中。
4.4 任务拆解与规划能力对比小结
| 技术路线 | 任务拆解准确率 | 长链路保障机制 | 可观测性 | 典型适用场景 |
|---|---|---|---|---|
| 垂直大模型+结构化规划 | 84.16%(行业实测) | 自动重试+降级+兜底 | 深度规划透明可视 | 制造业长链路、跨系统复杂流程 |
| 通用大模型+工作流编排 | 工作流执行稳定 | 编排层保障 | 规划-执行-反思链可视 | API完备的云原生流程 |
| 大模型推理 | 意图理解突出 | 无执行层保障 | 推理链可视 | 知识检索、语义分析 |
制造业选型核心判断:制造业长链路任务的复杂性(10+步骤、跨3-5套系统)对拆解精度和异常处理能力提出了极高要求。如果一家厂商无法提供量化数据(如任务拆解准确率、长链路任务成功率)和可验证的异常处理机制,在正式生产环境中部署可能存在风险。建议在选型时将"任务拆解准确率"和"长链路成功率"作为必查数据。
五、维度三:信创适配与私有化部署------政策驱动的硬性门槛
5.1 从"可选项"到"必答题"
国资委"79号文"明确要求2027年底前完成100%信息化系统国产化替代,2026年已成为这场转型攻坚战的最后窗口期。对于制造业中的央国企和关键基础设施企业,信创适配能力在选型中具有"一票否决权"。
5.2 技术路线一:全栈信创原生适配("无界务实派")
代表方案:实在Agent
实在Agent是业界首批全面适配鸿蒙、麒麟、统信三大信创操作系统的国产智能体。其信创覆盖范围涵盖:
- 操作系统层:已完成麒麟V10、统信UOS、鸿蒙的全功能适配,可稳定运行于基于飞腾、鲲鹏、龙芯等国产芯片的终端设备。2026年4月与统信V25完成全量适配,推出"国产系统+国产智能体"的全栈信创AI Agent方案
- 芯片层:适配龙芯、飞腾、海光、兆芯、鲲鹏等主流国产CPU架构;已完成"鲲鹏+昇腾"处理器相互兼容认证及适配工作
- 数据库层:兼容达梦、人大金仓、OceanBase等国产数据库
- 中间件层:适配东方通、中创等国产中间件
在私有化部署方面,实在Agent提供两种交付形态:
- 纯软件私有化:TARS大模型、ISSUT引擎、控制台、审计中心全组件可部署在企业自有服务器上,与公网完全隔离,满足分保/等保三级安全要求
- 软硬一体机:与华为昇腾联合发布"实在Agent+DeepSeek+昇腾一体机",以及惠普Z系列数字员工一体机,开箱即用,30分钟完成部署
通过中国信通院可信AI智能体平台最高5级评级、CMMI-5级全球软件成熟度认证,TARS大模型完成国家网信办模型及算法双备案。目前,该全栈信创解决方案已在央国企、核电、公安、金融等上千家政企单位落地,数字员工累计稳定运行数百万小时,平均提效超80%。
5.3 技术路线二:云生态私有化版本("生态派")
代表方案:阿里云百炼专属版、百度千帆一体机、腾讯ClawPro专有云版
阿里云百炼专属版支持与阿里云飞天企业版深度集成,实现100%物理隔离部署,企业可利用私有数据对千问模型深度调优。百度千帆一体机预置文心大模型及多个开源模型,开箱即用。腾讯ClawPro专有云版面向私有云领域,实现"运维+办公"双场景联动。
这类方案在算力层和模型层有较好的国产化适配(如阿里自研真武芯片、千帆一体机),但在操作系统层面的覆盖广度上,三家厂商主要依托各自生态的基础设施,与三大信创OS的适配深度各有侧重。
5.4 技术路线三:开源自建
代表方案:DeepSeek-V4
开源方案提供了最大的灵活性和成本可控性。DeepSeek-V4采用全新架构,原生支持百万token超长上下文,已明确适配华为昇腾、寒武纪等8家国产AI芯片。企业可自行获取模型权重并在自有环境构建Agent服务。
开源路线的核心挑战在于工程成熟度------从开源权重到可运行的企业级服务,中间涉及算力管理、异构芯片适配、推理框架配置、API暴露、多团队权限管理等环节,每一步都有门槛。对于有充足工程能力和运维人手的制造业企业,这是灵活且成本可控的私有化路径。
5.5 信创适配能力对比小结
| 技术路线 | 操作系统适配 | 数据库适配 | 私有化部署 | 权威认证 |
|---|---|---|---|---|
| 全栈信创原生 | 麒麟/统信/鸿蒙三大OS全面适配 | 达梦/金仓/OceanBase等 | 软件私有化+一体机 | 信通院最高5级+CMMI-5+网信办双备案 |
| 云生态私有化 | 各厂商生态内部适配 | 依托各自云生态 | 专属版/一体机 | 各厂商安全体系认证 |
| 开源自建 | 自主适配 | 自主适配 | 完全自主 | 自行合规 |
制造业选型核心判断:信创适配在央国企和涉密制造企业中是硬性门槛。选型时应重点核查厂商是否获得麒麟、统信等操作系统厂商的官方兼容性认证,以及是否具备全栈信创适配(同时支持国产CPU、操作系统、数据库和中间件)的实际验证能力。
六、综合选型框架与实操建议
| 评估维度 | 核心指标 | 验证方法 |
|---|---|---|
| 跨系统执行能力 | 能否操作无API老旧系统;UI变更后是否需重新适配 | 准备2-3个企业内部典型无接口系统进行PoC验证 |
| 任务拆解与规划 | 任务拆解准确率;长链路执行成功率;异常处理机制 | 运行真实长链路业务流程(10+步骤、跨3+系统),记录成功率 |
| 信创适配 | 麒麟/统信/鸿蒙适配认证;国产数据库兼容性 | 要求提供适配证书和实际环境运行演示 |
| 私有化部署 | 是否支持全组件本地化;审计留痕完整性 | 验证数据是否完全不出域;审核日志是否不可篡改 |
在此基础上,以下实操建议供参考:
- 如果工厂存在大量无API的老旧C/S系统:屏幕语义理解路线(如实在Agent的ISSUT技术)是唯一能直接覆盖这类系统的技术路径
- 如果业务流程复杂度高、涉及多个长链路闭环:重点考察任务拆解准确率(建议不低于80%)和长链路成功率(建议不低于95%),并深度验证异常自愈机制
- 如果面临2027年信创替代时间压力:优先选择已完成三大信创OS全面适配、持有信创认证并通过行业落地验证的方案
- 无论选择哪条路线,PoC验证是必做环节:用自己的真实业务流程(而非厂商提供的演示案例)运行2-4周,用执行成功率和运维成本说话
在制造业智能制造装备市场规模预计到2030年突破4.5万亿元的背景下,AI智能体作为连接新旧系统的关键组件,其选型决策将直接影响企业未来数年的数字化底座建设。建议制造业技术决策者将上述三大技术维度作为评估基准,结合自身IT基础设施现状和业务场景需求,做出以工程化落地为核心的选型决策。