阿里云大模型ACP（附真题练习）

最近有很多同学考了阿里云大模型高级工程师ACP认证，顺利拿到大模型高级工程师ACP认证证书。想要向AI方向转型，考一个大模型高级工程师ACP证书的同学可以稍微了解一下。

最后会附一部分真题练习，给大家参考，完整题库也可以到题主小程序上找一下！

随着生成式AI技术的爆发，阿里云于2024年10月18日正式推出大模型高级工程师ACP认证。该认证一经发布便迅速迭代，截至2025年底已更新至V2.1版，旨在紧跟技术前沿，培养具备实战能力的AI人才。

面向用户与核心价值

该认证主要面向具备编程基础的AI应用开发者、算法工程师及技术爱好者 ，特别是那些希望掌握大模型落地实践，却非纯算法背景的研发运维人员。认证不局限于理论，更强调在阿里云百炼、PAI等平台上解决实际业务问题的能力。

认证内容与体系

认证课程围绕"构建并优化答疑机器人"这一实战项目展开，覆盖五大核心板块：

提示词工程：教授Meta Prompting等高阶技巧。
检索增强生成：深入RAG框架与自动化评测。
模型微调：掌握全参/LoRA等微调方法与参数调优。
Agent与多模态：构建智能体，支持图像、语音等多模态交互。
生产实践：涵盖模型的高效部署及AI安全合规。

考试大纲与重大变化

自发布以来，考纲经历了显著变革。V1.0阶段 偏重概念记忆；自2025年3月（V2.0） 起，考题大幅向场景应用倾斜，去除了机械定义记忆，增加了结合上下文的具体案例分析。

最新考纲（2025年10月更新）调整了各模块权重，提示词工程 与检索增强比例上升，强调了在复杂业务中的落地能力。

一、知识点及占比

知识点	比例	说明
大模型应用开发	17%	涵盖应用架构、API调用、开发流程等
大模型提示词工程	15%	涉及提示词设计、优化、高阶技巧等
大模型检索增强	20%	包含RAG原理、知识库构建、检索优化等
大模型微调	16%	包括全参/LoRA微调、参数调优、数据准备等
多Agent及多模态应用	16%	涉及Agent协作、图像/语音等多模态模型调用
生产环境应用实践	16%	涉及Agent协作、图像/语音等多模态模型调用

二、题型及题量

题型	题量	每题分值	小计
单选题	50题	1分	50分
多选题	25题	2分	50分
合计	75题	---	100分

及格分数线：80分

考试时长：120分钟

答题方式：闭卷

总体来看，阿里云大模型ACP认证强调"全局视野 "与"工程化落地"，是检验开发者AI应用能力的权威标准之一。

题库练习题

完整版题库大家也可以去题主小程序上找一下，题目都按考试知识点标注了，会帮大家统计各个知识点的掌握情况。还可以一边复习、一边刷题，跟一起备考的学霸一起讨论、互相学习！

多选题

某公司正在开发一款智能客服系统，用于为用户提供多语言支持。在处理用户问题时，系统需要准确翻译并解释一些内部非公开的领域术语。为了确保翻译和解释的高准确性，以下哪两个方案能有效解决这一问题？

A、手动整理所有术语及其翻译，并作为提示词提供给模型

B、要求模型在遇到未知术语时直接跳过，避免错误翻译

C、提供3条术语的翻译示例，依赖模型自行推断其余术语的含义

D、通过RAG技术接入该领域术语数据库，动态检索并翻译术语

答案：AD

标签：RAG，提示词

一家金融公司基于RAG系统搭建自研交易模型查询功能，出现检索结果常返回通用文档、而非知识库中交易模型的高级解决方案，想系统性解决此问题，架构师应优先选择哪两项措施？

A、实施混合检索融合模型（如BM25模型）与向量搜索

B、引入Cross-Encoder模型进行检索结果重排序

C、调整分块重叠分块大小优化文本切片效果

D、建立"查询-理想文档"的"黄金标准"评测集

答案：AB

标签：RAG，检索

一家航空公司搭建AI服务系统，该系统在响应用户针对业务手册的查询需求时，频繁返回宽泛的手册章节内容，无法精准定位到用户所需的具体条款或关键信息。若想系统性解决这一问题，应优先采取哪两项策略？

A、优化查询意图识别模型，结合航空业务场景（如订票、改签、行李托运）的语义特征，精准拆解用户查询的核心诉求

B、构建航空业务专属的知识图谱，关联手册章节、具体条款、业务场景、常见问题等信息，强化内容间的逻辑关联

C、简化AI服务系统的返回机制，减少冗余章节的展示，仅提取与用户查询高度匹配的关键句子片段

D、在用户输入查询时，引导用户补充精确的手册章节编号或核心关键词，缩小检索范围

答案：AB

标签：RAG，检索

一家AI应用可以辅助有关部门制作案情推演材料，通过融合文档片段与证物照片来生成图文并茂的案情摘要。为确保交付给客户的产出是专业且负责任的，以下哪些流程是强制性的？

A、将AI生成的内容提交给另一个知名的开源通用大模型进行事实核查。

B、对模型训练的案情资料进行彻底的、不可逆的匿名化和脱敏处理。

C、所有AI生成的摘要在交付前，需交由人类法律专家进行审核确认。

D、为AI生成的每一项关键事实建立可溯源机制，明确链接原始证物。

答案：BCD

标签：安全合规

某顶尖医院计划开发一个"多模态肺癌风险筛查辅助系统"，目标是高精度地识别潜在的早期病灶，并对医生报告中可能存在的描述与影像不符之处进行高亮提示。准确性、可解释性和安全性是最高优先级。为了构建一个在临床上高度可靠、值得信赖的系统，你会采用哪些关键技术或设计？

A、为了快速提升模型泛化能力，参考ImageNet，需要大量获取互联网上公开的肺部影像数据集，与医院内部数据集直接合并进行训练。

B、采用多模态模型，输入丰富的各类医疗检测数据，端到端一次性输出风险评分和修正报告。

C、设计一个基于多智能体的"审核"流程：一个Vision Agent分析影像，一个TextAgent分析报告，一个Clinical Agent参照权威医学知识库（如UMLS）对前两者的发现进行交叉验证。

D、图像理解模型在输出"是否存在病灶"的结论时，可以同步生成注意力图（Attention Map），在CT影像上标示出判断依据的区域。

答案：CD

标签：多模态，安全合规

一家智能家居公司重新设计空调控制面板，需优化老年人使用体验。下列哪些改进符合交互设计原则？

A、模式切换时，联机播放防寒保暖的保健品广告或夏季登山潜水旅游好去处

B、待机界面显示放大版时钟，右上角固定显示空气质量指数，超过警戒值自动弹出红色警示框

C、将温度调节按钮放大，每次操作伴随"嘀"声反馈，持续按住按钮时数值变化速度逐渐加快

D、增加语音唤醒词，识别成功时面板呼吸灯闪烁

答案：BCD

标签：用户体验

用户反馈你开发的客服机器人连续返回乱码，排查发现：1. 用户语音已经成功上传网络存储，2. 调用语音理解服务后日志显示「模型解析失败」，3. 独立部署的模型服务的监控显示QPS突增500%，哪些项是可能的原因？

A、前端生成的语音文件格式与模型期望不匹配

B、模型在高并发下过载，处理能力达到上限

C、突增请求中包含大量触发模型Bug的异常音频

D、语言模型未针对专业术语做优化，意图理解准确率低

答案：ABC

标签：安全合规

打造一款面向故宫等大型历史文化景区的"沉浸式AI导游"，允许游客使用手机或专用设备实时理解游客眼前的景象（如某个宫殿、文物），并结合游客的语音提问，提供流畅、低延迟、富有情感的语音讲解。一个关键的现实约束是：景区内人流密集，移动网络信号可能非常不稳定或时断时续。以下哪些架构设计和技术选型组合最为关键和高效？

A、建立高清视频通道，将语音识别、视觉分析、LLM推理、语音合成全部放在云端服务器执行，以确保最高质量的回答。

B、部署一个能完美覆盖、无缝漫游且能承载数万并发用户高质量连接的Wi-Fi网络，要求用户必须连接到景区提供的专用Wi-Fi，通过服务质量（QoS）保障，强制所有数据流通过该稳定信道进行传输。

C、在设备端预置高质量的TTS（文本转语音）语音包和核心景点的多媒体资料，由LLM在云端生成讲解文本后，指令设备端进行本地合成与播放。

D、优先在设备端部署轻量级视觉模型进行快速目标识别，并将识别出的实体ID（如"太和殿"）而非原始图像帧上传，以降低网络负载。

答案：CD

标签：多模态，Agent

一家律所计划构建一个AI助手，辅助律师基于内部案件数据库（用于RAG）起草法律文书。为从技术架构层面有效缓解客户信息泄露风险，应集成哪些设计？

A、部署端到端加密存储方案，对案件数据库中的客户隐私信息（如身份信息、涉案细节）进行加密处理，仅授权进程可解密调用

B、构建精细化RBAC权限体系，按律师所属业务线、案件参与权限划分数据访问范围，禁止跨案件、跨权限查询客户敏感数据

C、集成数据脱敏引擎，在RAG检索、大模型生成法律文书的过程中，自动屏蔽客户身份证号、手机号、住址等敏感字段（如用"***"替换关键字符）

D、新增操作审计日志模块，记录AI助手的所有数据访问、文书生成操作，包含访问人、访问时间、数据范围等信息，支持异常行为追溯

答案：ABCD

标签：安全合规

一家教育科技公司拟开发高级AI教学产品，旨在实现个性化、智能化、普惠教育。从多智能体协作与自适应教学系统设计的角度，以下哪些系统架构方案是达成其核心目标的有效策略？

A、依赖人工专家团队进行实时干预，作为教学策略调整的主要驱动力。

B、部署基于共享内存的黑板（Blackboard）系统，实现各智能体间实时信息交换与决策。

C、要求用户统一购买经过认证的高性能设备，将所有核心AI推理功能部署在用户设备上，避免隐私风险。

D、设计分层智能体架构，由策略智能体、教学智能体和评估智能体协同规划学习路径。

答案：BD

标签：Agent，教育

你正在对大模型进行LORA微调，但在训练过程中发现模型开始过拟合，可采取的优化措施包括？

A、使用早停法及时终止训练

B、增加训练数据的多样性和数量

C、适当增大batch size

D、适当增大lora_rank值

答案：ABC

标签：微调

以下哪些方法，有助于降低大模型使用成本？

A、精简输入提示词篇幅，同时要求大模型输出精简的内容

B、根据任务复杂度，选择参数量合适的大模型

C、对于任何任务，始终选择参数量较大的模型

D、对于可以通过预定义逻辑、固定模板或经典算法高效完成的任务，不使用大模型处理

答案：ABD

标签：成本

如果你需要自行部署大模型用于推理服务，以下哪些方案有助于提升推理速度？

A、对于长文本生成场景，启用KVCache

B、使用CPU集群替代GPU，利用多线程并行处理请求

C、使用经过量化的模型，并且评测确认量化后的模型效果符合业务需求

D、任何场景，始终优先使用大参数量模型

答案：AC

标签：推理

RAG应用在检索时共召回了10条切片，其中3条高度相关，但这3条内容都来自相邻段落，却被系统拆分成不同切片，从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度？

A、调整切片大小使其覆盖完整更大段落范围

B、使用按照语义的切片策略，切分出语义更完整的切片

C、提高temperature参数控制生成多样性

D、采用滑动窗口策略生成重叠的文本切片

答案：ABD

标签：RAG，文档切片

在实际工作中，哪些因素可能影响你构建RAG应用的速度？

A、需要更快地捕捉业务机会

B、没有时间投入到细节完善中

C、模型训练速度

D、数据存储需求

答案：ABD

标签：RAG

单选题

一家律所的 AI 助手在分析合同风险时，频繁引用一个已被新司法解释推翻的相似案例。系统目前仅采用向量检索召回 top-k 内容。为了更好地解决此问题，应采取哪项措施？

A、从向量索引中定期清除所有已被新司法解释覆盖的案例

B、切换到多向量检索，为文档内容和法律实体分别创建嵌入

C、增强提示词，指令模型在生成摘要时优先采信最新日期的文档

D、生成前先结合"时效性"等业务字段进一步重排和过滤

答案：D

标签：RAG，时效性，重排

一家重型设备制造商，为现场技术员提供 AI 维修指南，但架构师要求所有历史规范都必须保留用于合规审计。你担心如果 RAG 系统引用已废弃的设计规范，可能导致维修错误。你应如何解决这个问题？

A、优化系统提示词，指令模型忽略旧版本并解释其选择

B、建立与原有业务系统的实时数据同步，确保数据源的唯一性。

C、获取知识块时附加版本与元数据标签，并在检索时过滤

D、在应用层过滤，输出回答前，过滤掉过期文档索引

答案：C

标签：RAG，版本控制，过滤

你在设计儿童教育类智能应用，客户要求需同时满足安全性和趣味性。以下哪种交互方案最合理？

A、所有教学内容仅以全屏视频展示，观看期间禁用物理按键，视频结束后弹出知识测验

B、采用卡通语音陪伴助手，敏感操作需家长手机端二次验证，错误操作时用震动+彩色光带提示

C、主界面设置 20 个高亮功能导航按钮，点击任意区域即时播放提示音，夜间自动切换深色模式

D、内置家长监控摄像头，孩子使用超过1小时自动锁屏并通过人脸识别判断是否成年用户

答案：B

标签：安全合规，儿童，交互设计

某团队使用通义千问 API 开发智能问答应用，为了快速实现回答实时外部问题（如"今天的天气"）的能力，可以首先使用哪种方案？

A、指派资源，手动开发一个天气查询插件

B、升级到最新发布的更大参数规模的模型

C、启用平台提供的联网搜索功能

D、通过多轮对话设计，引导模型回答实时问题

答案：C

标签：通义千问，联网搜索，API

你用多模态技术开发短视频智能剪辑工具时，提出以下四个方案步骤，其中不合理的步骤是？

A、用 RAG 增强技术提升视频的饱和度对比度

B、用视频理解模型分析视频中的人物动作

C、用语音合成模型为合成视频添加官方解说

D、用文生图模型将新场景与原视频人物合成

答案：A

标签：多模态，RAG，视频处理

一家智能客服系统初期采用了昂贵的旗舰大模型（如GPT-N），虽然效果很好，但运营发现70%的用户问题都是"如何登录""忘记密码"这类高频简单问题。为了节约API调用成本，团队应该优先采用哪种架构调整？

A、微调整旗舰大模型，使其能更快地回答这些高频问题

B、先用轻量级模型识别意图按任务路由，对复杂问题调用旗舰模型

C、选择价格更低的API服务套餐

D、限制每位用户的日均提问次数，并对超出部分进行收费

答案：B

标签：成本优化，意图识别，路由

你开发的AI客服系统出现以下异常：用户发送"我想看红色连衣裙的3D展示"时，系统返回文字描述但无图像，当用户发送产品视频时，系统无法提取关键参数，语音回复存在机械音且断句不自然，上述异常对应的技术缺陷依次是？

A、3D渲染超时→OCR识别失败→语音克隆失真

B、文本生成错误→视频合成中断→音频采样率异常

C、文生图失败→视频理解异常→语音合成缺陷

D、多模态融合故障→抽帧算法错误→TTS模型过拟合

答案：C

标签：多模态，视频理解，语音合成