最近有很多同学考了阿里云大模型高级工程师ACP认证,顺利拿到大模型高级工程师ACP认证证书。想要向AI方向转型,考一个大模型高级工程师ACP证书的同学可以稍微了解一下。
最后会附一部分真题练习,给大家参考,完整题库也可以到题主小程序上找一下!
随着生成式AI技术的爆发,阿里云于2024年10月18日正式推出大模型高级工程师ACP认证。该认证一经发布便迅速迭代,截至2025年底已更新至V2.1版,旨在紧跟技术前沿,培养具备实战能力的AI人才。
面向用户与核心价值
该认证主要面向具备编程基础的AI应用开发者、算法工程师及技术爱好者 ,特别是那些希望掌握大模型落地实践,却非纯算法背景的研发运维人员。认证不局限于理论,更强调在阿里云百炼、PAI等平台上解决实际业务问题的能力。
认证内容与体系
认证课程围绕"构建并优化答疑机器人"这一实战项目展开,覆盖五大核心板块:
- 提示词工程:教授Meta Prompting等高阶技巧。
- 检索增强生成:深入RAG框架与自动化评测。
- 模型微调:掌握全参/LoRA等微调方法与参数调优。
- Agent与多模态:构建智能体,支持图像、语音等多模态交互。
- 生产实践:涵盖模型的高效部署及AI安全合规。
考试大纲与重大变化
自发布以来,考纲经历了显著变革。V1.0阶段 偏重概念记忆;自2025年3月(V2.0) 起,考题大幅向场景应用倾斜,去除了机械定义记忆,增加了结合上下文的具体案例分析。
最新考纲(2025年10月更新)调整了各模块权重,提示词工程 与检索增强比例上升,强调了在复杂业务中的落地能力。
一、知识点及占比
| 知识点 | 比例 | 说明 |
|---|---|---|
| 大模型应用开发 | 17% | 涵盖应用架构、API调用、开发流程等 |
| 大模型提示词工程 | 15% | 涉及提示词设计、优化、高阶技巧等 |
| 大模型检索增强 | 20% | 包含RAG原理、知识库构建、检索优化等 |
| 大模型微调 | 16% | 包括全参/LoRA微调、参数调优、数据准备等 |
| 多Agent及多模态应用 | 16% | 涉及Agent协作、图像/语音等多模态模型调用 |
| 生产环境应用实践 | 16% | 涉及Agent协作、图像/语音等多模态模型调用 |
二、题型及题量
| 题型 | 题量 | 每题分值 | 小计 |
|---|---|---|---|
| 单选题 | 50题 | 1分 | 50分 |
| 多选题 | 25题 | 2分 | 50分 |
| 合计 | 75题 | --- | 100分 |
及格分数线:80分
考试时长:120分钟
答题方式:闭卷
总体来看,阿里云大模型ACP认证强调"全局视野 "与"工程化落地",是检验开发者AI应用能力的权威标准之一。
题库练习题
完整版题库大家也可以去题主小程序上找一下,题目都按考试知识点标注了,会帮大家统计各个知识点的掌握情况。还可以一边复习、一边刷题,跟一起备考的学霸一起讨论、互相学习!
多选题
某公司正在开发一款智能客服系统,用于为用户提供多语言支持。在处理用户问题时,系统需要准确翻译并解释一些内部非公开的领域术语。为了确保翻译和解释的高准确性,以下哪两个方案能有效解决这一问题?
A、手动整理所有术语及其翻译,并作为提示词提供给模型
B、要求模型在遇到未知术语时直接跳过,避免错误翻译
C、提供3条术语的翻译示例,依赖模型自行推断其余术语的含义
D、通过RAG技术接入该领域术语数据库,动态检索并翻译术语
答案:AD
标签:RAG,提示词
一家金融公司基于RAG系统搭建自研交易模型查询功能,出现检索结果常返回通用文档、而非知识库中交易模型的高级解决方案,想系统性解决此问题,架构师应优先选择哪两项措施?
A、实施混合检索融合模型(如BM25模型)与向量搜索
B、引入Cross-Encoder模型进行检索结果重排序
C、调整分块重叠分块大小优化文本切片效果
D、建立"查询-理想文档"的"黄金标准"评测集
答案:AB
标签:RAG,检索
一家航空公司搭建AI服务系统,该系统在响应用户针对业务手册的查询需求时,频繁返回宽泛的手册章节内容,无法精准定位到用户所需的具体条款或关键信息。若想系统性解决这一问题,应优先采取哪两项策略?
A、优化查询意图识别模型,结合航空业务场景(如订票、改签、行李托运)的语义特征,精准拆解用户查询的核心诉求
B、构建航空业务专属的知识图谱,关联手册章节、具体条款、业务场景、常见问题等信息,强化内容间的逻辑关联
C、简化AI服务系统的返回机制,减少冗余章节的展示,仅提取与用户查询高度匹配的关键句子片段
D、在用户输入查询时,引导用户补充精确的手册章节编号或核心关键词,缩小检索范围
答案:AB
标签:RAG,检索
一家AI应用可以辅助有关部门制作案情推演材料,通过融合文档片段与证物照片来生成图文并茂的案情摘要。为确保交付给客户的产出是专业且负责任的,以下哪些流程是强制性的?
A、将AI生成的内容提交给另一个知名的开源通用大模型进行事实核查。
B、对模型训练的案情资料进行彻底的、不可逆的匿名化和脱敏处理。
C、所有AI生成的摘要在交付前,需交由人类法律专家进行审核确认。
D、为AI生成的每一项关键事实建立可溯源机制,明确链接原始证物。
答案:BCD
标签:安全合规
某顶尖医院计划开发一个"多模态肺癌风险筛查辅助系统",目标是高精度地识别潜在的早期病灶,并对医生报告中可能存在的描述与影像不符之处进行高亮提示。准确性、可解释性和安全性是最高优先级。为了构建一个在临床上高度可靠、值得信赖的系统,你会采用哪些关键技术或设计?
A、为了快速提升模型泛化能力,参考ImageNet,需要大量获取互联网上公开的肺部影像数据集,与医院内部数据集直接合并进行训练。
B、采用多模态模型,输入丰富的各类医疗检测数据,端到端一次性输出风险评分和修正报告。
C、设计一个基于多智能体的"审核"流程:一个Vision Agent分析影像,一个TextAgent分析报告,一个Clinical Agent参照权威医学知识库(如UMLS)对前两者的发现进行交叉验证。
D、图像理解模型在输出"是否存在病灶"的结论时,可以同步生成注意力图(Attention Map),在CT影像上标示出判断依据的区域。
答案:CD
标签:多模态,安全合规
一家智能家居公司重新设计空调控制面板,需优化老年人使用体验。下列哪些改进符合交互设计原则?
A、模式切换时,联机播放防寒保暖的保健品广告或夏季登山潜水旅游好去处
B、待机界面显示放大版时钟,右上角固定显示空气质量指数,超过警戒值自动弹出红色警示框
C、将温度调节按钮放大,每次操作伴随"嘀"声反馈,持续按住按钮时数值变化速度逐渐加快
D、增加语音唤醒词,识别成功时面板呼吸灯闪烁
答案:BCD
标签:用户体验
用户反馈你开发的客服机器人连续返回乱码,排查发现:1. 用户语音已经成功上传网络存储,2. 调用语音理解服务后日志显示「模型解析失败」,3. 独立部署的模型服务的监控显示QPS突增500%,哪些项是可能的原因?
A、前端生成的语音文件格式与模型期望不匹配
B、模型在高并发下过载,处理能力达到上限
C、突增请求中包含大量触发模型Bug的异常音频
D、语言模型未针对专业术语做优化,意图理解准确率低
答案:ABC
标签:安全合规
打造一款面向故宫等大型历史文化景区的"沉浸式AI导游",允许游客使用手机或专用设备实时理解游客眼前的景象(如某个宫殿、文物),并结合游客的语音提问,提供流畅、低延迟、富有情感的语音讲解。一个关键的现实约束是:景区内人流密集,移动网络信号可能非常不稳定或时断时续。以下哪些架构设计和技术选型组合最为关键和高效?
A、建立高清视频通道,将语音识别、视觉分析、LLM推理、语音合成全部放在云端服务器执行,以确保最高质量的回答。
B、部署一个能完美覆盖、无缝漫游且能承载数万并发用户高质量连接的Wi-Fi网络,要求用户必须连接到景区提供的专用Wi-Fi,通过服务质量(QoS)保障,强制所有数据流通过该稳定信道进行传输。
C、在设备端预置高质量的TTS(文本转语音)语音包和核心景点的多媒体资料,由LLM在云端生成讲解文本后,指令设备端进行本地合成与播放。
D、优先在设备端部署轻量级视觉模型进行快速目标识别,并将识别出的实体ID(如"太和殿")而非原始图像帧上传,以降低网络负载。
答案:CD
标签:多模态,Agent
一家律所计划构建一个AI助手,辅助律师基于内部案件数据库(用于RAG)起草法律文书。为从技术架构层面有效缓解客户信息泄露风险,应集成哪些设计?
A、部署端到端加密存储方案,对案件数据库中的客户隐私信息(如身份信息、涉案细节)进行加密处理,仅授权进程可解密调用
B、构建精细化RBAC权限体系,按律师所属业务线、案件参与权限划分数据访问范围,禁止跨案件、跨权限查询客户敏感数据
C、集成数据脱敏引擎,在RAG检索、大模型生成法律文书的过程中,自动屏蔽客户身份证号、手机号、住址等敏感字段(如用"***"替换关键字符)
D、新增操作审计日志模块,记录AI助手的所有数据访问、文书生成操作,包含访问人、访问时间、数据范围等信息,支持异常行为追溯
答案:ABCD
标签:安全合规
一家教育科技公司拟开发高级AI教学产品,旨在实现个性化、智能化、普惠教育。从多智能体协作与自适应教学系统设计的角度,以下哪些系统架构方案是达成其核心目标的有效策略?
A、依赖人工专家团队进行实时干预,作为教学策略调整的主要驱动力。
B、部署基于共享内存的黑板(Blackboard)系统,实现各智能体间实时信息交换与决策。
C、要求用户统一购买经过认证的高性能设备,将所有核心AI推理功能部署在用户设备上,避免隐私风险。
D、设计分层智能体架构,由策略智能体、教学智能体和评估智能体协同规划学习路径。
答案:BD
标签:Agent,教育
你正在对大模型进行LORA微调,但在训练过程中发现模型开始过拟合,可采取的优化措施包括?
A、使用早停法及时终止训练
B、增加训练数据的多样性和数量
C、适当增大batch size
D、适当增大lora_rank值
答案:ABC
标签:微调
以下哪些方法,有助于降低大模型使用成本?
A、精简输入提示词篇幅,同时要求大模型输出精简的内容
B、根据任务复杂度,选择参数量合适的大模型
C、对于任何任务,始终选择参数量较大的模型
D、对于可以通过预定义逻辑、固定模板或经典算法高效完成的任务,不使用大模型处理
答案:ABD
标签:成本
如果你需要自行部署大模型用于推理服务,以下哪些方案有助于提升推理速度?
A、对于长文本生成场景,启用KVCache
B、使用CPU集群替代GPU,利用多线程并行处理请求
C、使用经过量化的模型,并且评测确认量化后的模型效果符合业务需求
D、任何场景,始终优先使用大参数量模型
答案:AC
标签:推理
RAG应用在检索时共召回了10条切片,其中3条高度相关,但这3条内容都来自相邻段落,却被系统拆分成不同切片,从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度?
A、调整切片大小使其覆盖完整更大段落范围
B、使用按照语义的切片策略,切分出语义更完整的切片
C、提高temperature参数控制生成多样性
D、采用滑动窗口策略生成重叠的文本切片
答案:ABD
标签:RAG,文档切片
在实际工作中,哪些因素可能影响你构建RAG应用的速度?
A、需要更快地捕捉业务机会
B、没有时间投入到细节完善中
C、模型训练速度
D、数据存储需求
答案:ABD
标签:RAG
单选题
一家律所的 AI 助手在分析合同风险时,频繁引用一个已被新司法解释推翻的相似案例。系统目前仅采用向量检索召回 top-k 内容。为了更好地解决此问题,应采取哪项措施?
A、从向量索引中定期清除所有已被新司法解释覆盖的案例
B、切换到多向量检索,为文档内容和法律实体分别创建嵌入
C、增强提示词,指令模型在生成摘要时优先采信最新日期的文档
D、生成前先结合"时效性"等业务字段进一步重排和过滤
答案:D
标签:RAG,时效性,重排
一家重型设备制造商,为现场技术员提供 AI 维修指南,但架构师要求所有历史规范都必须保留用于合规审计。你担心如果 RAG 系统引用已废弃的设计规范,可能导致维修错误。你应如何解决这个问题?
A、优化系统提示词,指令模型忽略旧版本并解释其选择
B、建立与原有业务系统的实时数据同步,确保数据源的唯一性。
C、获取知识块时附加版本与元数据标签,并在检索时过滤
D、在应用层过滤,输出回答前,过滤掉过期文档索引
答案:C
标签:RAG,版本控制,过滤
你在设计儿童教育类智能应用,客户要求需同时满足安全性和趣味性。以下哪种交互方案最合理?
A、所有教学内容仅以全屏视频展示,观看期间禁用物理按键,视频结束后弹出知识测验
B、采用卡通语音陪伴助手,敏感操作需家长手机端二次验证,错误操作时用震动+彩色光带提示
C、主界面设置 20 个高亮功能导航按钮,点击任意区域即时播放提示音,夜间自动切换深色模式
D、内置家长监控摄像头,孩子使用超过1小时自动锁屏并通过人脸识别判断是否成年用户
答案:B
标签:安全合规,儿童,交互设计
某团队使用通义千问 API 开发智能问答应用,为了快速实现回答实时外部问题(如"今天的天气")的能力,可以首先使用哪种方案?
A、指派资源,手动开发一个天气查询插件
B、升级到最新发布的更大参数规模的模型
C、启用平台提供的联网搜索功能
D、通过多轮对话设计,引导模型回答实时问题
答案:C
标签:通义千问,联网搜索,API
你用多模态技术开发短视频智能剪辑工具时,提出以下四个方案步骤,其中不合理的步骤是?
A、用 RAG 增强技术提升视频的饱和度对比度
B、用视频理解模型分析视频中的人物动作
C、用语音合成模型为合成视频添加官方解说
D、用文生图模型将新场景与原视频人物合成
答案:A
标签:多模态,RAG,视频处理
一家智能客服系统初期采用了昂贵的旗舰大模型(如GPT-N),虽然效果很好,但运营发现70%的用户问题都是"如何登录""忘记密码"这类高频简单问题。为了节约API调用成本,团队应该优先采用哪种架构调整?
A、微调整旗舰大模型,使其能更快地回答这些高频问题
B、先用轻量级模型识别意图按任务路由,对复杂问题调用旗舰模型
C、选择价格更低的API服务套餐
D、限制每位用户的日均提问次数,并对超出部分进行收费
答案:B
标签:成本优化,意图识别,路由
你开发的AI客服系统出现以下异常:用户发送"我想看红色连衣裙的3D展示"时,系统返回文字描述但无图像,当用户发送产品视频时,系统无法提取关键参数,语音回复存在机械音且断句不自然,上述异常对应的技术缺陷依次是?
A、3D渲染超时→OCR识别失败→语音克隆失真
B、文本生成错误→视频合成中断→音频采样率异常
C、文生图失败→视频理解异常→语音合成缺陷
D、多模态融合故障→抽帧算法错误→TTS模型过拟合
答案:C
标签:多模态,视频理解,语音合成