阿里云云计算ACA - ACP认证考试模拟试卷三

[（一）主流 ACP 方向（云计算 / 云安全 / 大数据等）题型](#（一）主流 ACP 方向（云计算 / 云安全 / 大数据等）题型)

[（二）大模型 ACP（特殊）](#（二）大模型 ACP（特殊）)

[三、阿里云云计算ACA - ACP认证考试模拟试卷](#三、阿里云云计算ACA - ACP认证考试模拟试卷)

[（一）单选题：70 题 × 1 分 = 70 分](#（一）单选题：70 题 × 1 分 = 70 分)

[1. 下列Assistant API示例代码中，forward_and_submit_outputs函数的核心功能是什么?](#1. 下列Assistant API示例代码中，forward_and_submit_outputs函数的核心功能是什么?)

[2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常，并打印错误信息？处理 classify_intent 函数可能抛出的异常，并打印错误信息？](#2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常，并打印错误信息？处理 classify_intent 函数可能抛出的异常，并打印错误信息？)

[3. 大模型在处理输入文本时，第一步通常执行的操作是？](#3. 大模型在处理输入文本时，第一步通常执行的操作是？)

[4. 在检索阶段，embedding模型如何找到与用户问题最相似的文本段？](#4. 在检索阶段，embedding模型如何找到与用户问题最相似的文本段？)

[5. 在大语言模型的安全风险中，〝不安全的插件设计"可能导致哪些后果？](#5. 在大语言模型的安全风险中，〝不安全的插件设计“可能导致哪些后果？)

[6. 你想使用 Qwen - Max 从一段冗长的课程文本中提炼出关键信息，用于创建 PPT 脚本。以下哪个提示词最合适？](#6. 你想使用 Qwen - Max 从一段冗长的课程文本中提炼出关键信息，用于创建 PPT 脚本。以下哪个提示词最合适？)

[7. 在切片向量化与存储阶段，以下哪种 Embedding 模型通常表现更好？](#7. 在切片向量化与存储阶段，以下哪种 Embedding 模型通常表现更好？)

[8. 在 qwen2.5-1.5b 模型微调时，训练损失快速震荡甚至开始上升，说明模型当前处于？](#8. 在 qwen2.5-1.5b 模型微调时，训练损失快速震荡甚至开始上升，说明模型当前处于？)

[9. 在进行大模型微调项目调研和业务可行性研究阶段，以下哪个角色对项目的成功尤为关键？](#9. 在进行大模型微调项目调研和业务可行性研究阶段，以下哪个角色对项目的成功尤为关键？)

[10. 在大模型的使用过程中，以下哪项属于其主要的安全合规风险？](#10. 在大模型的使用过程中，以下哪项属于其主要的安全合规风险？)

[11. 在问题改写中，以下哪种方法通过生成假想文档来增强检索效果？](#11. 在问题改写中，以下哪种方法通过生成假想文档来增强检索效果？)

[12. 在RAG应用的多轮对话中，直接将用户输入与文本段进行相似度比较可能会导致什么问题？](#12. 在RAG应用的多轮对话中，直接将用户输入与文本段进行相似度比较可能会导致什么问题？)

[13. 为什么我们要在微调中使用早停法？](#13. 为什么我们要在微调中使用早停法？)

[14. 以下哪项是流式输出的主要优势？](#14. 以下哪项是流式输出的主要优势？)

[15. 在大模型推理阶段，模型如何选择下一个输出的Token？](#15. 在大模型推理阶段，模型如何选择下一个输出的Token？)

[16. 如果你想深入了解如何实际运用 GraphRAG，可以参考哪个教程？](#16. 如果你想深入了解如何实际运用 GraphRAG，可以参考哪个教程？)

[17. top_p（nucleus sampling）参数的主要作用是什么？](#17. top_p（nucleus sampling）参数的主要作用是什么？)

[18. 在示例中，提示词明确的任务需求是什么？](#18. 在示例中，提示词明确的任务需求是什么？)

[19. 在设计LLM提示词时要求模型生成特定风格的文档时，以下哪项不是必要的？](#19. 在设计LLM提示词时要求模型生成特定风格的文档时，以下哪项不是必要的？)

[20. 在示例中，COT方法如何帮助大模型计算总差旅费用？](#20. 在示例中，COT方法如何帮助大模型计算总差旅费用？)

[21. 大模型如通义千问API在自动处理文本任务时，主要优势在于：](#21. 大模型如通义千问API在自动处理文本任务时，主要优势在于：)

[22. 在大型语言模型中，为什么需要对模型生成的内容进行检查？](#22. 在大型语言模型中，为什么需要对模型生成的内容进行检查？)

[23. 在下列描述中，哪一个不是斯坦福小镇项目的特点？](#23. 在下列描述中，哪一个不是斯坦福小镇项目的特点？)

[24. 开发医疗问答系统时发现模型频繁产生"幻觉"，应优先采取哪种优化组合？](#24. 开发医疗问答系统时发现模型频繁产生”幻觉”，应优先采取哪种优化组合？)

[25. 以下哪个代码片段最适合帮助RAG应用将文本片段转换为向量表示?](#25. 以下哪个代码片段最适合帮助RAG应用将文本片段转换为向量表示?)

[26. 关于输入数据的描述，以下哪项是正确的？](#26. 关于输入数据的描述，以下哪项是正确的？)

[27. 以下哪个选项最适合用于请求大模型总结一篇文章的主要内容？](#27. 以下哪个选项最适合用于请求大模型总结一篇文章的主要内容？)

[28. 在大模型调用外部 API 工具时，你发现 agent 经常调用错误的工具。经过调查，最可能的原因是什么？](#28. 在大模型调用外部 API 工具时，你发现 agent 经常调用错误的工具。经过调查，最可能的原因是什么？)

[29. 大模型应用中处理个人信息的人员变更时，以下哪个选项是要首先执行的？](#29. 大模型应用中处理个人信息的人员变更时，以下哪个选项是要首先执行的？)

[30. 大模型如何判断什么时候应该停止输出？](#30. 大模型如何判断什么时候应该停止输出？)

[31. 在低温度（temperature=0.1）设置下，大模型的输出会有什么特点？](#31. 在低温度（temperature=0.1）设置下，大模型的输出会有什么特点？)

[32. 你开发了一个 RAG 应用，发现用户经常连续提问（多轮对话），但是当前应用还不支持多轮对话，你应该怎么改造检索步骤来进行适配？选项：](#32. 你开发了一个 RAG 应用，发现用户经常连续提问（多轮对话），但是当前应用还不支持多轮对话，你应该怎么改造检索步骤来进行适配？选项：)

[33. 下列Assistant API示例代码中，verify_status_code函数的作用是什么?](#33. 下列Assistant API示例代码中，verify_status_code函数的作用是什么?)

[34. 在需要生成明确答案的场景中，建议如何设置temperature参数？](#34. 在需要生成明确答案的场景中，建议如何设置temperature参数？)

[35. 在代码中，score.to_pandas() 的主要作用是什么？](#35. 在代码中，score.to_pandas() 的主要作用是什么？)

[36. 在私有知识问答场景中，直接传入私域知识相关的参考信息的缺点是什么？](#36. 在私有知识问答场景中，直接传入私域知识相关的参考信息的缺点是什么？)

[37. 在文档审阅中，为什么不建议一次输出所有的结果？](#37. 在文档审阅中，为什么不建议一次输出所有的结果？)

[38. 在RAG应用的建立索引阶段，主要目的是什么？](#38. 在RAG应用的建立索引阶段，主要目的是什么？)

[39. 在检索召回阶段，以下哪种方法用于在检索前还原用户真实意图？](#39. 在检索召回阶段，以下哪种方法用于在检索前还原用户真实意图？)

[40. 在一个电商客服 RAG 系统中，如果过度追求召回率，可能会导致哪些问题？](#40. 在一个电商客服 RAG 系统中，如果过度追求召回率，可能会导致哪些问题？)

[41. 以下哪个选项属于我们在本教程中介绍的RAG应用范围？](#41. 以下哪个选项属于我们在本教程中介绍的RAG应用范围？)

[42. 在开发基于大语言模型的RAG应用过程中，下哪种做法不能保证"关键数据的语义独立性与完整性"?](#42. 在开发基于大语言模型的RAG应用过程中，下哪种做法不能保证"关键数据的语义独立性与完整性"?)

[43. RAG（Retrieval Augmented Generation）的主要目的是什么？](#43. RAG（Retrieval Augmented Generation）的主要目的是什么？)

[44. 多Agent系统通过模拟或利用多个交互的智能体（Agents）来解決复杂问题，具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高？](#44. 多Agent系统通过模拟或利用多个交互的智能体（Agents）来解決复杂问题，具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高？)

[45. 在ask_llm_route函数中，如果问题类型是"内容翻译"，会使用哪个提示词？](#45. 在ask_llm_route函数中，如果问题类型是“内容翻译”，会使用哪个提示词？)

[46. 以下哪种情况最适合将文档拆分成更小的分块？](#46. 以下哪种情况最适合将文档拆分成更小的分块？)

[47. 在切片向量化与存储阶段，以下哪些是 compare_embeddings 函数的作用？](#47. 在切片向量化与存储阶段，以下哪些是 compare_embeddings 函数的作用？)

[48. 在代码中，evaluate 函数的主要作用是什么？](#48. 在代码中，evaluate 函数的主要作用是什么？)

[49. 在构建 RAG 应用时，以下哪种向量存储方案适合生产环境？](#49. 在构建 RAG 应用时，以下哪种向量存储方案适合生产环境？)

[50. 在切片向量化与存储阶段，以下哪种方法用于比较不同 Embedding 模型的文本相似度？](#50. 在切片向量化与存储阶段，以下哪种方法用于比较不同 Embedding 模型的文本相似度？)

[51. 某大学为学生提供一款问答机器人，能回答课程安排和考试时间。学校想新增"自助预定自习室功能，需要查询并预定教室资源。要使这个功能能与现有问答无缝集成，合适的做法是什么？](#51. 某大学为学生提供一款问答机器人，能回答课程安排和考试时间。学校想新增“自助预定自习室功能，需要查询并预定教室资源。要使这个功能能与现有问答无缝集成，合适的做法是什么？)

[52. 在优化检索效果时，以下哪种方法可以提升文档的结构性？](#52. 在优化检索效果时，以下哪种方法可以提升文档的结构性？)

[53. 检索增强式生成（RAG）应用的主要优势是什么？](#53. 检索增强式生成（RAG）应用的主要优势是什么？)

[54. 以下哪个用户查询语句无法有效地指导大语言模型进行文本摘要?](#54. 以下哪个用户查询语句无法有效地指导大语言模型进行文本摘要?)

[55. 为缩短响应时延，你想在索引前减少切片数量，每个切片包含 2-3 页内容。结果发现，回答容易混进无关信息。导致无关信息的根本原因是什么？](#55. 为缩短响应时延，你想在索引前减少切片数量，每个切片包含 2-3 页内容。结果发现，回答容易混进无关信息。导致无关信息的根本原因是什么？)

[56. 要将索引持久化到磁盘，应使用以下哪个方法？](#56. 要将索引持久化到磁盘，应使用以下哪个方法？)

[57. 觉得提示词模板怎么设计效果最好？假设chunk为召回的知识库文本块，query为用户问题。](#57. 觉得提示词模板怎么设计效果最好？假设chunk为召回的知识库文本块，query为用户问题。)

[58. 在示例中，答疑机器人没有理解用户的意图，主要原因是什么？](#58. 在示例中，答疑机器人没有理解用户的意图，主要原因是什么？)

[59. 在设计大模型提示词时，以下哪项原则最重要？](#59. 在设计大模型提示词时，以下哪项原则最重要？)

[60. 生成式大模型可能会引发内容安全风险，以下哪个选项不属于内容安全风险?](#60. 生成式大模型可能会引发内容安全风险，以下哪个选项不属于内容安全风险?)

[61. 在调用大语言模型对话的API过程中，以下哪个代码片段正确地使用了system角色来指示模型扮演一个友好的客服代表?](#61. 在调用大语言模型对话的API过程中，以下哪个代码片段正确地使用了system角色来指示模型扮演一个友好的客服代表?)

[62. 以下哪种方式有助于在大模型多轮对话场景中，保障生成内容质量的同时，降低成本，并提升响应速度？](#62. 以下哪种方式有助于在大模型多轮对话场景中，保障生成内容质量的同时，降低成本，并提升响应速度？)

[63. 在优化检索效果时，以下哪些方法可以增加召回的文档切片数量？](#63. 在优化检索效果时，以下哪些方法可以增加召回的文档切片数量？)

[64. 在多模态协同学习框架下，不同模态的数据如何协作以提升学习效果？](#64. 在多模态协同学习框架下，不同模态的数据如何协作以提升学习效果？)

[65. 你在调用通义干问 API 时设置了 temperature（温度）参数，以下哪种说法是正确的？](#65. 你在调用通义干问 API 时设置了 temperature（温度）参数，以下哪种说法是正确的？)

[66. 在以下代码片段中，is_chat_model=True的作用是什么？](#66. 在以下代码片段中，is_chat_model=True的作用是什么？)

[67. 检查以下代码，如果需要添加一个新的意图类别，例如 "入职流程"，需要修改哪一部分代码？ # 获取用户意图的核心算法 def get_purpose(document): prompt_template="【角色背景】你是一个专业的管理者，你将阅读一条用户的问题并进行用户意图分类【任务要求】我们需要将用户的意图分成如下几类：请假政策，福利待遇，绩效考核，工作职责，开发规范【输出要求】请以 json 格式输出，不要输出其他内容格式如{"purpose":"请假政策","query":"请假流程是怎样的，需要提前多久申请？"} 其中，purpose 是你识别出的意图，query 是用户输入的原始文本【用户输入】 query = prompt_template + document"](# 获取用户意图的核心算法 def get_purpose(document): prompt_template=”【角色背景】你是一个专业的管理者，你将阅读一条用户的问题并进行用户意图分类【任务要求】我们需要将用户的意图分成如下几类：请假政策，福利待遇，绩效考核，工作职责，开发规范【输出要求】请以 json 格式输出，不要输出其他内容格式如{"purpose":"请假政策","query":"请假流程是怎样的，需要提前多久申请？"} 其中，purpose 是你识别出的意图，query 是用户输入的原始文本【用户输入】 query = prompt_template + document“)

[68. 以下哪种存储最适合用于区分不同的对话轮次或历史记录？](#68. 以下哪种存储最适合用于区分不同的对话轮次或历史记录？)

[69. 在大语言模型微调的数据准备阶段，哪个操作是为了将文本拆分成单词或词汇单元？](#69. 在大语言模型微调的数据准备阶段，哪个操作是为了将文本拆分成单词或词汇单元？)

[70. 在一次评审会上，大家针对同一条问答的准确性产生分歧，工程师认为回答和问题语义相似度高，业务负责人则认为回答中有错误细节。该争议主要反映了什么？](#70. 在一次评审会上，大家针对同一条问答的准确性产生分歧，工程师认为回答和问题语义相似度高，业务负责人则认为回答中有错误细节。该争议主要反映了什么？)

[（二）多选题：30 题 × 1 分 = 30 分](#（二）多选题：30 题 × 1 分 = 30 分)

[1. 在提示词框架中，以下哪些要素是必要的？](#1. 在提示词框架中，以下哪些要素是必要的？)

[2. 通过 LlamaIndex 创建 RAG 应用，在修改默认 prompt 时，包含以下哪些步骤？](#2. 通过 LlamaIndex 创建 RAG 应用，在修改默认 prompt 时，包含以下哪些步骤？)

[3. 在下面的代码片段中，哪些是微调大语言模型训练循环中必要的步骤？](#3. 在下面的代码片段中，哪些是微调大语言模型训练循环中必要的步骤？)

[4. 在构建 RAG 应用时，大模型可以用于哪些其他应用场景？](#4. 在构建 RAG 应用时，大模型可以用于哪些其他应用场景？)

[5. 在优化后的答疑机器人中，以下哪种问题不需要经过RAG链路？](#5. 在优化后的答疑机器人中，以下哪种问题不需要经过RAG链路？)

[6. 在构建 RAG 应用时，哪些高级 RAG 课题值得探索？](#6. 在构建 RAG 应用时，哪些高级 RAG 课题值得探索？)

[7. 你负责的短视频平台在接入多模态技术后出现故障。 1: 用户输入 "生成夏日海滩 vlog 背景" 时，系统返回静态图片而非视频 2：视频自动剪辑功能无法识别冲浪板等特定物体 3：添加的 AI 解说语音与动画动作不同步需要重点检查的技术环节是？](#7. 你负责的短视频平台在接入多模态技术后出现故障。 1: 用户输入 “生成夏日海滩 vlog 背景” 时，系统返回静态图片而非视频 2：视频自动剪辑功能无法识别冲浪板等特定物体 3：添加的 AI 解说语音与动画动作不同步需要重点检查的技术环节是？)

[8. 在自定义提示词模板中，以下哪些是用于约束大模型行为的注意事项？](#8. 在自定义提示词模板中，以下哪些是用于约束大模型行为的注意事项？)

[9. 你正在开发一个机器学习领域的答疑机器人，辅助学生学习，但你对该领域专业知识掌握有限，以下哪些策略更有助于你改进提示词设计？](#9. 你正在开发一个机器学习领域的答疑机器人，辅助学生学习，但你对该领域专业知识掌握有限，以下哪些策略更有助于你改进提示词设计？)

[10. 你发现检索到的切片里常常遗漏上下文，导致回答片段化。下列哪些是有效且合理的改进措施？](#10. 你发现检索到的切片里常常遗漏上下文，导致回答片段化。下列哪些是有效且合理的改进措施？)

[11. RAG 应用在检索时共召回了 10 条切片，其中 3 条高度相关，但 3 条内容都来自相邻段落，却被系统拆分成不同切片，从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度？](#11. RAG 应用在检索时共召回了 10 条切片，其中 3 条高度相关，但 3 条内容都来自相邻段落，却被系统拆分成不同切片，从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度？)

[12. 在优化后的答疑机器人中，以下哪些是提示词中规定的任务要求？](#12. 在优化后的答疑机器人中，以下哪些是提示词中规定的任务要求？)

[13. 在提取标签的过程中，以下哪些标签类型是支持的？](#13. 在提取标签的过程中，以下哪些标签类型是支持的？)

[14. 某教育问答系统上线后，你通过监控日志发现模型有时会返回个人隐私信息，为防止此类敏感信息泄露，可以采取以下哪三项措施？](#14. 某教育问答系统上线后，你通过监控日志发现模型有时会返回个人隐私信息，为防止此类敏感信息泄露，可以采取以下哪三项措施？)

[15. 在决定模型微调前，你应该考虑以下哪些事情？](#15. 在决定模型微调前，你应该考虑以下哪些事情？)

[16. 以下哪些代码片段可以有效地对用户输入进行清洗和预处理，以提高大模型应用的安全性？](#16. 以下哪些代码片段可以有效地对用户输入进行清洗和预处理，以提高大模型应用的安全性？)

[17. 以下哪三种场景更需要防范AI模型"幻觉"的风险？](#17. 以下哪三种场景更需要防范AI模型"幻觉"的风险？)

[18. 你要给多个未归档的 Keynote 文档创建索引，这些文档中包括表格、流程图等复杂内容。在"文档解析"环节，你可以怎么做？](#18. 你要给多个未归档的 Keynote 文档创建索引，这些文档中包括表格、流程图等复杂内容。在“文档解析”环节，你可以怎么做？)

[19. 如果你的业务流程比较复杂，可以借助百炼上的哪些工具来构建更强大的应用？](#19. 如果你的业务流程比较复杂，可以借助百炼上的哪些工具来构建更强大的应用？)

[20. 在 Ragas 中，以下哪些指标用于评估检索召回效果？](#20. 在 Ragas 中，以下哪些指标用于评估检索召回效果？)

[21. 在大模型的问答工作流程中，以下哪些阶段涉及模型的推理过程？](#21. 在大模型的问答工作流程中，以下哪些阶段涉及模型的推理过程？)

[22. 你正在优化一个 RAG 系统，发现某些相似文本对的向量相似度较低，以下哪两种方法可以改善这种情况？](#22. 你正在优化一个 RAG 系统，发现某些相似文本对的向量相似度较低，以下哪两种方法可以改善这种情况？)

[23. 微调 qwen2.5 - 1.5b 模型过程中发现模型开始欠拟合，可采取的优化措施包括？](#23. 微调 qwen2.5 - 1.5b 模型过程中发现模型开始欠拟合，可采取的优化措施包括？)

[24. faithfulness、answer_relevancy、context_recall、context_precision 这些指标中，哪些指标仅评估检索阶段的性能？](#24. faithfulness、answer_relevancy、context_recall、context_precision 这些指标中，哪些指标仅评估检索阶段的性能？)

[25. 在切片向量化与存储阶段，以下哪些是更新的 Embedding 模型？](#25. 在切片向量化与存储阶段，以下哪些是更新的 Embedding 模型？)

[26. 某跨境电商平台的客服系统需要处理多语言用户咨询，在进行文本合规检查时发现部分违规内容无法被检测出来。哪两个方案能提供多语言文本的合规检查效果？](#26. 某跨境电商平台的客服系统需要处理多语言用户咨询，在进行文本合规检查时发现部分违规内容无法被检测出来。哪两个方案能提供多语言文本的合规检查效果？)

[27. 在 context precision 的计算过程中，以下哪些步骤是必要的？](#27. 在 context precision 的计算过程中，以下哪些步骤是必要的？)

[28. 以下哪些代码片段可以用于检测用户输入中是否包含敏感词？](#28. 以下哪些代码片段可以用于检测用户输入中是否包含敏感词？)

[29. 在使用大语言模型时，什么是"样例"的作用？](#29. 在使用大语言模型时，什么是“样例”的作用？)

[30. 大语言模型微调相比预训练的优势有哪些?](#30. 大语言模型微调相比预训练的优势有哪些?)

[四、致备考 ACP 的每一位同学](#四、致备考 ACP 的每一位同学)

一、阿里云云计算ACP认证考试

请认真阅读考试须知后，准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。

答题开始即开始计时，中途不可暂停，如超时则自动提交

1、考试共 (100) 道题，总分100分，及格分数80分

2、考试需在（120分钟）内交卷，过程中无法暂停，请提前安排好时间；如未及时交卷，则本次考试作废

3、推荐使用 Chrome 浏览器（版本：73及以上的正式版本），或Firefox浏览器（版本：66及以上的正式版本)

4、开始答题前会进行身份验证，需要您拍摄并上传身份证人像面照片，并按照系统要求开启摄像头进行面部识别

5、考试过程中请保持摄像头开启并对准面部，系统会不定时进行抓拍，并与身份证照片做对比，如发现作弊行为，您的考试成绩将作废

6、考试过程中，系统将判断您的浏览器状态，如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为，以及弹出广告弹窗，将会给出警告。如果次数过多您的考试成绩将作废

7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件，以免影响您的考试

二、基本要求解读

阿里云 ACP 考试以客观题为主，无主观题、无实验题，整体为120 分钟、100 题、满分 100 分、 80 分及格。

（一）主流 ACP 方向（云计算 / 云安全 / 大数据等）题型

单选题 ：70 题 × 1 分 = 70 分
- 四选一，只有 1 个正确答案
- 侧重基础概念、产品功能、操作流程、简单场景判断
多选题 ：30 题 × 1 分 = 30 分
- 五选多，多选、少选、错选均不得分
- 侧重架构设计、方案选型、多产品组合、最佳实践、安全策略

（二）大模型 ACP（特殊）

单选题 ：50 题 × 1 分 = 50 分
多选题 ：25 题 × 2 分 = 50 分
总分100 分 ，及格线80 分

（三）答题规则

闭卷机考，中途不可暂停、不可回看、提交后无法修改
超时自动交卷
全程摄像头监控，切屏 / 弹窗过多会被警告

三、阿里云云计算ACA - ACP认证考试模拟试卷

备注：模拟试题库对应模拟试题按70:30-单选题-多选题，真题一般50:25

部分题对应代码在网络抓取中未提取到，暂时可忽略，适当猜测题库题型即可！

（一）单选题：70 题 × 1 分 = 70 分

1. 下列Assistant API示例代码中，forward_and_submit_outputs函数的核心功能是什么?

A. 创建新的Assistant

B. 向Assistant提交用户query

C. 执行function call并将结果提交给服务器

D. 创建新的Thread

E. 等待Run完成

2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常，并打印错误信息？处理 classify_intent 函数可能抛出的异常，并打印错误信息？

A. python for id, query in feedback_list: try: intent = classify_intent(query) print(f"ID: {id}, Intent: {intent}") finally: print("Finished processing query.")

B. python for id, query in feedback_list: intent = classify_intent(query) print(f"ID: {id}, Intent: {intent}") except Exception as e: print(f"Error: {e}")

C. python for id, query in feedback_list: try: intent = classify_intent(query) print(f"ID: {id}, Intent: {intent}") except Exception as e: print(f"Error processing query {id}: {e}")

D. python for id, query in feedback_list: if classify_intent(query): intent = classify_intent(query) print(f"ID: {id}, Intent: {intent}") else:print("Error processing query.")

3. 大模型在处理输入文本时，第一步通常执行的操作是？

A. 计算候选 Token 概率

B. Token 可量化

C. 计算 Embedding 后的向量

D. 对输入文本进行分词（Tokenize）

4. 在检索阶段，embedding模型如何找到与用户问题最相似的文本段？

A. 将用户问题转化为向量并在向量数据库中找出最相似的向量

B. 增加模型的训练数据

C. 减少模型的推理时间

5. 在大语言模型的安全风险中，〝不安全的插件设计"可能导致哪些后果？

A. 模型生成的文本含有歧视性内容

B. 模型无法处理政治敏感话题

C. 插件可能存在不安全的输入和不足的访问控制

6. 你想使用 Qwen - Max 从一段冗长的课程文本中提炼出关键信息，用于创建 PPT 脚本。以下哪个提示词最合适？

A. 用更少的字概括这段文字

B. 缩短这段文字

C. 从以下课程文本中提取关键信息，生成一个简洁的 PPT 脚本大纲，突出重点内容，并控制在 5 个要点以内。

D. 把这段文字变成 PPT

7. 在切片向量化与存储阶段，以下哪种 Embedding 模型通常表现更好？

A. 更新的 Embedding 模型

B. 旧的 Embedding 模型

C. 增加模型的训练数据

8. 在 qwen2.5-1.5b 模型微调时，训练损失快速震荡甚至开始上升，说明模型当前处于？

A. 过拟合

B. 训练成功

C. 训练失败

D. 欠拟合

9. 在进行大模型微调项目调研和业务可行性研究阶段，以下哪个角色对项目的成功尤为关键？

A. 数据工程师，负责数据预处理和清洗

B. 机器学习工程师，专注于模型架构调整和训练

C. 如营销、运营等业务工作者，提供业务领域知识指导数据集构建和评估

10. 在大模型的使用过程中，以下哪项属于其主要的安全合规风险？

A. 个人信息风险

B. 数据存储成本风险

C. 数据压缩风险

11. 在问题改写中，以下哪种方法通过生成假想文档来增强检索效果？

A. 用假设文档来增强检索（HyDE）

B. 重排序

C. 滑动窗口检索

12. 在RAG应用的多轮对话中，直接将用户输入与文本段进行相似度比较可能会导致什么问题？

A. 检索结果不准确

B. 检索速度变慢

C. 模型无法理解用户输入

13. 为什么我们要在微调中使用早停法？

A. 因为模型微调容易出现过拟合现象

B. 因为 eval_step 设计太大会导致过拟合

C. 微调学习率太小导致模型参数更新太慢

D. 微调轮次过少可能导致模型欠拟合

14. 以下哪项是流式输出的主要优势？

A. 降低模型推理错误率

B. 避免使用负载均衡

C. 提升用户感知的响应速度

D. 减少服务器计算资源消耗

15. 在大模型推理阶段，模型如何选择下一个输出的Token？

A. 随机选择一个Token

B. 根据候选Token的概率进行选择

C. 选择第一个候选Token

16. 如果你想深入了解如何实际运用 GraphRAG，可以参考哪个教程？

A. 使用 LlamaIndex 构建 GraphRAG 应用

B. 0代码构建私有知识问答应用

C. 可视化工作流、智能体编排

17. top_p（nucleus sampling）参数的主要作用是什么？

A. 控制模型使用的 CPU 核心数量。

B. 控制模型生成文本的长度。

C. 控制模型输出的格式。

D. 控制模型只考虑概率最高的几个词，例如这里设置 0.9，则模型只考虑累积概率前 90% 的词

18. 在示例中，提示词明确的任务需求是什么？

A. 对文本进行扩写和润色

B. 增加模型的训练数据

C. 减少模型的推理时间

19. 在设计LLM提示词时要求模型生成特定风格的文档时，以下哪项不是必要的？

A. 提供风格的具体定义

B. 列举与风格相关的形容词或短语

C. 要求模型忽略上下文信息

20. 在示例中，COT方法如何帮助大模型计算总差旅费用？

A. 将问题分解为子问题并逐步推导

B. 增加模型的训练数据

C. 减少模型的推理时间

21. 大模型如通义千问API在自动处理文本任务时，主要优势在于：

A. 需要大量人工预先编程每个细节

B. 能够理解并生成自然语言，适合处理大规模文本数据

C. 仅能处理简单的数学计算，无法进行复杂文本分析

22. 在大型语言模型中，为什么需要对模型生成的内容进行检查？

A. 为了确保内容的多样性

B. 为了确保没有不适宜、冒犯性或有害信息

C. 为了增加模型的复杂性

23. 在下列描述中，哪一个不是斯坦福小镇项目的特点？

A. 虚拟小镇中的人是智能体，在形式上他们可以规划自己的一天的主要日程。

B. 虚拟小镇中的人可以实现两两对话，由于设计限制，不能实现多人小组讨论。

C. 每个智能体都有自己的角色设定，从而让大模型参考生成该智能体的日程规划。

24. 开发医疗问答系统时发现模型频繁产生"幻觉"，应优先采取哪种优化组合？

A. 降低 LoRA 秩值 + 增大学习率

B. 增加训练 epoch + 提高相似度阈值

C. RAG 增强知识库 + LoRA 微调领域数据

D. 更换主参微调 + 减少 batch_size

25. 以下哪个代码片段最适合帮助RAG应用将文本片段转换为向量表示?

A. python from sentence_transformers import SentenceTransformer model = SentenceTransformer('all-mpnet-base-v2') def embed_text(text): return model.encode(text)

B. python def embed_text(text): return len(text)

C. python import hashlib def embed_text(text): return hashlib.sha256(text.encode()).hexdigest()

D. python import numpy as np def embed_text(text): return np.random.rand(100) # 随机生成一个100维向量

26. 关于输入数据的描述，以下哪项是正确的？

A. 输入数据应当明确具体含义及其用途

B. 输入数据不影响模型输出格式

C. 输入数据是可选的

D. 输入数据仅用于生成样例

E. 输入数据无需说明

F. 输入数据可以通过模糊的引导词来定义其作用

27. 以下哪个选项最适合用于请求大模型总结一篇文章的主要内容？

A. 用简洁的语言概括以下文章的核心观点：(文章内容)

B. 文章的主要内容是什么？(文章内容)

C. 重写这篇文章。

D. 这篇文章写了什么？

28. 在大模型调用外部 API 工具时，你发现 agent 经常调用错误的工具。经过调查，最可能的原因是什么？

A. 大模型缺乏足够的并行处理能力

B. 网络延迟导致工具调用超时

C. 工具函数调用过程中存在严重的内存泄漏

D. 工具函数描述信息不够明确，未能准确说明调用时机和用途

29. 大模型应用中处理个人信息的人员变更时，以下哪个选项是要首先执行的？

A. 重新取得用户同意

B. 提供数据备份

C. 通知相关机构

30. 大模型如何判断什么时候应该停止输出？

A. 只会在输出长度达到阈值时停止

B. 需要用户手动打断

C. 在输出长度达到阈值，或输出特殊 Token（如，end of sentence，即句子结束标记）

D. 当模型检测到生成内容与输入主题无关时自动停止

31. 在低温度（temperature=0.1）设置下，大模型的输出会有什么特点？

A. 输出内容非常多样化

B. 输出内容相对单一

C. 输出内容完全随机

32. 你开发了一个 RAG 应用，发现用户经常连续提问（多轮对话），但是当前应用还不支持多轮对话，你应该怎么改造检索步骤来进行适配？选项：

A. 检索时，先用大模型对历史对话以及用户输入进行总结，生成一个新的 query，然后用新query 输入向量数据库进行检索；

B. 检索时，由大模型判断哪些文本段是相关的；

C. 检索时将历史对话信息输入向量数据库进行检索；

D. 检索时，将用户的问题输入向量数据库进行检索；

33. 下列Assistant API示例代码中，verify_status_code函数的作用是什么?

A. 验证用户输入的query是否合法

B. 验证function call的参数是否正确

C. 验证API调用的返回状态码是否为200

D. 验证Assistant是否成功创建

E. 验证Thread是否成功创建

34. 在需要生成明确答案的场景中，建议如何设置temperature参数？

A. 设置较高的温度值

B. 设置较低的温度值

C. 使用默认温度值

35. 在代码中，score.to_pandas() 的主要作用是什么？

A. 将评估结果转换为 Pandas 数据框

B. 增加模型的训练数据

C. 减少模型的推理时间

36. 在私有知识问答场景中，直接传入私域知识相关的参考信息的缺点是什么？

A. 模型处理效率降低

B. 提示词长度有限

C. 模型无法理解私域知识

37. 在文档审阅中，为什么不建议一次输出所有的结果？

A. 只需关注营销表达

B. 大模型可能会漏掉一些错误

C. 内容错误不需要处理

D. 信息量过大，难以理解

38. 在RAG应用的建立索引阶段，主要目的是什么？

A. 将私有知识文档转换为高效检索的形式

B. 增加模型的训练数据

C. 提高模型的推理速度

39. 在检索召回阶段，以下哪种方法用于在检索前还原用户真实意图？

A. 问题改写

B. 重排序

C. 滑动窗口检索

40. 在一个电商客服 RAG 系统中，如果过度追求召回率，可能会导致哪些问题？

A. 检索结果数量不足，用户无法获得足够推荐。

B. 检索结果过少，用户找不到相关商品。

C. 检索条件过于严格，用户查询失败率增加。

D. 检索结果包含大量无关商品信息，影响用户体验。

41. 以下哪个选项属于我们在本教程中介绍的RAG应用范围？

A. 向大模型输入"请介绍一下自己"

B. 向大模型输入"现在几点了？"

C. 上传知识库文件后输入"我如果发表了专利，可以得到公司的什么奖励？"

42. 在开发基于大语言模型的RAG应用过程中，下哪种做法不能保证"关键数据的语义独立性与完整性"?

A. 将标题下的所有文本合成一个段落

B. 针对表格中每一行单元格的数据

C. 确保每个语义单元都有清晰的边界和完整的上下文信息

43. RAG（Retrieval Augmented Generation）的主要目的是什么？

A. 增加模型的训练数据

B. 为大模型提供参考资料以提高回答质量

C. 减少模型的推理时间

44. 多Agent系统通过模拟或利用多个交互的智能体（Agents）来解決复杂问题，具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高？

A. 简单的垃圾分类机器人，仅需识别并分拣几种固定类型的垃圾

B. 单一目标的军事侦察任务，如无人机监控

C. 大型物流仓库的自动化管理，需要同时调度上千台机器人

45. 在ask_llm_route函数中，如果问题类型是"内容翻译"，会使用哪个提示词？

A. translate_prompt

B. reviewed_prompt

C. query_engine

46. 以下哪种情况最适合将文档拆分成更小的分块？

A. 文档格式简单，例如纯文本文件。

B. 文档内容包含多个主题，信息量较大。

C. 文档内容非常简短，总共只有几句话。

D. 文档内容高度相关，主题单一。

47. 在切片向量化与存储阶段，以下哪些是 compare_embeddings 函数的作用？

A. 比较不同 Embeddin模型的文本相似度

B. 增加模型的训练数据

C. 减少模型的推理时间

48. 在代码中，evaluate 函数的主要作用是什么？

A. 评估数据集中的答案正确性

B. 增加模型的训练数据

C. 减少模型的推理时间

49. 在构建 RAG 应用时，以下哪种向量存储方案适合生产环境？

A. 云服务向量存储

B. 内存向量存储

C. 本地向量数据库

50. 在切片向量化与存储阶段，以下哪种方法用于比较不同 Embedding 模型的文本相似度？

A. compare_embeddings 函数

B. 增加模型的训练数据

C. 减少模型的推理时间

51. 某大学为学生提供一款问答机器人，能回答课程安排和考试时间。学校想新增"自助预定自习室功能，需要查询并预定教室资源。要使这个功能能与现有问答无缝集成，合适的做法是什么？

A. 在模型系统消息中提供大量备用的数据

B. 使用一个专门的 Agent 调用内部预定 API

C. 仅通过提示让模型推测当前可用教室

D. 在 Prompt 中写死可预约教室列表

52. 在优化检索效果时，以下哪种方法可以提升文档的结构性？

A. 使用 Markdown 格式

B. 增加模型的训练数据

C. 减少模型的推理时间

53. 检索增强式生成（RAG）应用的主要优势是什么？

A. 避免传入大量背景信息

B. 提高模型训练速度

C. 减少模型推理时间

54. 以下哪个用户查询语句无法有效地指导大语言模型进行文本摘要?

A. 请总结以下文章的主要内容：...

B. 提取以下文本的关键词：...

C. 请翻译以下文章：...

D. 将以下文章压缩到 100 字以内：...

E. 用一句话概括以下文字：

55. 为缩短响应时延，你想在索引前减少切片数量，每个切片包含 2-3 页内容。结果发现，回答容易混进无关信息。导致无关信息的根本原因是什么？

A. 文档内没有标题

B. 切片过大，且主题混杂

C. 切片过短，信息量不足

D. 大模型出现故障

56. 要将索引持久化到磁盘，应使用以下哪个方法？

A. index.store()

B. index.persist()

C. index.save()

D. index.storage_context.persist()

57. 觉得提示词模板怎么设计效果最好？假设chunk为召回的知识库文本块，query为用户问题。

A. 请回答：{query}

B. 请仔细阅读以下内容：{chunk}，回答问题：{query}

58. 在示例中，答疑机器人没有理解用户的意图，主要原因是什么？

A. 知识库中的上下文干扰

B. 增加模型的训练数据

C. 减少模型的推理时间

59. 在设计大模型提示词时，以下哪项原则最重要？

A. 简洁明确

B. 生动形象

C. 语言华丽

60. 生成式大模型可能会引发内容安全风险，以下哪个选项不属于内容安全风险?

A. 生成违法信息

B. 生成虚假内容

C. 生成不相关内容

61. 在调用大语言模型对话的API过程中，以下哪个代码片段正确地使用了system角色来指示模型扮演一个友好的客服代表?

A. messages = ${"role": "system", "content": "我想咨询一下退货流程."}$

B. messages = ${"role": "system", "content": "您好,请问有什么可以帮您的?"}$

C. messages = ${"role": "system", "content": "你是一位友好的客服代表,随时准备帮助客户解决问题."}$

62. 以下哪种方式有助于在大模型多轮对话场景中，保障生成内容质量的同时，降低成本，并提升响应速度？

A. 使用 Batch API

B. 并行调用大模型 API

C. 使用支持上下文缓存的大模型 API

D. 使用经过量化的模型

63. 在优化检索效果时，以下哪些方法可以增加召回的文档切片数量？

A. 调整 similarity_top_k 参数

B. 增加模型的训练数据

C. 减少模型的推理时间

64. 在多模态协同学习框架下，不同模态的数据如何协作以提升学习效果？

A. 通过独立学习各自模态的特征后直接合并

B. 利用一种模态的信号作为另一模态学习的辅助或引导

C. 仅依赖单一最强模态的数据进行训练

65. 你在调用通义干问 API 时设置了 temperature（温度）参数，以下哪种说法是正确的？

A. 温度参数越高，候选 Token 的概率值之间的差距会变大，从而带来更高的随机性

B. 温度参数越高，低概率的候选 Token 有概率超过高概率的候选 Token 的概率

C. 温度参数越高，候选 Token 的概率值会越接近，从而带来更高的随机性

D. 温度参数越高，越适合撰写技术报告、代码等有较高确定性需求的场景

66. 在以下代码片段中，is_chat_model=True的作用是什么？

A. 指定模型为聊天模型

B. 增加输出的多样性

C. 使输出更具确定性

67. 检查以下代码，如果需要添加一个新的意图类别，例如 "入职流程"，需要修改哪一部分代码？ # 获取用户意图的核心算法 def get_purpose(document): prompt_template="【角色背景】你是一个专业的管理者，你将阅读一条用户的问题并进行用户意图分类【任务要求】我们需要将用户的意图分成如下几类：请假政策，福利待遇，绩效考核，工作职责，开发规范【输出要求】请以 json 格式输出，不要输出其他内容格式如{"purpose":"请假政策","query":"请假流程是怎样的，需要提前多久申请？"} 其中，purpose 是你识别出的意图，query 是用户输入的原始文本【用户输入】 query = prompt_template + document"

A. 只需要修改输入的用户 query 列表

B. 需要修改输出格式要求。

C. 需要修改 prompt_template 中的【任务要求】部分，以及可能需要更新 get_purpose 函数中的逻辑。

D. 只需要修改大模型 query 函数 Q_S_Line

68. 以下哪种存储最适合用于区分不同的对话轮次或历史记录？

A. plaintext === 用户 === 你好 === 机器人 === 你好，有什么可以帮你？

B. plaintext 用户：你好机器人：你好，有什么可以帮你？

C. plaintext ## 用户你好 ## 机器人你好，有什么可以帮你？

D. plaintext <用户>> 你好 <机器人>> 你好，有什么可以帮你？

69. 在大语言模型微调的数据准备阶段，哪个操作是为了将文本拆分成单词或词汇单元？

A. 文本翻译

B. 数据去重

C. 分词(Tokenization)

D. 文本摘要

70. 在一次评审会上，大家针对同一条问答的准确性产生分歧，工程师认为回答和问题语义相似度高，业务负责人则认为回答中有错误细节。该争议主要反映了什么？

A. 词法分析不完善

B. 纯粹的向量相似度不足以衡量业务正确性

C. 检索速度过慢

D. 大模型对中文支持度不足

（二）多选题：30 题 × 1 分 = 30 分

1. 在提示词框架中，以下哪些要素是必要的？

A. 任务目标（Object）

B. 上下文（Context）

C. 角色（Role）

D. 受众（Audience）

2. 通过 LlamaIndex 创建 RAG 应用，在修改默认 prompt 时，包含以下哪些步骤？

A. 定义新的 prompt 字符串，将 chunk 和 query 的位置空出来

B. 使用新的 prompt 初始化一个 PromptTemplate 对象

C. 对新的 prompt 进行保存，使得 LlamaIndex 中的源代码 prompt 也变成中文

D. 用 index 的 update_prompts 方法将新的 prompt 同步上去

3. 在下面的代码片段中，哪些是微调大语言模型训练循环中必要的步骤？

A. model.train()

B. loss = criterion(predictions, targets)

C. predictions = model(inputs)

D. optimizer.step()

E. optimizer.zero_grad()

F. loss.backward()

4. 在构建 RAG 应用时，大模型可以用于哪些其他应用场景？

A. 识别用户意图

B. 提取结构化信息

C. 提高模型训练速度

5. 在优化后的答疑机器人中，以下哪种问题不需要经过RAG链路？

A. 检查文档错误

B. 公司内部文档查询

C. 增加模型的训练数据

6. 在构建 RAG 应用时，哪些高级 RAG 课题值得探索？

A. GraphRAG 技术

B. 可视化工作流

C. 智能体编排

7. 你负责的短视频平台在接入多模态技术后出现故障。 1: 用户输入 "生成夏日海滩 vlog 背景" 时，系统返回静态图片而非视频 2：视频自动剪辑功能无法识别冲浪板等特定物体 3：添加的 AI 解说语音与动画动作不同步需要重点检查的技术环节是？

A. 视频编辑时是否设置了正确的时间轴

B. 图像理解模型可能缺少对特定场景的训练数据

C. 仅使用了文生图模型来生成完整视频

D. 语音合成模型采样率不合适导致视频音画不同步

8. 在自定义提示词模板中，以下哪些是用于约束大模型行为的注意事项？

A. 根据上下文信息而非先验知识来回答问题

B. 提醒用户问题触及安全红线，无法提供

C. 只回答用户的问题，不输出其他信息

D. 增加模型的训练数据

9. 你正在开发一个机器学习领域的答疑机器人，辅助学生学习，但你对该领域专业知识掌握有限，以下哪些策略更有助于你改进提示词设计？

A. 邀请机器学习课程助教一起审核和改进提示词，要求其按照一定的结构来回答问题

B. 要求大模型扮演「机器学习教授」，结合学生认知水平，重新写出更结构化的提示词

C. 按照自己的理解要求大模型按照一定的结构来回答问题

D. 保持提示词简单，避免引入错误的信息

10. 你发现检索到的切片里常常遗漏上下文，导致回答片段化。下列哪些是有效且合理的改进措施？

A. 改用 "句子窗口切片" 或 "滑动窗口检索"

B. 增大 chunk_overlap

C. 避免切片，将文档完整的拼接到提示词中

D. 适当调大召回文档切片数量（例如从 Top3 调整为 Top5）

11. RAG 应用在检索时共召回了 10 条切片，其中 3 条高度相关，但 3 条内容都来自相邻段落，却被系统拆分成不同切片，从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度？

A. 采用滑动窗口策略生成重叠的文本切片

B. 使用按照语义的切片策略，切分出语义更完整的切片

C. 提高 temperature 参数控制生成多样性

D. 调整切片大小使其覆盖完整更大段落范围

12. 在优化后的答疑机器人中，以下哪些是提示词中规定的任务要求？

A. 文档纠错专家需要言简意赅的回复

B. 翻译专家需要识别不同语言的文本并翻译为中文

C. 增加模型的训练数据

13. 在提取标签的过程中，以下哪些标签类型是支持的？

A. 人名

B. 部门名称

C. 职位名称

D. 技术领域

E. 产品名称

14. 某教育问答系统上线后，你通过监控日志发现模型有时会返回个人隐私信息，为防止此类敏感信息泄露，可以采取以下哪三项措施？

A. 过滤用户提问，避免诱导性问题

B. 在问答系统流式返回内容时，实时检测并过滤敏感信息

C. 增加知识库内容的多样性，减少隐私信息被召回的概率

D. 对教育知识库的内容进行脱敏处理

15. 在决定模型微调前，你应该考虑以下哪些事情？

A. 训练数据量是否达到微调的最低标准

B. 该任务是否更适合使用 RAG

C. 提示词工程是否能达到预期效果

D. 训练服务器资源的成本

16. 以下哪些代码片段可以有效地对用户输入进行清洗和预处理，以提高大模型应用的安全性？

A. 将用户输入中的 emoji 表情符号替换为文本描述。

B. 将用户输入转换为小写。

C. 限制用户输入的长度。

D. 去除用户输入中的 HTML 标签。

E. 将用户输入中的 URL 替换为特殊的占位符。

F. 先把英文全部翻译为中文。

17. 以下哪三种场景更需要防范AI模型"幻觉"的风险？

A. 医疗诊断报告生成系统

B. 社交媒体趋势话题预测系统

C. 法律合同条款自动生成器

D. 教育领域历史知识问答系统

18. 你要给多个未归档的 Keynote 文档创建索引，这些文档中包括表格、流程图等复杂内容。在"文档解析"环节，你可以怎么做？

A. 开发能解析 Keynote 的自定义 Reader

B. 先将 Keynote 转成 PDF，再用 DashScopeParse 处理

C. 调大 RAG 应用召回 chunk 的数量

19. 如果你的业务流程比较复杂，可以借助百炼上的哪些工具来构建更强大的应用？

A. 可视化工作流

B. 智能体编排

C. LlamaIndex 组件

D. 自然语言处理模型

20. 在 Ragas 中，以下哪些指标用于评估检索召回效果？

A. context precision

B. context recall

C. 增加模型的训练数据

21. 在大模型的问答工作流程中，以下哪些阶段涉及模型的推理过程？

A. Token向量化

B. 大模型推理

C. 输出Token

D. 输出文本

22. 你正在优化一个 RAG 系统，发现某些相似文本对的向量相似度较低，以下哪两种方法可以改善这种情况？

A. 更换效果更好的 embedding 模型

B. 将索引保存到本地并在运行时加载

C. 减少向量数据库的存储容量

D. 通过对比学习让相关文本对的向量相似度更高

23. 微调 qwen2.5 - 1.5b 模型过程中发现模型开始欠拟合，可采取的优化措施包括？

A. 增加训练数据量

B. 增加训练集迭代次数（epoch）

C. 增加 lora_rank 值

D. 学习率增加一倍

24. faithfulness、answer_relevancy、context_recall、context_precision 这些指标中，哪些指标仅评估检索阶段的性能？

A. context_precision

B. answer_relevancy

C. context_recall

D. faithfulness

25. 在切片向量化与存储阶段，以下哪些是更新的 Embedding 模型？

A. text-embedding-v3

B. text-embedding-3-small

C. text-embedding-3-large

26. 某跨境电商平台的客服系统需要处理多语言用户咨询，在进行文本合规检查时发现部分违规内容无法被检测出来。哪两个方案能提供多语言文本的合规检查效果？

A. 强制要求用户使用英语提问，其他语言咨询转入人工处理

B. 建立多语言同义词库，覆盖常见违规表述的变体（如"免税代购"的谐音 / 缩写形式）

C. 使用跨语言语义理解模型，识别违规意图而非依赖关键词匹配

D. 将非英语内容翻译为英语后复用单语种审核规则

27. 在 context precision 的计算过程中，以下哪些步骤是必要的？

A. 按顺序读取 contexts 中的 contexti，判断其是否相关

B. 计算每个 context 的 precision 分

C. 对每个 context 的 precision 分求和，除以相关的 context 个数

D. 增加模型的训练数据

28. 以下哪些代码片段可以用于检测用户输入中是否包含敏感词？

A. python def detect_sensitive_words(text, sensitive_words): for word in text.split(): if word in sensitive_words: return True return False

B. python def detect_sensitive_words(text, sensitive_words): return any(word in text for word in sensitive_words)

C. python def detect_sensitive_words(text, sensitive_words): # added error handling try: return any(word in text.lower() for word in $w.lower() for w in sensitive_words$ ) except AttributeError: # in case text is not a string return False

D. python import nltk def detect_sensitive_words(text, sensitive_words): tokens = nltk.word_tokenize(text) return any(token in sensitive_words for token in tokens)

E. python def detect_sensitive_words(text, sensitive_words): return text in sensitive_words

29. 在使用大语言模型时，什么是"样例"的作用？

A. 确定目标用户

B. 辅助模型生成单一答案

C. 明确限制模型的回答长度

D. 提供有指导性的案例

E. 设定模型的情感色彩

F. 抽象出实现方案

30. 大语言模型微调相比预训练的优势有哪些?

A. 更容易发现和修正模型偏差

B. 无需考虑模型的泛化能力

C. 减少了对大量无标注数据的依赖

D. 提高了模型在特定领域的准确性

E. 减少了计算资源的需求

F. 加快了模型收敛速度

四、致备考 ACP 的每一位同学

这段时间的刷题、记知识点、反复理解架构，其实都在悄悄为你铺路。

ACP 考的不是死记硬背，而是思路清晰、细心稳重。考试时别慌，认真读题，看清单选还是多选，不确定的先标记，相信自己复习过的内容。

愿你：题题都眼熟，道道有把握，心态稳得住，细节不丢分，提笔从容自信，合笔如愿以偿。

**祝大家一次上岸，顺利拿证！**未来在云赛道上，越走越宽、越走越远 ✨

阿里云云计算ACA - ACP认证考试模拟试卷三

一、阿里云云计算ACP认证考试

二、基本要求解读

（一）主流 ACP 方向（云计算 / 云安全 / 大数据等）题型

（二）大模型 ACP（特殊）

（三）答题规则

三、阿里云云计算ACA - ACP认证考试模拟试卷

（一）单选题 ：70 题 × 1 分 = 70 分

1. 下列Assistant API示例代码中，forward_and_submit_outputs函数的核心功能是什么?

2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常，并打印错误信息？ 处理 classify_intent 函数可能抛出的异常，并打印错误信息？

3. 大模型在处理输入文本时，第一步通常执行的操作是？

4. 在检索阶段，embedding模型如何找到与用户问题最相似的文本段？

5. 在大语言模型的安全风险中，〝不安全的插件设计"可能导致哪些后果？

6. 你想使用 Qwen - Max 从一段冗长的课程文本中提炼出关键信息，用于创建 PPT 脚本。以下哪个提示词最合适？

7. 在切片向量化与存储阶段，以下哪种 Embedding 模型通常表现更好？

8. 在 qwen2.5-1.5b 模型微调时，训练损失快速震荡甚至开始上升，说明模型当前处于？

9. 在进行大模型微调项目调研和业务可行性研究阶段，以下哪个角色对项目的成功尤为关键？

10. 在大模型的使用过程中，以下哪项属于其主要的安全合规风险？

11. 在问题改写中，以下哪种方法通过生成假想文档来增强检索效果？

12. 在RAG应用的多轮对话中，直接将用户输入与文本段进行相似度比较可能会导致什么问题？

13. 为什么我们要在微调中使用早停法？

14. 以下哪项是流式输出的主要优势？

15. 在大模型推理阶段，模型如何选择下一个输出的Token？

16. 如果你想深入了解如何实际运用 GraphRAG，可以参考哪个教程？

17. top_p（nucleus sampling）参数的主要作用是什么？

18. 在示例中，提示词明确的任务需求是什么？

19. 在设计LLM提示词时要求模型生成特定风格的文档时，以下哪项不是必要的？

20. 在示例中，COT方法如何帮助大模型计算总差旅费用？

21. 大模型如通义千问API在自动处理文本任务时，主要优势在于：

22. 在大型语言模型中，为什么需要对模型生成的内容进行检查？

23. 在下列描述中，哪一个不是斯坦福小镇项目的特点？

24. 开发医疗问答系统时发现模型频繁产生"幻觉"，应优先采取哪种优化组合？

25. 以下哪个代码片段最适合帮助RAG应用将文本片段转换为向量表示?

26. 关于输入数据的描述，以下哪项是正确的？

27. 以下哪个选项最适合用于请求大模型总结一篇文章的主要内容？

28. 在大模型调用外部 API 工具时，你发现 agent 经常调用错误的工具。经过调查，最可能的原因是什么？

29. 大模型应用中处理个人信息的人员变更时，以下哪个选项是要首先执行的？

30. 大模型如何判断什么时候应该停止输出？

31. 在低温度（temperature=0.1）设置下，大模型的输出会有什么特点？

32. 你开发了一个 RAG 应用，发现用户经常连续提问（多轮对话），但是当前应用还不支持多轮对话，你应该怎么改造检索步骤来进行适配？ 选项：

33. 下列Assistant API示例代码中，verify_status_code函数的作用是什么?

34. 在需要生成明确答案的场景中，建议如何设置temperature参数？

35. 在代码中，score.to_pandas() 的主要作用是什么？

36. 在私有知识问答场景中，直接传入私域知识相关的参考信息的缺点是什么？

37. 在文档审阅中，为什么不建议一次输出所有的结果？

38. 在RAG应用的建立索引阶段，主要目的是什么？

39. 在检索召回阶段，以下哪种方法用于在检索前还原用户真实意图？

40. 在一个电商客服 RAG 系统中，如果过度追求召回率，可能会导致哪些问题？

41. 以下哪个选项属于我们在本教程中介绍的RAG应用范围？

42. 在开发基于大语言模型的RAG应用过程中，下哪种做法不能保证"关键数据的语义独立性与完整性"?

43. RAG（Retrieval Augmented Generation）的主要目的是什么？

44. 多Agent系统通过模拟或利用多个交互的智能体 （Agents） 来解決复杂问题，具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高？

45. 在ask_llm_route函数中，如果问题类型是"内容翻译"，会使用哪个提示词？

46. 以下哪种情况最适合将文档拆分成更小的分块？

47. 在切片向量化与存储阶段，以下哪些是 compare_embeddings 函数的作用？

48. 在代码中，evaluate 函数的主要作用是什么？

49. 在构建 RAG 应用时，以下哪种向量存储方案适合生产环境？

50. 在切片向量化与存储阶段，以下哪种方法用于比较不同 Embedding 模型的文本相似度？

51. 某大学为学生提供一款问答机器人，能回答课程安排和考试时间。学校想新增"自助预定自习室功能，需要查询并预定教室资源。要使这个功能能与现有问答无缝集成，合适的做法是什么？

52. 在优化检索效果时，以下哪种方法可以提升文档的结构性？

53. 检索增强式生成（RAG）应用的主要优势是什么？

54. 以下哪个用户查询语句无法有效地指导大语言模型进行文本摘要?

55. 为缩短响应时延，你想在索引前减少切片数量，每个切片包含 2-3 页内容。结果发现，回答容易混进无关信息。导致无关信息的根本原因是什么？

56. 要将索引持久化到磁盘，应使用以下哪个方法？

57. 觉得提示词模板怎么设计效果最好？假设chunk为召回的知识库文本块，query为用户问题。

58. 在示例中，答疑机器人没有理解用户的意图，主要原因是什么？

59. 在设计大模型提示词时，以下哪项原则最重要？

60. 生成式大模型可能会引发内容安全风险，以下哪个选项不属于内容安全风险?

61. 在调用大语言模型对话的API过程中，以下哪个代码片段正确地使用了system角色来指示模型扮演一个友好的客服代表?

62. 以下哪种方式有助于在大模型多轮对话场景中，保障生成内容质量的同时，降低成本，并提升响应速度？

63. 在优化检索效果时，以下哪些方法可以增加召回的文档切片数量？

64. 在多模态协同学习框架下，不同模态的数据如何协作以提升学习效果？

65. 你在调用通义干问 API 时设置了 temperature（温度）参数，以下哪种说法是正确的？

66. 在以下代码片段中，is_chat_model=True的作用是什么？

68. 以下哪种存储最适合用于区分不同的对话轮次或历史记录？

69. 在大语言模型微调的数据准备阶段，哪个操作是为了将文本拆分成单词或词汇单元？

70. 在一次评审会上，大家针对同一条问答的准确性产生分歧，工程师认为回答和问题语义相似度高，业务负责人则认为回答中有错误细节。该争议主要反映了什么？

（二）多选题 ：30 题 × 1 分 = 30 分

1. 在提示词框架中，以下哪些要素是必要的？

2. 通过 LlamaIndex 创建 RAG 应用，在修改默认 prompt 时，包含以下哪些步骤？

（一）单选题：70 题 × 1 分 = 70 分

2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常，并打印错误信息？处理 classify_intent 函数可能抛出的异常，并打印错误信息？

32. 你开发了一个 RAG 应用，发现用户经常连续提问（多轮对话），但是当前应用还不支持多轮对话，你应该怎么改造检索步骤来进行适配？选项：

44. 多Agent系统通过模拟或利用多个交互的智能体（Agents）来解決复杂问题，具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高？

（二）多选题：30 题 × 1 分 = 30 分