大模型LLM ACA - ACP认证考试模拟试卷六

[一、大模型LLM ACA - ACP认证考试](#一、大模型LLM ACA - ACP认证考试)

[二、大模型LLM ACA - ACP认证考试模拟试卷](#二、大模型LLM ACA - ACP认证考试模拟试卷)

[（一）单选题：70 题 × 1 分 = 70 分](#（一）单选题：70 题 × 1 分 = 70 分)

[1. 在以下代码片段中，query_engine = index.as_query_engine(...)的作用是什么？](#1. 在以下代码片段中，query_engine = index.as_query_engine(...)的作用是什么？)

[2. 在准备业务领域相关数据集时，以下哪项做法可能导致模型微调效果不佳？](#2. 在准备业务领域相关数据集时，以下哪项做法可能导致模型微调效果不佳？)

[3. 你想针对一篇两岸性的论文对 RAG 应用进行提问，可回答效果不好，你发现后台日志中召回的文本段出现一句话没有说完就被另一句话截断的现象，问题可能出在哪里了？](#3. 你想针对一篇两岸性的论文对 RAG 应用进行提问，可回答效果不好，你发现后台日志中召回的文本段出现一句话没有说完就被另一句话截断的现象，问题可能出在哪里了？)

[4. 下哪种做法不能 "保证关键数据的语义独立性与完整性"？](#4. 下哪种做法不能 “保证关键数据的语义独立性与完整性”？)

[5. 在RAG应用的多轮对话中，以下哪些工具可以快速实现多轮对话？](#5. 在RAG应用的多轮对话中，以下哪些工具可以快速实现多轮对话？)

[6. 为了确保与通义千问大模型的交互更加个性化和连续性，下列哪项策略最不推荐？](#6. 为了确保与通义千问大模型的交互更加个性化和连续性，下列哪项策略最不推荐？)

[7. 在提示词中规定输出格式的主要作用是什么？](#7. 在提示词中规定输出格式的主要作用是什么？)

[8. 你开发了一个 RAG 应用，发现其在回答内部流程问题（如"报销系统登录方式"）时准确率高，但回答通识性问题（如"如何修复Excel公式错误"）时质量差。应该优先尝试以下哪个改进方案？](#8. 你开发了一个 RAG 应用，发现其在回答内部流程问题（如“报销系统登录方式”）时准确率高，但回答通识性问题（如“如何修复Excel公式错误”）时质量差。应该优先尝试以下哪个改进方案？)

[9. 在使用LLM的何种场景下，思维链技术能发挥最大的用处？](#9. 在使用LLM的何种场景下，思维链技术能发挥最大的用处？)

[10. 在文档切片过程中，以下哪种切片方法适合对 Token 数量有严格要求的场景？](#10. 在文档切片过程中，以下哪种切片方法适合对 Token 数量有严格要求的场景？)

[11. 相比直接使用大模型的 API，使用百炼的 Assistant API 构建 Agent 的主要优势是什么？](#11. 相比直接使用大模型的 API，使用百炼的 Assistant API 构建 Agent 的主要优势是什么？)

[12. 在代码中，index.as_query_engine 方法的主要作用是什么？](#12. 在代码中，index.as_query_engine 方法的主要作用是什么？)

[13. 你需要在资源受限的环境下部署一个大模型，以下哪种方案有助于你减少对显存的需求？](#13. 你需要在资源受限的环境下部署一个大模型，以下哪种方案有助于你减少对显存的需求？)

[14. 在构建 RAG 应用时，哪种技术适合处理大规模文本数据？](#14. 在构建 RAG 应用时，哪种技术适合处理大规模文本数据？)

[15. 某团队想用 RAG 做 "分步骤查询"，先找出人员名单，再分别查询每人的部门信息，以下哪项功能最适合？](#15. 某团队想用 RAG 做 “分步骤查询”，先找出人员名单，再分别查询每人的部门信息，以下哪项功能最适合？)

[16. 以下哪个代码片段能够正确遍历feedback_list并打印每个问题的意图？feedback_list的格式为 $(1, "问题1"), (2, "问题2"), ...$ ](#16. 以下哪个代码片段能够正确遍历feedback_list并打印每个问题的意图？feedback_list的格式为[(1, "问题1"), (2, "问题2"), ...])

[17. 在大语言模型微调训练中，哪一步骤涉及到计算损失函数关于模型参数的梯度？](#17. 在大语言模型微调训练中，哪一步骤涉及到计算损失函数关于模型参数的梯度？)

[18. 在优化检索效果时，若知识库内容充足但召回率低，以下哪种方法是合理的？](#18. 在优化检索效果时，若知识库内容充足但召回率低，以下哪种方法是合理的？)

[19. 在优化后的答疑机器人中，以下哪些是提示词中规定的输入格式？](#19. 在优化后的答疑机器人中，以下哪些是提示词中规定的输入格式？)

[20. 在通过大语言模型检测文档内容中是否存在营销表达时，下列哪种方法可以更全面地识别问题？](#20. 在通过大语言模型检测文档内容中是否存在营销表达时，下列哪种方法可以更全面地识别问题？)

[21. 在构建 RAG 应用时，以下哪种向量存储方案支持向量 + 标量的混合检索？](#21. 在构建 RAG 应用时，以下哪种向量存储方案支持向量 + 标量的混合检索？)

[22. 以下哪个提示词要素用于约束大模型的应答风格，使其符合特定人群的阅读习惯？](#22. 以下哪个提示词要素用于约束大模型的应答风格，使其符合特定人群的阅读习惯？)

[23. 在将意图识别应用到答疑机器人中，ask_llm_route函数的主要作用是什么？](#23. 在将意图识别应用到答疑机器人中，ask_llm_route函数的主要作用是什么？)

[24. RAG应用在处理表格数据时，下列哪种方法能更好地保留表格的语义信息并方便后续查询?](#24. RAG应用在处理表格数据时，下列哪种方法能更好地保留表格的语义信息并方便后续查询?)

[25. 某企业需要部署一个大模型，不定期自动地分析现有的产品文档，并产出改进建议，以下哪一种计费方式可以在满足业务需求的同时最大化降低运行成本？:](#25. 某企业需要部署一个大模型，不定期自动地分析现有的产品文档，并产出改进建议，以下哪一种计费方式可以在满足业务需求的同时最大化降低运行成本？:)

[26. 句子窗口检索的优势在于?](#26. 句子窗口检索的优势在于?)

[27. 假设system提示词已经定义了大语言模型的角色为"一个专业的写作助手"。以下哪个用户查询语句最适合用于指导大语言模型扩写一段关于太空旅行的文字？](#27. 假设system提示词已经定义了大语言模型的角色为"一个专业的写作助手"。以下哪个用户查询语句最适合用于指导大语言模型扩写一段关于太空旅行的文字？)

[28. 你在开发一个内部IT 系统，希望能够自动处理员工的请求："我的投影仪故障了，请安排维修并通知下午会议改线上"。以下哪种技术方案有效、且能尽量減少人力投入？](#28. 你在开发一个内部IT 系统，希望能够自动处理员工的请求：“我的投影仪故障了，请安排维修并通知下午会议改线上”。以下哪种技术方案有效、且能尽量減少人力投入？)

[29. 在提示词构建中，哪个要素用于指定大模型的回应风格或语气？](#29. 在提示词构建中，哪个要素用于指定大模型的回应风格或语气？)

[30. 如果 answer correctness 指标得分较低，而 context recall 和 context precision 得分较高，以下哪种优化措施是可行的？](#30. 如果 answer correctness 指标得分较低，而 context recall 和 context precision 得分较高，以下哪种优化措施是可行的？)

[31. 以下哪个选项最适合作为系统角色提示词，用于构建一个可以进行代码审查的 AI 助手？](#31. 以下哪个选项最适合作为系统角色提示词，用于构建一个可以进行代码审查的 AI 助手？)

[32. 微软AutoGen项目设计了多智能体对话框架，并允许人类用户参与对话讨论，这种交互特性有什么优势？](#32. 微软AutoGen项目设计了多智能体对话框架，并允许人类用户参与对话讨论，这种交互特性有什么优势？)

[33. 有用户使用 "找张伟" 这类极简搜索，RAG 系统经常没能检索到所需文档，最合理的技术改进是什么？](#33. 有用户使用 “找张伟” 这类极简搜索，RAG 系统经常没能检索到所需文档，最合理的技术改进是什么？)

[34. 你作为一名医学检验研究员，需翻译存在大量 "NSC"（可能指 "神经干细胞" 或 "非小细胞癌"）缩写的文献。应如何设计提示词以消除歧义？](#34. 你作为一名医学检验研究员，需翻译存在大量 “NSC”（可能指 “神经干细胞” 或 “非小细胞癌”）缩写的文献。应如何设计提示词以消除歧义？)

[35. 在RAG应用的多轮对话中，CondenseQuestionChatEngine的主要作用是什么？](#35. 在RAG应用的多轮对话中，CondenseQuestionChatEngine的主要作用是什么？)

[36. 根据 "Multi-Agent" 的思想，以下哪种方式更适合处理复杂的 RAG 优化任务？](#36. 根据 “Multi-Agent” 的思想，以下哪种方式更适合处理复杂的 RAG 优化任务？)

[37. 在Al模型的训练过程中，哪一阶段主要旨在通过模拟人类的评价机制，调整模型输出以更贴近人类偏好和道德标准？](#37. 在Al模型的训练过程中，哪一阶段主要旨在通过模拟人类的评价机制，调整模型输出以更贴近人类偏好和道德标准？)

[38. 通过LamaIndex创建RAG应用时，node_postprocessors的作用是?](#38. 通过LamaIndex创建RAG应用时，node_postprocessors的作用是?)

[39. 在RAG应用的建立索引阶段，文本向量化的主要作用是什么？](#39. 在RAG应用的建立索引阶段，文本向量化的主要作用是什么？)

[40. 在模型训练循环中，哪段代码用于更新模型权重（梯度更新）？](#40. 在模型训练循环中，哪段代码用于更新模型权重（梯度更新）？)

[41. 在构建大语言模型提示词过程中，以下哪种分隔符最适合用于区分不同的对话轮次或历史记录?](#41. 在构建大语言模型提示词过程中，以下哪种分隔符最适合用于区分不同的对话轮次或历史记录?)

[42. 在切片向量化与存储阶段，以下哪种方法用于定义要测试的 Embedding 模型？](#42. 在切片向量化与存储阶段，以下哪种方法用于定义要测试的 Embedding 模型？)

[43. 在需要生成新闻初稿和代码的场景中，建议如何设置top_p参数？](#43. 在需要生成新闻初稿和代码的场景中，建议如何设置top_p参数？)

[44. 在优化检索效果时，以下哪些方法可以提升大模型对参考信息的查找效率？](#44. 在优化检索效果时，以下哪些方法可以提升大模型对参考信息的查找效率？)

[45. 某律所希望开发一个基于 RAG 的合同审阅系统，已通过 POC（Proof of Concept，是针对客户具体应用的验证性测试）验证了系统对于一些常见问题的准确性和效率。下一步应该优先做什么？](#45. 某律所希望开发一个基于 RAG 的合同审阅系统，已通过 POC（Proof of Concept，是针对客户具体应用的验证性测试）验证了系统对于一些常见问题的准确性和效率。下一步应该优先做什么？)

[46. 在LlamaIndex的默认提示词模板中，query_str表示什么？](#46. 在LlamaIndex的默认提示词模板中，query_str表示什么？)

[47. 在大模型应用系统成本优化方面，如何有效利用不同规模的语言模型 (LLMs）以实现资源高效分配？](#47. 在大模型应用系统成本优化方面，如何有效利用不同规模的语言模型 (LLMs）以实现资源高效分配？)

[48. 在切片向量化与存储阶段，以下哪种 Embedding 模型是更新的版本？](#48. 在切片向量化与存储阶段，以下哪种 Embedding 模型是更新的版本？)

[49. 在优化检索效果时，以下哪些方法可以提升文档的结构性？](#49. 在优化检索效果时，以下哪些方法可以提升文档的结构性？)

[50. 在下列使用Qwen - Max辅助内容生产的场景中，以下哪个操作是可以执行的?](#50. 在下列使用Qwen - Max辅助内容生产的场景中，以下哪个操作是可以执行的?)

[51. 在进行 RAG 应用评测时，应该如何获取测试集中的正确答案（ground_truth）？](#51. 在进行 RAG 应用评测时，应该如何获取测试集中的正确答案（ground_truth）？)

[52. 以下哪段代码设置了模型训练过程中的学习率？](#52. 以下哪段代码设置了模型训练过程中的学习率？)

[53. 以下哪种方法最适合用于解析PDF和Word文档中的文本内容，以便进行后续的RAG处理?](#53. 以下哪种方法最适合用于解析PDF和Word文档中的文本内容，以便进行后续的RAG处理?)

[54. 在开发大语言模型RAG应用过程中，以下哪种情况适合使用视觉模型进行深层次解析？](#54. 在开发大语言模型RAG应用过程中，以下哪种情况适合使用视觉模型进行深层次解析？)

[55. 以下哪个代码片段展示了正确的用户（user）提问方式？](#55. 以下哪个代码片段展示了正确的用户（user）提问方式？)

[56. Qwen系列模型中，哪个模型代表了经过大规模数据预训练后的基础版本，未针对特定任务进行过多调整？](#56. Qwen系列模型中，哪个模型代表了经过大规模数据预训练后的基础版本，未针对特定任务进行过多调整？)

[57. 如果让你从 faithfulness, context_recall, context_precision, answer_correctness 中选择一个最能代表 RAG 应用整体性能的指标，你会选哪个？](#57. 如果让你从 faithfulness, context_recall, context_precision, answer_correctness 中选择一个最能代表 RAG 应用整体性能的指标，你会选哪个？)

[58. 大语言模型微调时，通过调节哪个参数可以直接控制模型学习新知识的速度?](#58. 大语言模型微调时，通过调节哪个参数可以直接控制模型学习新知识的速度?)

[59. 假设有一个多Agent系统用于大规模灾害救援，其中涉及搜索、救援和物资分配等多个子任务，以下哪个设计原则对于提升系统整体效能最为关键？](#59. 假设有一个多Agent系统用于大规模灾害救援，其中涉及搜索、救援和物资分配等多个子任务，以下哪个设计原则对于提升系统整体效能最为关键？)

[60. 在借助Llamaindex构建问答机器人过程中，如果存储目录不存在，应使用哪个类来读取文档并创建索引?](#60. 在借助Llamaindex构建问答机器人过程中，如果存储目录不存在，应使用哪个类来读取文档并创建索引?)

[61. 用户希望大模型根据描述创造一幅画，这需要开启哪个插件来实现？](#61. 用户希望大模型根据描述创造一幅画，这需要开启哪个插件来实现？)

[62. 以下哪种文本切片方法最有可能保留完整的语义信息？](#62. 以下哪种文本切片方法最有可能保留完整的语义信息？)

[63. 你开发了一个 RAG 应用，用户反馈回复效果不佳。你通过后台日志发现用户的输入有时缺少信息，如 "我要读研"、"请假"，你应该优先进行哪方面的优化？](#63. 你开发了一个 RAG 应用，用户反馈回复效果不佳。你通过后台日志发现用户的输入有时缺少信息，如 “我要读研”、“请假”，你应该优先进行哪方面的优化？)

[64. 你希望对于同一个提示词，让大模型每次都尽最大可能返回相同结果，可以调整哪个参数？](#64. 你希望对于同一个提示词，让大模型每次都尽最大可能返回相同结果，可以调整哪个参数？)

[65. 在开发智能体系统中，智能体的工作日志、历史检索数据等等，会占用大量的大模型上下文，影响智能体做规划的性能。人们可以通过哪些手段来缓解这方面的压力？](#65. 在开发智能体系统中，智能体的工作日志、历史检索数据等等，会占用大量的大模型上下文，影响智能体做规划的性能。人们可以通过哪些手段来缓解这方面的压力？)

[66. 以下哪种方法最适合用于明确指定大模型输出的格式和类型？](#66. 以下哪种方法最适合用于明确指定大模型输出的格式和类型？)

[67. 你希望用阿里云百炼平台的通义千问大模型生成商品描述，但要求不同用户看到的内容略有差异，应如何实现？](#67. 你希望用阿里云百炼平台的通义千问大模型生成商品描述，但要求不同用户看到的内容略有差异，应如何实现？)

[68. 在代码中，similarity_top_k=5 的主要作用是什么？](#68. 在代码中，similarity_top_k=5 的主要作用是什么？)

[69. Ragas 提供的 Context Recall 指标用于评估什么？](#69. Ragas 提供的 Context Recall 指标用于评估什么？)

[70. 在多模态场景下，用户向基于RAG的智能答疑机器人提交报销申请，以下哪种情况不需要进行内容安全合规检查?](#70. 在多模态场景下，用户向基于RAG的智能答疑机器人提交报销申请，以下哪种情况不需要进行内容安全合规检查?)

[（二）多选题：30 题 × 1 分 = 30 分](#（二）多选题：30 题 × 1 分 = 30 分)

[1. 在问题改写中，以下哪些方法用于在检索前还原用户真实意图？](#1. 在问题改写中，以下哪些方法用于在检索前还原用户真实意图？)

[2. 以下哪些场景适合设置较低的top_p值？](#2. 以下哪些场景适合设置较低的top_p值？)

[3. 在创建 APIAssistantAgent 的过程中，将 functions 参数作为字典传入的解释正确的有哪些？](#3. 在创建 APIAssistantAgent 的过程中，将 functions 参数作为字典传入的解释正确的有哪些？)

[4. 在示例中，以下哪些是提示词中规定的输出要求？](#4. 在示例中，以下哪些是提示词中规定的输出要求？)

[5. 以下关于top_p参数的描述，哪些是正确的？](#5. 以下关于top_p参数的描述，哪些是正确的？)

[6. 在 RAGAS 评测中，embedding 模型的作用有哪些?](#6. 在 RAGAS 评测中，embedding 模型的作用有哪些?)

[7. 以下选项中属于使用分隔符的主要目的有哪些?](#7. 以下选项中属于使用分隔符的主要目的有哪些?)

[8. 在文档解析与切片阶段，以下哪些改进策略适用于文档切片长度过短的情况？](#8. 在文档解析与切片阶段，以下哪些改进策略适用于文档切片长度过短的情况？)

[9. 优化 RAG 应用时，需要考虑哪些因素？](#9. 优化 RAG 应用时，需要考虑哪些因素？)

[10. 在文档切片过程中，以下哪些切片方法适合处理长文档且需要保持上下文？](#10. 在文档切片过程中，以下哪些切片方法适合处理长文档且需要保持上下文？)

[11. 在初步构建好大模型应用后，应该对它进行"自动化评测"，如何理解自动化？](#11. 在初步构建好大模型应用后，应该对它进行“自动化评测”，如何理解自动化？)

[12. 关于 temperature 和 top_p 参数的作用，以下哪三个描述是正确的？](#12. 关于 temperature 和 top_p 参数的作用，以下哪三个描述是正确的？)

[13. 在大语言模型微调的训练循环中，哪些步骤是必须包含的？](#13. 在大语言模型微调的训练循环中，哪些步骤是必须包含的？)

[14. 在提示词中，以下哪些符号可以作为分隔符？](#14. 在提示词中，以下哪些符号可以作为分隔符？)

[15. 在优化后的答疑机器人中，以下哪些是可能的输出？](#15. 在优化后的答疑机器人中，以下哪些是可能的输出？)

[16. 以下哪些选项属于流式输出相比于非流式输出的优势？](#16. 以下哪些选项属于流式输出相比于非流式输出的优势？)

[17. 在私有知识问答场景中，直接传入私域知识相关的参考信息可能导致哪些问题？](#17. 在私有知识问答场景中，直接传入私域知识相关的参考信息可能导致哪些问题？)

[18. 在检索召回阶段，以下哪些方法用于在检索前还原用户真实意图？](#18. 在检索召回阶段，以下哪些方法用于在检索前还原用户真实意图？)

[19. 在示例中，以下哪些是知识库中召回的内容？](#19. 在示例中，以下哪些是知识库中召回的内容？)

[20. 以下哪些 Python 库可以用于处理视频或图像？](#20. 以下哪些 Python 库可以用于处理视频或图像？)

[21. 以下哪些方案，有助于提升大模型应用的用户体验？](#21. 以下哪些方案，有助于提升大模型应用的用户体验？)

[22. 通过 LlamaIndex 创建 RAG 应用，关于下面这段代码作用的描述正确的有哪些?](#22. 通过 LlamaIndex 创建 RAG 应用，关于下面这段代码作用的描述正确的有哪些?)

[23. 在提取标签的过程中，以下哪些场景是正确的？](#23. 在提取标签的过程中，以下哪些场景是正确的？)

[24. 以下关于 CosyVoice 的描述，哪些是正确的？](#24. 以下关于 CosyVoice 的描述，哪些是正确的？)

[25. 某公司正在开发一款智能客服系统，用于为用户提供多语言支持。在处理用户问题时，系统需要准确翻译并解释一些内部非公开的领域术语。为了确保翻译和解释的高准确性，以下哪两个方案能有效解决这一问题？](#25. 某公司正在开发一款智能客服系统，用于为用户提供多语言支持。在处理用户问题时，系统需要准确翻译并解释一些内部非公开的领域术语。为了确保翻译和解释的高准确性，以下哪两个方案能有效解决这一问题？)

[26. 以下哪些选项是把 DASHSCOPE_API_KEY 配置为环境变量的原因?](#26. 以下哪些选项是把 DASHSCOPE_API_KEY 配置为环境变量的原因?)

[27. 你需要大模型从客户邮件中提取结构化数据（如姓名、订单号、问题类型），以下哪两个选项有助于你达成这一目标？](#27. 你需要大模型从客户邮件中提取结构化数据（如姓名、订单号、问题类型），以下哪两个选项有助于你达成这一目标？)

[28. 在 Answer Correctness 的计算过程中，以下哪些是事实准确度的比较对象？](#28. 在 Answer Correctness 的计算过程中，以下哪些是事实准确度的比较对象？)

[29. 下列哪些 AIGC 应用场景需要进行算法备案？](#29. 下列哪些 AIGC 应用场景需要进行算法备案？)

[30. top_p参数如何影响候选Token的筛选？](#30. top_p参数如何影响候选Token的筛选？)

一、大模型LLM ACA - ACP认证考试

探索未来智能的钥匙------ACA-ACP大模型工程师认证专栏导读（含十套模拟真题和真题精选）

请认真阅读考试须知后，准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。

答题开始即开始计时，中途不可暂停，如超时则自动提交

1、考试共 (100) 道题，总分100分，及格分数80分。（模拟试题库对应模拟试题按70:30-单选题-多选题，真题一般50:25）

2、考试需在（120分钟）内交卷，过程中无法暂停，请提前安排好时间；如未及时交卷，则本次考试作废

3、推荐使用 Chrome 浏览器（版本：73及以上的正式版本），或Firefox浏览器（版本：66及以上的正式版本)

4、开始答题前会进行身份验证，需要您拍摄并上传身份证人像面照片，并按照系统要求开启摄像头进行面部识别

5、考试过程中请保持摄像头开启并对准面部，系统会不定时进行抓拍，并与身份证照片做对比，如发现作弊行为，您的考试成绩将作废

6、考试过程中，系统将判断您的浏览器状态，如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为，以及弹出广告弹窗，将会给出警告。如果次数过多您的考试成绩将作废

7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件，以免影响您的考试

**祝大家一次上岸，顺利拿证！**未来在云赛道上，越走越宽、越走越远 ✨

二、大模型LLM ACA - ACP认证考试模拟试卷

（一）单选题：70 题 × 1 分 = 70 分

1. 在以下代码片段中，query_engine = index.as_query_engine(...)的作用是什么？

A. 创建查询引擎

B. 设置召回切片的最大数量

C. 设置重排序的切片数量

2. 在准备业务领域相关数据集时，以下哪项做法可能导致模型微调效果不佳？

A. 精心筛选与应用场景高度相关的样本

B. 大规模收集数据以增加模型泛化能力

C. 忽视数据平衡性，任一类别样本数量悬殊

3. 你想针对一篇两岸性的论文对 RAG 应用进行提问，可回答效果不好，你发现后台日志中召回的文本段出现一句话没有说完就被另一句话截断的现象，问题可能出在哪里了？

A. embedding 模型在检索过程中将解析好的文本打乱顺序

B. rerank 模型对字符进行重排序导致语义不通

C. 文档解析模块未正确处理分栏式 PDF 的版面结构，导致文本流顺序错乱

D. 大模型无法准确还原论文的原本内容

4. 下哪种做法不能 "保证关键数据的语义独立性与完整性"？

A. 对不同的数据类型（例如文本、表格、图片）采用不同的处理方式。

B. 将标题下的所有文本合并成一个段落。

C. 针对表格中每一行单元格的数据，扩写加上各级标题、表格头部的字段说明

D. 确保每个语义单元都有清晰的边界和完整的上下文信息。

5. 在RAG应用的多轮对话中，以下哪些工具可以快速实现多轮对话？

A. LlamaIndex

B. SimpleDirectoryReader

C. VectorStoreIndex

6. 为了确保与通义千问大模型的交互更加个性化和连续性，下列哪项策略最不推荐？

A. 在每次请求时都提供完整的对话历史

B. 利用上下文管理机制，只保留最近的几轮对话

C. 每次发送新问题时，都将前一次的问答结果清空

7. 在提示词中规定输出格式的主要作用是什么？

A. 确保大模型输出结构化的数据

B. 增加模型的训练数据

C. 减少模型的推理时间

8. 你开发了一个 RAG 应用，发现其在回答内部流程问题（如"报销系统登录方式"）时准确率高，但回答通识性问题（如"如何修复Excel公式错误"）时质量差。应该优先尝试以下哪个改进方案？

A. 禁用RAG，所有问题依赖大模型回答

B. 扩大RAG检索范围，加入公开技术文档

C. 结合意图识别，公司内部问题才执行检索增强

9. 在使用LLM的何种场景下，思维链技术能发挥最大的用处？

A. 简单的问答任务，如"今天天气如何？"

B. 不需要深度推理的文本生成，如写一篇日记

C. 需要详细步骤和逻辑推导的数学难题

10. 在文档切片过程中，以下哪种切片方法适合对 Token 数量有严格要求的场景？

A. Token 切片

B. 句子切片

C. 句子窗口切片

11. 相比直接使用大模型的 API，使用百炼的 Assistant API 构建 Agent 的主要优势是什么？

A. 能够绕过一些 API 调用限制，使得开发出的 Agent 功能更强大

B. 能够完全控制模型底层训练过程

C. 自带了会话管理和联网搜索等工具，简化 Agent 开发工作

D. 能够修改一些大模型 API 不直接提供的参数，使得开发 Agent 的过程更灵活

12. 在代码中，index.as_query_engine 方法的主要作用是什么？

A. 创建用于提问的引擎

B. 增加模型的训练数据

C. 减少模型的推理时间

13. 你需要在资源受限的环境下部署一个大模型，以下哪种方案有助于你减少对显存的需求？

A. 蒸馏小模型，训练一个更小参数量的模型

B. 扩大允许的输入 Token 长度

C. 微调现有模型，改善其效果

D. 提高模型批量任务的数量

14. 在构建 RAG 应用时，哪种技术适合处理大规模文本数据？

A. GraphRAG

B. 自然语言处理（NLP）

C. 机器学习（ML）

15. 某团队想用 RAG 做 "分步骤查询"，先找出人员名单，再分别查询每人的部门信息，以下哪项功能最适合？

A. ReRank（重排序）

B. MultiStepQueryEngine（多步查询）

C. SimpleDirectoryReader（读取本地文档）

D. HyDE（假想文档生成）

16. 以下哪个代码片段能够正确遍历feedback_list并打印每个问题的意图？feedback_list的格式为 $(1, "问题1"), (2, "问题2"), ...$

A. for query in feedback_list: intent = classify_intent(query) print(f"Intent: {intent}")

B. for query in feedback_list: intent = classify_intent(query $1$ ) print(f"Intent: {intent}")

C. for item in feedback_list: id = item $0$ intent = classify_intent(item $0$ ) print(f"ID: {id}, Intent: {intent}")

D. for i in range(len(feedback_list)): intent = classify_intent(feedback_list $i$ ) print(f"Intent: {intent}")

17. 在大语言模型微调训练中，哪一步骤涉及到计算损失函数关于模型参数的梯度？

A. 正向传播

B. 批标准化

C. 优化算法选择

D. 反向传播

18. 在优化检索效果时，若知识库内容充足但召回率低，以下哪种方法是合理的？

A. 增加查询请求的并发量以加快响应速度

B. 提高相似度阈值

C. 增加知识库文档

D. 更换 embedding 模型

19. 在优化后的答疑机器人中，以下哪些是提示词中规定的输入格式？

A. 【输入如下】

B. 增加模型的训练数据

C. 减少模型的推理时间

20. 在通过大语言模型检测文档内容中是否存在营销表达时，下列哪种方法可以更全面地识别问题？

A. 识别有内容错误的部分

B. 逐条单独识别营销词汇

C. 一次性生成所有类型的识别结果

D. 让大模型自动修改内容

21. 在构建 RAG 应用时，以下哪种向量存储方案支持向量 + 标量的混合检索？

A. 云服务向量存储

B. 内存向量存储

C. 本地向量数据库

22. 以下哪个提示词要素用于约束大模型的应答风格，使其符合特定人群的阅读习惯？

A. 角色（Role）

B. 输出格式（Output Fomat）

C. 上下文（Context）

D. 受众（Audience）

23. 在将意图识别应用到答疑机器人中，ask_llm_route函数的主要作用是什么？

A. 根据问题类型选择不同的提示词和工作流程

B. 增加模型的训练数据

C. 减少模型的推理时间

24. RAG应用在处理表格数据时，下列哪种方法能更好地保留表格的语义信息并方便后续查询?

A. 将表格转换为纯文本

B. 将表格转换为图片

C. 使用kv形式补充单元格信息

25. 某企业需要部署一个大模型，不定期自动地分析现有的产品文档，并产出改进建议，以下哪一种计费方式可以在满足业务需求的同时最大化降低运行成本？:

A. 通过按量付费方式创建 GPU 资源

B. 使用抢占式实例（Spot Instance），同时设计好任务中断的自动恢复机制

C. 购买显卡并搭建本地服务器

D. 通过预付费（包年包月）方式创建 GPU 资源

26. 句子窗口检索的优势在于?

A. 提高检索阶段的精确性同时，保证了生成阶段的信息完整性

B. 对大模型的注意力机制进行了针对性改善

C. 提高大模型生成的速度

D. 可以降低对数据库存储空间要求

27. 假设system提示词已经定义了大语言模型的角色为"一个专业的写作助手"。以下哪个用户查询语句最适合用于指导大语言模型扩写一段关于太空旅行的文字？

A. 太空旅行很酷.

B. 请详细描述一下未来的太空旅行会是什么样子

C. 太空旅行.

D. 太空旅行有哪些好处和坏处?

28. 你在开发一个内部IT 系统，希望能够自动处理员工的请求："我的投影仪故障了，请安排维修并通知下午会议改线上"。以下哪种技术方案有效、且能尽量減少人力投入？

A. 通过提示词引导大模型拆解任务为多步骤，然后自动调用维修系统和会议系统 API 完成操作。

B. 通过提示词引导大模型直接生成维修工单和会议调整结果，无需调用现有系统。

C. 通过大模型判断接单人，自动将任务指派给接单人，通知其创建维修工单并调整会议。

D. 识别请求中的关键字（如 "投影仪故障" "会议改线上"），匹配规则系统后调用 API 完成任务。

29. 在提示词构建中，哪个要素用于指定大模型的回应风格或语气？

A. 输出格式

B. 样例

C. 任务目标

D. 上下文

E. 输入数据

F. 角色

30. 如果 answer correctness 指标得分较低，而 context recall 和 context precision 得分较高，以下哪种优化措施是可行的？

A. 优化 prompt

B. 增加模型的训练数据

C. 减少模型的推理时间

31. 以下哪个选项最适合作为系统角色提示词，用于构建一个可以进行代码审查的 AI 助手？

A. {"role":"system","content":"你是一个资深代码审查专家，专注于发现代码中的潜在问题，例如 bug、性能瓶颈和代码风格问题。请提供详细的修改建议和解释。"}

B. {"role":"user","content":"这是我的代码，请帮我审查。"}

C. {"role":"assistant","content":"请提交需要审查的代码。"}

D. {"role":"system","content":"你是一个初级程序员，正在学习代码审查。"}

32. 微软AutoGen项目设计了多智能体对话框架，并允许人类用户参与对话讨论，这种交互特性有什么优势？

A. 研究智能体间的社会关系

B. 能够自动完成软件开发的全部流程

C. 支持人与多智能体直接对话以协同解决问题

33. 有用户使用 "找张伟" 这类极简搜索，RAG 系统经常没能检索到所需文档，最合理的技术改进是什么？

A. 将所有文档发布成内部 Wiki

B. 在回答时修改用户的问题

C. 在检索前先用大模型进行问题改写扩充

D. 让用户输入更多关键词

34. 你作为一名医学检验研究员，需翻译存在大量 "NSC"（可能指 "神经干细胞" 或 "非小细胞癌"）缩写的文献。应如何设计提示词以消除歧义？

A. 分配角色："作为肿瘤科医生，严格匹配癌症相关术语"

B. 要求输出格式："所有缩写后需用括号标注全称"

C. 提供少量上下文关联示例："在'干细胞培养'段落中，NSC→神经干细胞，在'肺癌病理'段落中，NSC→非小细胞癌"

D. 直接提问："请优先将 NSC 翻译为神经干细胞"

35. 在RAG应用的多轮对话中，CondenseQuestionChatEngine的主要作用是什么？

A. 将用户问题改写为包含历史对话关键信息的新query

B. 增加模型的训练数据

C. 减少模型的推理时间

36. 根据 "Multi-Agent" 的思想，以下哪种方式更适合处理复杂的 RAG 优化任务？

A. 只使用 DashScopeParse 解析文档，其他优化步骤都手动完成。

B. 根据任务特点，将复杂任务拆分成多个子任务，每个子任务使用不同的模型、prompt 或代码逻辑进行处理。

C. 将所有任务步骤整合到一个大型 prompt 中，一次调用大模型完成所有处理。

D. 仅使用通义千问 API 完成所有处理，不使用其他工具。

37. 在Al模型的训练过程中，哪一阶段主要旨在通过模拟人类的评价机制，调整模型输出以更贴近人类偏好和道德标准？

A. 预训练阶段

B. 监督微调阶段

C. 应用部署阶段

D. 基于人类反馈的强化学习阶段

38. 通过LamaIndex创建RAG应用时，node_postprocessors的作用是?

A. 设置召回文本段个数

B. 修改 prompt 模板

C. 开启句子窗口检索

D. 进行后处理，如相似度阈值、rerank 等

39. 在RAG应用的建立索引阶段，文本向量化的主要作用是什么？

A. 增加模型的训练数据

B. 将文本转换为数字表示以便进行相似度比较

C. 减少模型的推理时间

40. 在模型训练循环中，哪段代码用于更新模型权重（梯度更新）？

A. loss = criterion(outputs, labels)

B. optimizer.step()

C. model.train()

D. loss.backward()

41. 在构建大语言模型提示词过程中，以下哪种分隔符最适合用于区分不同的对话轮次或历史记录?

A. ＜＜用>> 你好＜＜机器人>> 你好,有什么可以帮你的?

B. ＜--用户--> 你好＜--机器人> 你好,有什么可以帮你的?

C. <<用户你好 <<机器人你好

42. 在切片向量化与存储阶段，以下哪种方法用于定义要测试的 Embedding 模型？

A. embedding_models 字典

B. 增加模型的训练数据

C. 减少模型的推理时间

43. 在需要生成新闻初稿和代码的场景中，建议如何设置top_p参数？

A. 设置较高的top_p值

B. 设置较低的top_p值

C. 使用默认top_p值

44. 在优化检索效果时，以下哪些方法可以提升大模型对参考信息的查找效率？

A. 使用结构化的文档格式

B. 增加模型的训练数据

C. 减少模型的推理时间

45. 某律所希望开发一个基于 RAG 的合同审阅系统，已通过 POC（Proof of Concept，是针对客户具体应用的验证性测试）验证了系统对于一些常见问题的准确性和效率。下一步应该优先做什么？

A. 降低相似度阈值，增加召回文本段个数

B. 对前端界面进行优化

C. 针对 POC 测试中的问题进行反复优化

D. 请法律专家参与构建评测集

46. 在LlamaIndex的默认提示词模板中，query_str表示什么？

A. 用户的问题

B. 从向量库中检索到的上下文信息

C. 大模型的角色

47. 在大模型应用系统成本优化方面，如何有效利用不同规模的语言模型 (LLMs）以实现资源高效分配？

A. 为所有任务统一使用最大规模的LLM以保证最佳性能

B. 根据任务复杂度动态调整LLM规模，简单任务使用小型LLM

C. 在多Agent系统中，让不同Agent固定使用同一规模的LLM以减少配置复杂度

48. 在切片向量化与存储阶段，以下哪种 Embedding 模型是更新的版本？

A. text-embedding-v3

B. text-embedding-v2

C. 增加模型的训练数据

49. 在优化检索效果时，以下哪些方法可以提升文档的结构性？

A. 使用 Markdown 格式

B. 增加模型的训练数据

C. 减少模型的推理时间

50. 在下列使用Qwen - Max辅助内容生产的场景中，以下哪个操作是可以执行的?

A. 直接使用Qwen - Max进行图像设计

B. 利用Qwen - Max生成课程文案

C. 应用Qwen - Max进行视频剪辑

51. 在进行 RAG 应用评测时，应该如何获取测试集中的正确答案（ground_truth）？

A. 由性能最强的大模型进行编写

B. 由该领域的专家进行编写

C. 由数据工程师进行编写

D. 由算法工程师进行编写

52. 以下哪段代码设置了模型训练过程中的学习率？

A. optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

B. criterion = nn.CrossEntropyLoss()

C. scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=100, gamma=0.1)

D. learning_rate = 0.001

53. 以下哪种方法最适合用于解析PDF和Word文档中的文本内容，以便进行后续的RAG处理?

A. 使用正则表达式直接提取文本。

B. 手动复制粘贴文本内容。

C. 使用光学字符识别（OCR）技术。

D. 使用专门的库，例如 Python 的 PyPDF2 和 python - docx。

54. 在开发大语言模型RAG应用过程中，以下哪种情况适合使用视觉模型进行深层次解析？

A. 包含简单文字的命令行截图

B. 包含清晰文本的文本截图

C. 包含不规则、复杂信息的图片

55. 以下哪个代码片段展示了正确的用户（user）提问方式？

A. python messages = ${ "role": "user", "content": "你是一个诗歌生成器。" }, { "role": "assistant", "content": "我想写一首关于秋天的诗。" }$

B. python messages = ${"role": "system", "content": "你是一个诗歌生成器。"}, {"role": "assistant", "content": "请告诉我你想写一首关于什么的诗。"}$

C. python messages = ${"role": "system", "content": "你是一个诗歌生成器。"}, {"role": "user", "content": "我想写一首关于秋天的诗。"}$

D. python messages = ${"role": "system", "content": "你是一个诗歌生成器。"}, {"role": "system", "content": "我想写一首关于秋天的诗。"}$

56. Qwen系列模型中，哪个模型代表了经过大规模数据预训练后的基础版本，未针对特定任务进行过多调整？

A. Qwen-7B-Chat

B. Qwen-Max线上模型

C. Qwen-7B预训练模型

57. 如果让你从 faithfulness, context_recall, context_precision, answer_correctness 中选择一个最能代表 RAG 应用整体性能的指标，你会选哪个？

A. context_precision

B. context_recall

C. answer_correctness

D. faithfulness

58. 大语言模型微调时，通过调节哪个参数可以直接控制模型学习新知识的速度?

A. 批大小

B. 学习率

C. 训练轮数

D. 正则化系数

59. 假设有一个多Agent系统用于大规模灾害救援，其中涉及搜索、救援和物资分配等多个子任务，以下哪个设计原则对于提升系统整体效能最为关键？

A. 所有Agent均采用相同的算法和策略，以保证一致性

B. Agent之间仅在必要时进行信息交换，减少通信开销

C. 设计强大的中心化控制器，统一调度所有Agent的行为

60. 在借助Llamaindex构建问答机器人过程中，如果存储目录不存在，应使用哪个类来读取文档并创建索引?

A. VectorStoreIndex

B. SimpleDirectoryReader

C. StorageContext

61. 用户希望大模型根据描述创造一幅画，这需要开启哪个插件来实现？

A. 代码解释器

B. 图像识别服务

C. 图像生成服务

62. 以下哪种文本切片方法最有可能保留完整的语义信息？

A. 按标点符号分割，例如句号、问号等。

B. 按字符数分割，每 50 个字符为一个 chunk。

C. 按 token 长度分割，每 100 个 token 为一个 chunk。

D. 使用专门的语义分割模型将文本分割成语义完整的段落。

63. 你开发了一个 RAG 应用，用户反馈回复效果不佳。你通过后台日志发现用户的输入有时缺少信息，如 "我要读研"、"请假"，你应该优先进行哪方面的优化？

A. 更换检索速度更快的向量数据库

B. 调整大模型的 top_p 参数

C. 结合历史常见问题，使用大模型对 query 进行改写

D. 优化文档切分策略

64. 你希望对于同一个提示词，让大模型每次都尽最大可能返回相同结果，可以调整哪个参数？

A. stream

B. max_token

C. api_key

D. seed

65. 在开发智能体系统中，智能体的工作日志、历史检索数据等等，会占用大量的大模型上下文，影响智能体做规划的性能。人们可以通过哪些手段来缓解这方面的压力？

A. 引入上下文感知的动态记忆机制，优先保留关键信息。

B. 使用固定窗口长度，或固定tokens长度截断上下文，保留最近的对话历史。

C. 实施注意力机制的变种，如Transformer-XL，以覆盖更长的上下文范围。

66. 以下哪种方法最适合用于明确指定大模型输出的格式和类型？

A. 仅使用上下文（Context）

B. 仅使用角色（Role）

C. 仅使用任务目标（Object）

D. 结合输出格式（Output Format）和样例（Sample）

67. 你希望用阿里云百炼平台的通义千问大模型生成商品描述，但要求不同用户看到的内容略有差异，应如何实现？

A. 启用 enable_search 参数

B. 保持 temperature=0.9 且不固定 seed

C. 设置 temperature=0.0

D. 使用完全相同的提示词

68. 在代码中，similarity_top_k=5 的主要作用是什么？

A. 一次检索出 5 个文档切片

B. 增加模型的训练数据

C. 减少模型的推理时间

69. Ragas 提供的 Context Recall 指标用于评估什么？

A. 相关参考资料被检索到的数量

B. RAG 应用生成答案的准确度

C. 生成答案与问题的相关性

70. 在多模态场景下，用户向基于RAG的智能答疑机器人提交报销申请，以下哪种情况不需要进行内容安全合规检查?

A. 用户提交的文本描述

B. 用户上传的发票图片

C. 机器人返回的报销审批结果

D. 系统内部的查询日志记录

（二）多选题：30 题 × 1 分 = 30 分

1. 在问题改写中，以下哪些方法用于在检索前还原用户真实意图？

A. 使用大模型扩充用户问题

B. 将单一查询改写为多步骤查询

C. 用假设文档来增强检索HyDE）

2. 以下哪些场景适合设置较低的top_p值？

A. 新闻初稿

B. 代码生成

C. 创意写作

3. 在创建 APIAssistantAgent 的过程中，将 functions 参数作为字典传入的解释正确的有哪些？

A. 这样可以方便地根据函数名来动态调用对应的函数

B. 由于 Python 中的类只能接收一个类型的参数，字典是唯一选择

C. 为了让智能体能够调用不同的函数来满足用户的请求

D. 该结构为智能体的多任务处理提供了更高的可扩展性

E. 因为字典结构可以提供键值对，便于存储函数的信息

F. 字典可以支持函数参数的动态传递，提高灵活性

4. 在示例中，以下哪些是提示词中规定的输出要求？

A. 输出JSON格式

B. label只能取0或1

C. reason是错误的原因

5. 以下关于top_p参数的描述，哪些是正确的？

A. top_p值越大，生成内容越多样化

B. top_p值越小，生成内容越固定

C. top_p值不影响生成内容

6. 在 RAGAS 评测中，embedding 模型的作用有哪些?

A. 评估 answer 与 ground_truth 的相似度，从而计算 answer_correctness

B. 评估每个 chunk 之间的相似度、从而剔除离群点

C. 评估 context 与 answer 的相似度，从而计算 faithfulness

D. 评估 answer 与 query 的相似度，从而计算 answer_relevancy

7. 以下选项中属于使用分隔符的主要目的有哪些?

A. 规范化文档格式

B. 明确提示词各要素之间的界限

C. 使文档看起来更复杂

D. 增加文字数量

E. 随意分割文本

F. 提高模型的运行速度

8. 在文档解析与切片阶段，以下哪些改进策略适用于文档切片长度过短的情况？

A. 扩大切片长度

B. 开发更合适的切片策略

C. 增加模型的训练数据

D. 减少模型的推理时间

9. 优化 RAG 应用时，需要考虑哪些因素？

A. 系统的可维护性和可扩展性。

B. 最新的深度学习模型和算法。

C. 文档的结构和内容特点。

D. 大模型的解析方式和理解能力。

E. 检索的效率和速度。

F. 用户提问的习惯和可能的提问方式。

10. 在文档切片过程中，以下哪些切片方法适合处理长文档且需要保持上下文？

A. 句子窗口切片

B. 语义切片

C. Token 切片

11. 在初步构建好大模型应用后，应该对它进行"自动化评测"，如何理解自动化？

A. 自动化的评测指标由大模型制定

B. 自动化的评测集由大模型生成

C. 自动化指的是通过引入大模型来减少人为查验的工作方式

D. 自动化的前提是要有业务专家参与构建评测集

12. 关于 temperature 和 top_p 参数的作用，以下哪三个描述是正确的？

A. 较低的 top_p 可以提高生成内容的稳定性

B. 较低的 temperature 可以增加生成内容的多样性

C. 通常情况下，只需调整其中一个参数即可。

D. 较高的 temperature 可以增加生成内容的多样性

13. 在大语言模型微调的训练循环中，哪些步骤是必须包含的？

A. 梯度裁剪

B. 模型保存

C. 正向传播

D. 反向传播

E. 超参数调整

F. 梯度更新

14. 在提示词中，以下哪些符号可以作为分隔符？

A. 【】

B. <<

C. <&lt

15. 在优化后的答疑机器人中，以下哪些是可能的输出？

A. 文档审查结果

B. 公司内部文档查询结果

C. 内容翻译结果

16. 以下哪些选项属于流式输出相比于非流式输出的优势？

A. 能够提升大模型回复的效果

B. 能够给用户带来良好的阅读体验

C. 能够加快大模型回复的速度

D. 在网络连接时不会造成可能存在的超时错误

17. 在私有知识问答场景中，直接传入私域知识相关的参考信息可能导致哪些问题？

A. 提示词长度有限

B. 模型处理效率降低

C. 模型无法理解私域知识

D. 模型生成内容不准确

18. 在检索召回阶段，以下哪些方法用于在检索前还原用户真实意图？

A. 问题改写

B. 问题扩写

C. 基于用户画像扩展上下文

D. 提取标签

19. 在示例中，以下哪些是知识库中召回的内容？

A. 内容研究与分析

B. 教材和课程开发

C. 增加模型的训练数据

D. 减少模型的推理时间

20. 以下哪些 Python 库可以用于处理视频或图像？

A. numpy

B. OpenCV

C. pandas

D. TensorFlow

E. requests

F. moviepy

21. 以下哪些方案，有助于提升大模型应用的用户体验？

A. 等全部内容生成后一次性返回

B. 展示任务处理进度

C. 生成的内容流式输出

D. 将任务分解为多个步骤，并且将分步执行过程展示给用户

22. 通过 LlamaIndex 创建 RAG 应用，关于下面这段代码作用的描述正确的有哪些?

A. 将所有 Document 对象合并为一个 Document 对象

B. 对乱码内容进行数据清洗

C. 将中文的标点符号预先转化为英文标点符号，使得切分时不会使得 chunk 长度过长

D. 将指定文件夹中的文件加载为 document 对象

23. 在提取标签的过程中，以下哪些场景是正确的？

A. 建立索引时，从文档切片中提取结构化标签

B. 检索时，从用户问题中提取对应的标签进行过滤

C. 建立索引时，从用户问题中提取结构化标签

24. 以下关于 CosyVoice 的描述，哪些是正确的？

A. CosyVoice 是一个文本转语音模型。

B. CosyVoice 可以直接生成视频。

C. CosyVoice 支持实时流式语音合成。

D. CosyVoice 可以用于语音识别。

25. 某公司正在开发一款智能客服系统，用于为用户提供多语言支持。在处理用户问题时，系统需要准确翻译并解释一些内部非公开的领域术语。为了确保翻译和解释的高准确性，以下哪两个方案能有效解决这一问题？

A. 手动整理所有术语及其翻译，并作为提示词提供给模型

B. 要求模型在遇到未知术语时直接跳过，避免错误翻译

C. 提供3条术语的翻译示例，依赖模型自行推断其余术语的含义

D. 通过RAG技术接入该领域术语数据库，动态检索并翻译术语

26. 以下哪些选项是把 DASHSCOPE_API_KEY 配置为环境变量的原因?

A. 防止 KEY 泄漏

B. 配置为环境变量可以减少代码的行数。

C. 环境变量会自动被 SDK 读取和使用。

D. 环境变量可以加快程序的运行速度。

27. 你需要大模型从客户邮件中提取结构化数据（如姓名、订单号、问题类型），以下哪两个选项有助于你达成这一目标？

A. 提供你期望的 JSON 结构示例

B. 调低温度参数（Temperature）以降低随机性

C. 在任务目标中明确 "输出 JSON 格式"

D. 要求模型分两步操作，先总结邮件内容，再提取字段

28. 在 Answer Correctness 的计算过程中，以下哪些是事实准确度的比较对象？

A. answer 的观点列表

B. ground_truth 的观点列表

C. 增加模型的训练数据

D. 减少模型的推理时间

29. 下列哪些 AIGC 应用场景需要进行算法备案？

A. 基于 AIGC 的智能客服系统

B. 使用机器学习算法进行数据分析的企业内部工具

C. 基于大模型的 AI 写作工具

D. 利用深度学习进行图像生成的绘画软件

30. top_p参数如何影响候选Token的筛选？

A. 高top_p值增加候选Token的范围

B. 低top_p值减少候选Token的范围

C. 高top_p值减少候选Token的范围

大模型LLM ACA - ACP认证考试模拟试卷六

一、大模型LLM ACA - ACP认证考试

二、大模型LLM ACA - ACP认证考试模拟试卷

（一）单选题 ：70 题 × 1 分 = 70 分

1. 在以下代码片段中，query_engine = index.as_query_engine(...)的作用是什么？

2. 在准备业务领域相关数据集时，以下哪项做法可能导致模型微调效果不佳？

3. 你想针对一篇两岸性的论文对 RAG 应用进行提问，可回答效果不好，你发现后台日志中召回的文本段出现一句话没有说完就被另一句话截断的现象，问题可能出在哪里了？

4. 下哪种做法不能 "保证关键数据的语义独立性与完整性"？

5. 在RAG应用的多轮对话中，以下哪些工具可以快速实现多轮对话？

6. 为了确保与通义千问大模型的交互更加个性化和连续性，下列哪项策略最不推荐？

7. 在提示词中规定输出格式的主要作用是什么？

8. 你开发了一个 RAG 应用，发现其在回答内部流程问题（如"报销系统登录方式"）时准确率高，但回答通识性问题（如"如何修复Excel公式错误"）时质量差。应该优先尝试以下哪个改进方案？

9. 在使用LLM的何种场景下，思维链技术能发挥最大的用处？

10. 在文档切片过程中，以下哪种切片方法适合对 Token 数量有严格要求的场景？

11. 相比直接使用大模型的 API，使用百炼的 Assistant API 构建 Agent 的主要优势是什么？

12. 在代码中，index.as_query_engine 方法的主要作用是什么？

13. 你需要在资源受限的环境下部署一个大模型，以下哪种方案有助于你减少对显存的需求？

14. 在构建 RAG 应用时，哪种技术适合处理大规模文本数据？

15. 某团队想用 RAG 做 "分步骤查询"，先找出人员名单，再分别查询每人的部门信息，以下哪项功能最适合？

16. 以下哪个代码片段能够正确遍历feedback_list并打印每个问题的意图？feedback_list的格式为(1, "问题1"), (2, "问题2"), ...

17. 在大语言模型微调训练中，哪一步骤涉及到计算损失函数关于模型参数的梯度？

18. 在优化检索效果时，若知识库内容充足但召回率低，以下哪种方法是合理的？

19. 在优化后的答疑机器人中，以下哪些是提示词中规定的输入格式？

20. 在通过大语言模型检测文档内容中是否存在营销表达时，下列哪种方法可以更全面地识别问题？

21. 在构建 RAG 应用时，以下哪种向量存储方案支持向量 + 标量的混合检索？

22. 以下哪个提示词要素用于约束大模型的应答风格，使其符合特定人群的阅读习惯？

23. 在将意图识别应用到答疑机器人中，ask_llm_route函数的主要作用是什么？

24. RAG应用在处理表格数据时，下列哪种方法能更好地保留表格的语义信息并方便后续查询?

25. 某企业需要部署一个大模型，不定期自动地分析现有的产品文档，并产出改进建议，以下哪一种计费方式可以在满足业务需求的同时最大化降低运行成本？:

26. 句子窗口检索的优势在于?

27. 假设system提示词已经定义了大语言模型的角色为"一个专业的写作助手"。以下哪个用户查询语句最适合用于指导大语言模型扩写一段关于太空旅行的文字？

28. 你在开发一个内部IT 系统，希望能够自动处理员工的请求："我的投影仪故障了，请安排维修并通知下午会议改线上"。以下哪种技术方案有效、且能尽量減少人力投入？

29. 在提示词构建中，哪个要素用于指定大模型的回应风格或语气？

30. 如果 answer correctness 指标得分较低，而 context recall 和 context precision 得分较高，以下哪种优化措施是可行的？

31. 以下哪个选项最适合作为系统角色提示词，用于构建一个可以进行代码审查的 AI 助手？

32. 微软AutoGen项目设计了多智能体对话框架，并允许人类用户参与对话讨论，这种交互特性有什么优势？

33. 有用户使用 "找张伟" 这类极简搜索，RAG 系统经常没能检索到所需文档，最合理的技术改进是什么？

34. 你作为一名医学检验研究员，需翻译存在大量 "NSC"（可能指 "神经干细胞" 或 "非小细胞癌"）缩写的文献。应如何设计提示词以消除歧义？

35. 在RAG应用的多轮对话中，CondenseQuestionChatEngine的主要作用是什么？

36. 根据 "Multi-Agent" 的思想，以下哪种方式更适合处理复杂的 RAG 优化任务？

37. 在Al模型的训练过程中，哪一阶段主要旨在通过模拟人类的评价机制，调整模型输出以更贴近人类偏好和道德标准？

38. 通过LamaIndex创建RAG应用时，node_postprocessors的作用是?

39. 在RAG应用的建立索引阶段，文本向量化的主要作用是什么？

40. 在模型训练循环中，哪段代码用于更新模型权重（梯度更新）？

41. 在构建大语言模型提示词过程中，以下哪种分隔符最适合用于区分不同的对话轮次或历史记录?

42. 在切片向量化与存储阶段，以下哪种方法用于定义要测试的 Embedding 模型？

43. 在需要生成新闻初稿和代码的场景中，建议如何设置top_p参数？

44. 在优化检索效果时，以下哪些方法可以提升大模型对参考信息的查找效率？

45. 某律所希望开发一个基于 RAG 的合同审阅系统，已通过 POC（Proof of Concept，是针对客户具体应用的验证性测试）验证了系统对于一些常见问题的准确性和效率。下一步应该优先做什么？

46. 在LlamaIndex的默认提示词模板中，query_str表示什么？

47. 在大模型应用系统成本优化方面，如何有效利用不同规模的语言模型 (LLMs） 以实现资源高效分配？

48. 在切片向量化与存储阶段，以下哪种 Embedding 模型是更新的版本？

49. 在优化检索效果时，以下哪些方法可以提升文档的结构性？

50. 在下列使用Qwen - Max辅助内容生产的场景中，以下哪个操作是可以执行的?

51. 在进行 RAG 应用评测时，应该如何获取测试集中的正确答案（ground_truth）？

52. 以下哪段代码设置了模型训练过程中的学习率？

53. 以下哪种方法最适合用于解析PDF和Word文档中的文本内容，以便进行后续的RAG处理?

54. 在开发大语言模型RAG应用过程中，以下哪种情况适合使用视觉模型进行深层次解析？

55. 以下哪个代码片段展示了正确的用户（user）提问方式？

56. Qwen系列模型中，哪个模型代表了经过大规模数据预训练后的基础版本，未针对特定任务进行过多调整？

57. 如果让你从 faithfulness, context_recall, context_precision, answer_correctness 中选择一个最能代表 RAG 应用整体性能的指标，你会选哪个？

58. 大语言模型微调时，通过调节哪个参数可以直接控制模型学习新知识的速度?

59. 假设有一个多Agent系统用于大规模灾害救援，其中涉及搜索、救援和物资分配等多个子任务，以下哪个设计原则对于提升系统整体效能最为关键？

60. 在借助Llamaindex构建问答机器人过程中，如果存储目录不存在，应使用哪个类来读取文档并创建索引?

61. 用户希望大模型根据描述创造一幅画，这需要开启哪个插件来实现？

62. 以下哪种文本切片方法最有可能保留完整的语义信息？

63. 你开发了一个 RAG 应用，用户反馈回复效果不佳。你通过后台日志发现用户的输入有时缺少信息，如 "我要读研"、"请假"，你应该优先进行哪方面的优化？

64. 你希望对于同一个提示词，让大模型每次都尽最大可能返回相同结果，可以调整哪个参数？

65. 在开发智能体系统中，智能体的工作日志、历史检索数据等等，会占用大量的大模型上下文，影响智能体做规划的性能。人们可以通过哪些手段来缓解这方面的压力？

66. 以下哪种方法最适合用于明确指定大模型输出的格式和类型？

67. 你希望用阿里云百炼平台的通义千问大模型生成商品描述，但要求不同用户看到的内容略有差异，应如何实现？

68. 在代码中，similarity_top_k=5 的主要作用是什么？

69. Ragas 提供的 Context Recall 指标用于评估什么？

70. 在多模态场景下，用户向基于RAG的智能答疑机器人提交报销申请，以下哪种情况不需要进行内容安全合规检查?

（二）多选题 ：30 题 × 1 分 = 30 分

1. 在问题改写中，以下哪些方法用于在检索前还原用户真实意图？

2. 以下哪些场景适合设置较低的top_p值？

3. 在创建 APIAssistantAgent 的过程中，将 functions 参数作为字典传入的解释正确的有哪些？

4. 在示例中，以下哪些是提示词中规定的输出要求？

5. 以下关于top_p参数的描述，哪些是正确的？

（一）单选题：70 题 × 1 分 = 70 分

16. 以下哪个代码片段能够正确遍历feedback_list并打印每个问题的意图？feedback_list的格式为 $(1, "问题1"), (2, "问题2"), ...$

47. 在大模型应用系统成本优化方面，如何有效利用不同规模的语言模型 (LLMs）以实现资源高效分配？

（二）多选题：30 题 × 1 分 = 30 分