阿里云大模型ACP认证考试测试题

实现流式输出时，需要在API调用中添加哪个参数？

A. stream=True

B. streaming=True

C. stream_output=True

D. enable_stream=True

答案: A

解析: 标准参数名为stream，设置为True启用流式输出。

知识点: 大模型应用开发

流式输出相比普通输出的主要优势是什么？

A. 降低API调用成本

B. 提升回答的准确性

C. 减少用户等待时间，改善交互体验

D. 减少token消耗

答案: C

解析: 流式输出让用户可以边生成边阅读，无需等待完整回答生成。

知识点: 大模型应用开发

使用流式输出时，如何获取完整的响应内容？

A. 直接读取response.content

B. 遍历响应chunk并拼接

C. 等待stream结束信号

D. 调用response.complete()方法

答案: B

解析: 流式输出需要遍历每个delta chunk，逐步拼接成完整内容。

知识点: 大模型应用开发

关于流式输出，以下哪种说法是正确的？

A. 流式输出会减少token的总消耗

B. 流式输出可以提升回答的质量

C. 流式输出只是改变了内容展示方式，不影响最终答案质量

D. 流式输出只适用于文本生成，不适用于多轮对话

答案: C

解析: 流式输出仅影响内容交付方式，不影响模型生成质量。

知识点: 大模型应用开发

大模型文本生成的第一步是什么？

A. 向量化

B. 分词（Tokenization）

C. 自回归生成

D. 概率采样

答案: B

解析: 首先将文本转换为token序列，这是模型处理的第一步。

知识点: 大模型应用开发

Token指的是什么？

A. 完整的中文汉字

B. 完整的英文单词

C. 文本编码后的基本单位，可能是子词或字符片段

D. API调用的凭证

答案: C

解析: Token是分词器处理后的基本单位，不一定对应完整的词。

知识点: 大模型应用开发

Embedding（嵌入）的主要作用是什么？

A. 将文本转换为高维向量表示语义

B. 压缩文本减少存储占用

C. 加密文本保障安全

D. 加速文本传输速度

答案: A

解析: Embedding将文本映射到语义空间，相似文本的向量距离更近。

知识点: 大模型应用开发

大模型生成文本时，"自回归"指的是什么？

A. 自动回归到上一个版本

B. 每一步生成的token会作为下一步的输入

C. 自动修正生成中的错误

D. 自动调整模型参数

答案: B

解析: 自回归生成是将已生成的内容追加到输入，继续预测下一个token。

知识点: 大模型应用开发

以下哪个不是大模型解码策略？

A. 贪心解码

B. Beam Search

C. 随机采样

D. 反向传播

答案: D

解析: 反向传播是训练阶段的优化算法，不是生成阶段的解码策略。

知识点: 大模型应用开发

temperature参数对生成内容有什么影响？

A. 值越低，输出越随机多样

B. 值越低，输出越确定集中

C. 值越低，生成速度越快

D. 值越低，token消耗越少

答案: B

解析: temperature控制概率分布的尖锐程度，越低越集中于高概率token。

知识点: 大模型应用开发

当temperature设置为0时，以下哪种说法正确？

A. 相同输入一定会得到完全相同的输出

B. 输出会非常随机

C. 模型会尽量选择概率最高的token，但仍可能因分布式系统差异有微小变化

D. 模型会停止生成

答案: C

解析: temperature=0最大程度降低随机性，但不能保证100%完全一致。

知识点: 大模型应用开发

top_p参数的作用是什么？

A. 设置生成token的最大数量

B. 从累积概率达到阈值的token集合中采样

C. 设置回答的最大段落数

D. 控制回答的礼貌程度

答案: B

解析: top_p（核采样）选择累积概率达到p的最小token集合进行采样。

知识点: 大模型应用开发

如果需要生成代码，以下哪种参数配置最合适？

A. temperature=1.5, top_p=0.9

B. temperature=0.1, top_p=0.3

C. temperature=0.7, top_p=0.8

D. temperature=1.0, top_p=1.0

答案: B

解析: 代码生成需要高确定性，应调低随机性参数。

知识点: 大模型应用开发

如果需要生成广告文案或创意内容，应该如何配置参数？

A. 调低temperature和top_p

B. 调高temperature和top_p

C. temperature设为0，top_p设为1

D. 参数配置不影响创意性

答案: B

解析: 创意内容需要多样性，应提高随机性参数。

知识点: 大模型应用开发

关于temperature和top_p，以下哪种说法是错误的？

A. 两者都可以控制生成内容的随机性

B. 建议同时大幅调整这两个参数以获得最佳效果

C. temperature影响概率分布的形状

D. top_p影响候选token集合的大小

答案: B

解析: 课程建议不要同时调整这两个参数，否则结果可能不可预测。

知识点: 大模型应用开发

seed参数的主要作用是什么？

A. 加速模型推理速度

B. 减少API调用成本

C. 尝试让相同输入获得相同输出

D. 提升回答的准确性

答案: C

解析: 固定seed可以增加可重现性，但不能保证100%一致。

知识点: 大模型应用开发

top_k采样和top_p采样的区别是什么？

A. top_k按概率排名取前k个，top_p按累积概率取候选集

B. top_k更快，top_p更准

C. top_k适用于中文，top_p适用于英文

D. 两者没有本质区别，只是名称不同

答案: A

解析: top_k是固定数量候选，top_p是动态数量候选，保证累积概率达到p。

知识点: 大模型应用开发

presence_penalty参数的作用是什么？

A. 惩罚已经出现过的token，减少重复

B. 惩罚不礼貌的用词

C. 加快生成速度

D. 减少token消耗

答案: A

解析: presence_penalty增加已出现token的生成成本，减少重复内容。

知识点: 大模型应用开发

Context Engineering（上下文工程）的核心目标是什么？

A. 让上下文尽可能长

B. 在正确的时间将最相关的信息动态加载到上下文窗口

C. 降低API调用成本

D. 提升模型的参数量

答案: B

解析: 上下文工程的关键是精准、动态地提供最相关的背景信息。

知识点: 大模型应用开发

以下哪个不是上下文工程的核心技术？

A. RAG（检索增强生成）

B. 提示词工程

C. 工具使用

D. 模型蒸馏

答案: D

解析: 模型蒸馏是模型压缩技术，不属于上下文工程范畴。

知识点: 大模型应用开发

大模型无法回答私域知识问题的根本原因是什么？

A. 模型参数量不够大

B. 私域知识不在模型的训练数据中

C. API调用频率受限

D. 用户提问方式不对

答案: B

解析: 大模型的知识仅限于训练时见过的数据，不包含企业内部私有信息。

知识点: 大模型应用开发

RAG技术主要解决什么问题？

A. 提升模型的推理速度

B. 让大模型能够使用外部私有知识

C. 降低模型训练成本

D. 增加模型的参数量

答案: B

解析: RAG通过检索外部知识库，为模型提供私域或实时知识。

知识点: 大模型应用开发

构建RAG应用的第一阶段通常是什么？

A. 检索相关文档

B. 建立索引（文档切片+向量化+存储）

C. 生成最终答案

D. 评估回答质量

答案: B

解析: 首先需要处理文档，建立可检索的向量索引。

知识点: 大模型应用开发

RAG的第二阶段"检索与生成"不包括以下哪一步？

A. 将用户问题向量化

B. 检索相似的文档切片

C. 重新训练大模型

D. 结合问题和检索结果生成答案

答案: C

解析: RAG不需要重新训练模型，检索增强是在推理阶段进行的。

知识点: 大模型应用开发

以下哪种情况最适合使用RAG技术？

A. 需要模型具备数学推理能力

B. 需要回答企业内部文档中的具体问题

C. 需要生成创意广告文案

D. 需要进行图像识别

答案: B

解析: RAG最擅长的就是让大模型回答私有知识库中的问题。

知识点: 大模型应用开发

关于上下文窗口，以下哪种说法是错误的？

A. 上下文窗口大小是有限的

B. 超出上下文窗口限制会导致错误

C. 上下文越长，回答质量一定越好

D. 上下文过长会增加成本和延迟

答案: C

解析: 无关的上下文会干扰模型，不是越长越好。

知识点: 大模型应用开发

以下哪项不是千问大模型支持的能力？

A. 视觉理解

B. 音频理解

C. 文生图

D. 量子计算

答案: D

解析: 千问支持多模态能力，但不涉及量子计算。

知识点: 大模型应用开发

千问API中，enable_search参数的作用是什么？

A. 启用向量检索功能

B. 让大模型可以搜索互联网信息丰富回答

C. 搜索本地文件系统

D. 启用日志搜索功能

答案: B

解析: enable_search让模型可以联网搜索获取实时信息。

知识点: 大模型应用开发

以下哪个模型具有最强的推理能力，会先输出思考过程再输出答案？

A. qwen-turbo

B. qwen-plus

C. qwen3-thinking系列

D. qwen-long

答案: C

解析: qwen3-thinking系列模型具有深度思考能力，会输出完整思考链。

知识点: 大模型应用开发

如果需要处理超长文档问答，应该优先选择哪个模型？

A. qwen-turbo

B. qwen-plus

C. qwen-max

D. qwen-long

答案: D

解析: qwen-long针对长上下文进行了优化，支持超长文档处理。

知识点: 大模型应用开发

对于简单的信息查询和总结任务，哪个模型性价比最高？

A. qwen-turbo

B. qwen-plus

C. qwen-max

D. qwen3-72B

答案: A

解析: qwen-turbo速度快、成本低，适合简单任务。

知识点: 大模型应用开发

构建法律领域的RAG应用，建议优先选择哪个模型？

A. qwen-turbo

B. qwen-plus

C. farui-plus

D. qwen-long

答案: C

解析: farui-plus是面向法律领域训练的专用模型。

知识点: 大模型应用开发

以下哪个不是阿里云百炼提供的模型？

A. qwen-turbo

B. gpt-4o

C. qwen-plus

D. qwen-max

答案: B

解析: GPT-4o是OpenAI的模型，不是阿里云提供的。

知识点: 大模型应用开发

提示词工程的核心目标是什么？

A. 让提示词尽可能长

B. 精确引导模型输出符合预期的内容

C. 降低API调用成本

D. 隐藏用户的真实意图

答案: B

解析: 通过精心设计的指令引导模型的思考方式和输出格式。

知识点: 大模型提示词工程

一个好的系统提示词不应该包含以下哪项？

A. 明确的角色定位

B. 具体的任务描述

C. 输出格式要求

D. 用户的个人隐私信息

答案: D

解析: 提示词中不应包含敏感隐私信息。

知识点: 大模型提示词工程

在提示词中使用分隔符（如---、###）的主要目的是什么？

A. 美化排版

B. 明确区分不同部分，避免歧义

C. 减少token消耗

D. 提升生成速度

答案: B

解析: 分隔符帮助模型清晰识别指令、输入、输出等不同部分。

知识点: 大模型提示词工程

"Let's think step by step" 这种提示词主要用于提升模型的什么能力？

A. 创意生成

B. 逻辑推理

C. 文本摘要

D. 翻译质量

答案: B

解析: 引导模型逐步思考可以显著提升推理类任务的表现。

知识点: 大模型提示词工程

Few-shot prompting指的是什么？

A. 很少使用提示词

B. 在提示词中提供几个示例

C. 只用几个词的简短提示

D. 很少调用模型

答案: B

解析: Few-shot通过提供少量示例让模型理解任务要求。

知识点: 大模型提示词工程

Zero-shot prompting和Few-shot prompting的主要区别是什么？

A. 是否提供示例

B. 提示词的长度

C. 调用模型的次数

D. 消耗的token数量

答案: A

解析: Zero-shot不提供示例直接提问，Few-shot提供少量示例。

知识点: 大模型提示词工程

Chain-of-Thought（思维链）提示词最适合哪种任务？

A. 文本翻译

B. 数学推理

C. 文章摘要

D. 情感分类

答案: B

解析: 思维链特别适合需要多步推理的复杂问题。

知识点: 大模型提示词工程

在提示词中要求"输出JSON格式"，这属于哪类指导？

A. 角色设定

B. 任务描述

C. 格式约束

D. 质量要求

答案: C

解析: 明确输出格式属于格式约束类指导。

知识点: 大模型提示词工程

"如果你不确定答案，就说'我不知道'"，这条提示词主要是为了什么？

A. 减少回答长度

B. 避免模型编造信息（幻觉）

C. 加快响应速度

D. 降低token消耗

答案: B

解析: 明确要求不编造可以有效减少模型幻觉。

知识点: 大模型提示词工程

提示词中使用"你是一名资深的软件架构师..."属于什么技巧？

A. 角色设定

B. 示例演示

C. 分步思考

D. 格式约束

答案: A

解析: 给模型设定专业角色可以提升输出的专业性和质量。

知识点: 大模型提示词工程

如果模型总是输出过于冗长的回答，应该如何调整提示词？

A. 增加temperature值

B. 明确要求"简洁回答，不超过3句话"

C. 增加更多示例

D. 使用思维链技巧

答案: B

解析: 明确的长度约束可以有效控制输出篇幅。

知识点: 大模型提示词工程

模型输出的JSON格式经常解析失败，以下哪种方法最不可能解决这个问题？

A. 明确要求"输出纯JSON，不要有任何解释文字"

B. 提供正确的JSON格式示例

C. 要求"使用json和包裹输出"

D. 增大temperature值

答案: D

解析: 增大随机性反而可能让格式更不稳定，应该降低随机性。

知识点: 大模型提示词工程

以下哪条提示词的设计更合理？

A. "写点东西"

B. "作为产品经理，为一款AI写作工具写一篇300字的微信公众号推广文章，目标用户是内容创作者，突出高效生成和质量提升两大优势"

C. "帮我写文案"

D. "AI写作工具推广文案"

答案: B

解析: 包含角色、目标、字数、受众、核心卖点的完整提示效果最好。

知识点: 大模型提示词工程

如果模型总是忽略提示词中的某些要求，以下哪种方法最有效？

A. 把重要要求重复强调几遍

B. 用大写字母写重要要求

C. 把重要要求放在提示词末尾或用特殊标记突出

D. 减少提示词长度

答案: C

解析: 模型对提示词开头和结尾的内容关注度更高，用标记也能增强注意力。

知识点: 大模型提示词工程

"请先输出思考过程，用标签包裹，然后输出最终答案"，这种技巧的主要作用是什么？

A. 美化输出格式

B. 提升模型推理的可解释性和准确性

C. 减少token消耗

D. 加快生成速度

答案: B

解析: 显式的思考过程可以提升推理质量并便于调试。

知识点: 大模型提示词工程

需要从长文档中提取特定信息时，提示词中最重要的是什么？

A. 要求模型通读全文

B. 明确列出需要提取的字段和格式

C. 要求用中文回答

D. 设置低temperature

答案: B

解析: 明确的提取目标是信息抽取任务的关键。

知识点: 大模型提示词工程

提示词中的"负面提示"（如"不要使用专业术语"）的主要作用是什么？

A. 减少输出长度

B. 明确禁止的行为，避免不符合预期的输出

C. 降低理解难度

D. 加快生成速度

答案: B

解析: 负面提示明确了不该做什么，缩小输出空间。

知识点: 大模型提示词工程

使用结构化提示词（分点列出要求）相比大段文字的优势不包括？

A. 模型更容易理解和遵循

B. 便于调试和修改

C. 减少token消耗

D. 减少遗漏要求的概率

答案: C

解析: 结构化可能反而增加少量token，但收益远大于成本。

知识点: 大模型提示词工程

做文本分类任务时，提示词中最关键的是什么？

A. 明确分类的类别定义和判断标准

B. 要求快速回答

C. 设置高temperature

D. 使用英文提示

答案: A

解析: 类别定义越清晰，分类准确率越高。

知识点: 大模型提示词工程

做摘要任务时，以下哪条提示词效果最好？

A. "总结一下"

B. "请用不超过100字总结这段文字，保留核心观点和关键数据"

C. "帮我缩短一下"

D. "写个摘要"

答案: B

解析: 明确字数、保留内容的摘要要求效果最佳。

知识点: 大模型提示词工程

做翻译任务时，以下哪条提示词最合理？

A. "翻译成中文"

B. "将以下英文专业文档翻译成中文，保留技术术语的准确性，符合中文技术文档的表达习惯，遇到不确定的术语请保留原文"

C. "帮我翻一下"

D. "中文翻译"

答案: B

解析: 明确原文类型、质量要求、特殊情况处理策略的提示词效果最好。

知识点: 大模型提示词工程

做创意写作任务时，提示词中应该特别强调什么？

A. 严格的格式要求

B. 创意方向、目标受众、风格偏好

C. 极低的temperature

D. 快速输出

答案: B

解析: 创意任务需要明确方向和约束，否则可能偏离目标。

知识点: 大模型提示词工程

做代码生成任务时，以下哪项不是必须在提示词中说明的？

A. 编程语言

B. 功能需求

C. 代码规范要求

D. 开发者的姓名

答案: D

解析: 开发者姓名与代码生成任务无关。

知识点: 大模型提示词工程

在构建问答机器人时，系统提示词中"要求模型根据检索到的上下文回答，不知道就说不知道"主要是为了？

A. 提升回答速度

B. 减少模型幻觉，确保答案有据可依

C. 减少token消耗

D. 简化提示词

答案: B

解析: 这是RAG应用中减少幻觉的关键提示词技巧。

知识点: 大模型提示词工程

需要模型对内容进行审核时，提示词中最重要的是什么？

A. 明确审核标准和违规类型的定义

B. 要求快速审核

C. 使用英文提示词

D. 设置高temperature

答案: A

解析: 审核标准越明确，判断的一致性和准确性越高。

知识点: 大模型提示词工程

RAG的全称是什么？

A. Retrieval-Augmented Generation

B. Rapid Automatic Generation

C. Resource-Aware Generation

D. Reliable Answer Generation

答案: A

解析: 检索增强生成技术的标准缩写。

知识点: 大模型检索增强RAG

RAG技术的核心思想是什么？

A. 训练更大的模型

B. 先检索相关知识再生成答案

C. 只使用向量检索

D. 完全替代传统搜索

答案: B

解析: RAG = 检索 + 生成，结合两者优势。

知识点: 大模型检索增强RAG

相比模型微调，RAG的主要优势不包括？

A. 知识更新更灵活

B. 可以引用信息来源

C. 训练成本更低

D. 模型推理速度更快

答案: D

解析: RAG需要额外的检索步骤，推理速度通常不会比纯模型更快。

知识点: 大模型检索增强RAG

RAG应用的典型流程不包括以下哪一步？

A. 文档加载与解析

B. 文档切片（Chunking）

C. 重新训练大模型

D. 检索相关切片

答案: C

解析: RAG不需要重新训练大模型，是即插即用的方案。

知识点: 大模型检索增强RAG

构建RAG系统时，"索引"指的是什么？

A. 数据库的主键

B. 文档切片的向量表示集合

C. 图书的目录页

D. 搜索引擎的倒排索引

答案: B

解析: RAG索引是文档向量化后的存储结构，用于相似度检索。

知识点: 大模型检索增强RAG

文档切片（Chunking）的主要目的是什么？

A. 减少存储占用

B. 让每个切片包含完整语义，便于精准检索

C. 加快文档读取速度

D. 便于分布式处理

答案: B

解析: 合理的切片平衡了语义完整性和检索精准度。

知识点: 大模型检索增强RAG

以下哪种切片方法是按语义相关性进行分割的？

A. Token切片

B. 句子切片

C. 语义切片

D. 固定长度切片

答案: C

解析: 语义切片会根据内容的语义连贯性智能选择分割点。

知识点: 大模型检索增强RAG

专门针对Markdown格式文档优化的切片方法是？

A. 按字符数切片

B. 按token数切片

C. 按标题层级切片

D. 随机切片

答案: C

解析: Markdown有天然的标题层级结构，可以按标题智能切片。

知识点: 大模型检索增强RAG

句子窗口切片（Sentence Window）的核心思想是什么？

A. 只检索单个句子

B. 用小句子检索，返回时扩展到周围句子的上下文

C. 每个切片必须包含固定数量的句子

D. 只使用窗口内的句子生成答案

答案: B

解析: 解决小切片缺上下文、大切片不精准的矛盾。

知识点: 大模型检索增强RAG

如果切片太小（如只有一两句话），最可能出现什么问题？

A. 检索速度变慢

B. 缺少必要的上下文信息，影响回答质量

C. 向量存储空间不足

D. 解析错误率上升

答案: B

解析: 过短的切片丢失了上下文，模型无法准确理解含义。

知识点: 大模型检索增强RAG

如果切片太大（如整篇文档），最可能出现什么问题？

A. 检索返回的内容包含太多无关信息

B. 向量化速度太慢

C. 存储空间不足

D. 文档解析失败

答案: A

解析: 过大的切片会混入大量无关内容，干扰答案生成。

知识点: 大模型检索增强RAG

处理包含表格的PDF文档时，最佳实践是什么？

A. 直接按纯文本切片

B. 使用专门的文档解析器保留表格结构

C. 跳过表格内容

D. 把表格转成图片

答案: B

解析: 表格是结构化信息，需要特殊处理才能正确检索。

知识点: 大模型检索增强RAG

DashScopeParse的主要功能是什么？

A. 快速解析PDF并转换为结构化Markdown

B. 解析网络数据包

C. 解析编程语言代码

D. 解析图片内容

答案: A

解析: 阿里云提供的文档智能解析服务。

知识点: 大模型检索增强RAG

文档切片时的overlap（重叠）主要是为了什么？

A. 增加切片数量

B. 避免重要信息在切片边界被截断

C. 提升检索召回率

D. 减少token消耗

答案: B

解析: 重叠部分保证跨切片的语义单元不会被分割丢失。

知识点: 大模型检索增强RAG

LlamaIndex中默认的切片方法是什么？

A. TokenTextSplitter

B. SentenceSplitter

C. MarkdownNodeParser

D. SemanticSplitter

答案: B

解析: 句子切片是默认且通用的切片策略。

知识点: 大模型检索增强RAG

在RAG中，为什么需要将文本向量化？

A. 压缩文本减小存储空间

B. 可以计算文本间的语义相似度

C. 加快文本传输速度

D. 加密文本内容

答案: B

解析: 向量空间中的距离可以衡量语义相似度。

知识点: 大模型检索增强RAG

余弦相似度衡量的是什么？

A. 两个向量在空间中的角度距离

B. 两个向量的长度差异

C. 两个向量的元素和之差

D. 两个向量的点积绝对值

答案: A

解析: 余弦相似度衡量向量方向的相似性，取值范围 $-1, 1$ 。

知识点: 大模型检索增强RAG

两个文本语义越相似，它们的余弦相似度值会？

A. 越接近1

B. 越接近0

C. 越接近-1

D. 越接近无穷大

答案: A

解析: 余弦相似度为1表示完全同向，语义最相似。

知识点: 大模型检索增强RAG

text-embedding-v3相比v2的主要改进是什么？

A. 支持更长的输入文本

B. 语义表示更准确，检索效果更好

C. 生成速度更快

D. 消耗的token更少

答案: B

解析: 新版本Embedding模型通常在质量上有显著提升。

知识点: 大模型检索增强RAG

选择Embedding模型时，最重要的考量因素是什么？

A. 模型名称是否好听

B. 发布时间是否最新

C. 在目标任务上的实际表现

D. 是否免费

答案: C

解析: 实际效果是选择模型的最重要标准。

知识点: 大模型检索增强RAG

以下哪个不是阿里云提供的Embedding模型？

A. text-embedding-v2

B. text-embedding-v3

C. gte-rerank

D. word2vec

答案: D

解析: word2vec是经典的传统词向量方法，不是阿里云提供的。

知识点: 大模型检索增强RAG

关于Embedding，以下哪种说法是正确的？

A. 不同模型生成的向量可以混用

B. 查询和文档需要使用相同的Embedding模型

C. Embedding向量的维度越小越好

D. 中文和英文必须用不同的Embedding模型

答案: B

解析: 必须使用同一模型生成的向量才能正确计算相似度。

知识点: 大模型检索增强RAG

Embedding模型的维度通常代表什么？

A. 可以处理的最大文本长度

B. 语义空间的丰富程度

C. 生成速度

D. 模型参数量

答案: B

解析: 更高维度通常意味着更丰富的语义表示能力。

知识点: 大模型检索增强RAG

开发测试阶段，最简单的向量存储方案是什么？

A. Milvus

B. 内存向量存储

C. Elasticsearch

D. PostgreSQL

答案: B

解析: LlamaIndex内置的内存存储无需额外部署，适合快速开发。

知识点: 大模型检索增强RAG

生产环境中，不建议使用内存向量存储的主要原因是？

A. 速度太慢

B. 数据无法持久化，重启后索引丢失

C. 不支持相似度检索

D. 占用内存太多

答案: B

解析: 内存存储是临时性的，进程退出后数据丢失。

知识点: 大模型检索增强RAG

阿里云向量检索服务DashVector的主要优势不包括？

A. 按量付费，自动扩缩容

B. 支持向量+标量混合检索

C. 完全免费

D. 托管服务无需运维

答案: C

解析: DashVector是云服务，按实际使用量计费。

知识点: 大模型检索增强RAG

向量检索中"标量过滤+向量相似度"的混合检索主要解决什么问题？

A. 提升检索速度

B. 先按条件缩小范围再做语义检索，提升精准度

C. 减少存储成本

D. 支持更长的文档

答案: B

解析: 先用结构化条件过滤，再在小范围内做语义检索，效果更好。

知识点: 大模型检索增强RAG

similarity_top_k参数的作用是什么？

A. 设置检索的最大耗时

B. 设置返回最相关的前k个文档切片

C. 设置相似度阈值

D. 设置最大切片数量

答案: B

解析: 控制单次检索返回的相关切片数量。

知识点: 大模型检索增强RAG

如果发现检索总是返回无关的内容，最可能的问题是什么？

A. 向量数据库太慢

B. similarity_top_k设置太大

C. Embedding模型质量不佳或切片不合理

D. 文档太少

答案: C

解析: 检索质量主要取决于Embedding质量和切片策略。

知识点: 大模型检索增强RAG

如果发现检索总是漏掉相关内容，以下哪种方法最不可能改善？

A. 增大similarity_top_k

B. 更换更好的Embedding模型

C. 优化切片策略

D. 减小similarity_top_k

答案: D

解析: 减小返回数量只会让漏掉的可能性更大。

知识点: 大模型检索增强RAG

更多题目我已经更新到了 "题主"小程序中。