实现流式输出时,需要在API调用中添加哪个参数?
A. stream=True
B. streaming=True
C. stream_output=True
D. enable_stream=True
答案: A
解析: 标准参数名为stream,设置为True启用流式输出。
知识点: 大模型应用开发
流式输出相比普通输出的主要优势是什么?
A. 降低API调用成本
B. 提升回答的准确性
C. 减少用户等待时间,改善交互体验
D. 减少token消耗
答案: C
解析: 流式输出让用户可以边生成边阅读,无需等待完整回答生成。
知识点: 大模型应用开发
使用流式输出时,如何获取完整的响应内容?
A. 直接读取response.content
B. 遍历响应chunk并拼接
C. 等待stream结束信号
D. 调用response.complete()方法
答案: B
解析: 流式输出需要遍历每个delta chunk,逐步拼接成完整内容。
知识点: 大模型应用开发
关于流式输出,以下哪种说法是正确的?
A. 流式输出会减少token的总消耗
B. 流式输出可以提升回答的质量
C. 流式输出只是改变了内容展示方式,不影响最终答案质量
D. 流式输出只适用于文本生成,不适用于多轮对话
答案: C
解析: 流式输出仅影响内容交付方式,不影响模型生成质量。
知识点: 大模型应用开发
大模型文本生成的第一步是什么?
A. 向量化
B. 分词(Tokenization)
C. 自回归生成
D. 概率采样
答案: B
解析: 首先将文本转换为token序列,这是模型处理的第一步。
知识点: 大模型应用开发
Token指的是什么?
A. 完整的中文汉字
B. 完整的英文单词
C. 文本编码后的基本单位,可能是子词或字符片段
D. API调用的凭证
答案: C
解析: Token是分词器处理后的基本单位,不一定对应完整的词。
知识点: 大模型应用开发
Embedding(嵌入)的主要作用是什么?
A. 将文本转换为高维向量表示语义
B. 压缩文本减少存储占用
C. 加密文本保障安全
D. 加速文本传输速度
答案: A
解析: Embedding将文本映射到语义空间,相似文本的向量距离更近。
知识点: 大模型应用开发
大模型生成文本时,"自回归"指的是什么?
A. 自动回归到上一个版本
B. 每一步生成的token会作为下一步的输入
C. 自动修正生成中的错误
D. 自动调整模型参数
答案: B
解析: 自回归生成是将已生成的内容追加到输入,继续预测下一个token。
知识点: 大模型应用开发
以下哪个不是大模型解码策略?
A. 贪心解码
B. Beam Search
C. 随机采样
D. 反向传播
答案: D
解析: 反向传播是训练阶段的优化算法,不是生成阶段的解码策略。
知识点: 大模型应用开发
temperature参数对生成内容有什么影响?
A. 值越低,输出越随机多样
B. 值越低,输出越确定集中
C. 值越低,生成速度越快
D. 值越低,token消耗越少
答案: B
解析: temperature控制概率分布的尖锐程度,越低越集中于高概率token。
知识点: 大模型应用开发
当temperature设置为0时,以下哪种说法正确?
A. 相同输入一定会得到完全相同的输出
B. 输出会非常随机
C. 模型会尽量选择概率最高的token,但仍可能因分布式系统差异有微小变化
D. 模型会停止生成
答案: C
解析: temperature=0最大程度降低随机性,但不能保证100%完全一致。
知识点: 大模型应用开发
top_p参数的作用是什么?
A. 设置生成token的最大数量
B. 从累积概率达到阈值的token集合中采样
C. 设置回答的最大段落数
D. 控制回答的礼貌程度
答案: B
解析: top_p(核采样)选择累积概率达到p的最小token集合进行采样。
知识点: 大模型应用开发
如果需要生成代码,以下哪种参数配置最合适?
A. temperature=1.5, top_p=0.9
B. temperature=0.1, top_p=0.3
C. temperature=0.7, top_p=0.8
D. temperature=1.0, top_p=1.0
答案: B
解析: 代码生成需要高确定性,应调低随机性参数。
知识点: 大模型应用开发
如果需要生成广告文案或创意内容,应该如何配置参数?
A. 调低temperature和top_p
B. 调高temperature和top_p
C. temperature设为0,top_p设为1
D. 参数配置不影响创意性
答案: B
解析: 创意内容需要多样性,应提高随机性参数。
知识点: 大模型应用开发
关于temperature和top_p,以下哪种说法是错误的?
A. 两者都可以控制生成内容的随机性
B. 建议同时大幅调整这两个参数以获得最佳效果
C. temperature影响概率分布的形状
D. top_p影响候选token集合的大小
答案: B
解析: 课程建议不要同时调整这两个参数,否则结果可能不可预测。
知识点: 大模型应用开发
seed参数的主要作用是什么?
A. 加速模型推理速度
B. 减少API调用成本
C. 尝试让相同输入获得相同输出
D. 提升回答的准确性
答案: C
解析: 固定seed可以增加可重现性,但不能保证100%一致。
知识点: 大模型应用开发
top_k采样和top_p采样的区别是什么?
A. top_k按概率排名取前k个,top_p按累积概率取候选集
B. top_k更快,top_p更准
C. top_k适用于中文,top_p适用于英文
D. 两者没有本质区别,只是名称不同
答案: A
解析: top_k是固定数量候选,top_p是动态数量候选,保证累积概率达到p。
知识点: 大模型应用开发
presence_penalty参数的作用是什么?
A. 惩罚已经出现过的token,减少重复
B. 惩罚不礼貌的用词
C. 加快生成速度
D. 减少token消耗
答案: A
解析: presence_penalty增加已出现token的生成成本,减少重复内容。
知识点: 大模型应用开发
Context Engineering(上下文工程)的核心目标是什么?
A. 让上下文尽可能长
B. 在正确的时间将最相关的信息动态加载到上下文窗口
C. 降低API调用成本
D. 提升模型的参数量
答案: B
解析: 上下文工程的关键是精准、动态地提供最相关的背景信息。
知识点: 大模型应用开发
以下哪个不是上下文工程的核心技术?
A. RAG(检索增强生成)
B. 提示词工程
C. 工具使用
D. 模型蒸馏
答案: D
解析: 模型蒸馏是模型压缩技术,不属于上下文工程范畴。
知识点: 大模型应用开发
大模型无法回答私域知识问题的根本原因是什么?
A. 模型参数量不够大
B. 私域知识不在模型的训练数据中
C. API调用频率受限
D. 用户提问方式不对
答案: B
解析: 大模型的知识仅限于训练时见过的数据,不包含企业内部私有信息。
知识点: 大模型应用开发
RAG技术主要解决什么问题?
A. 提升模型的推理速度
B. 让大模型能够使用外部私有知识
C. 降低模型训练成本
D. 增加模型的参数量
答案: B
解析: RAG通过检索外部知识库,为模型提供私域或实时知识。
知识点: 大模型应用开发
构建RAG应用的第一阶段通常是什么?
A. 检索相关文档
B. 建立索引(文档切片+向量化+存储)
C. 生成最终答案
D. 评估回答质量
答案: B
解析: 首先需要处理文档,建立可检索的向量索引。
知识点: 大模型应用开发
RAG的第二阶段"检索与生成"不包括以下哪一步?
A. 将用户问题向量化
B. 检索相似的文档切片
C. 重新训练大模型
D. 结合问题和检索结果生成答案
答案: C
解析: RAG不需要重新训练模型,检索增强是在推理阶段进行的。
知识点: 大模型应用开发
以下哪种情况最适合使用RAG技术?
A. 需要模型具备数学推理能力
B. 需要回答企业内部文档中的具体问题
C. 需要生成创意广告文案
D. 需要进行图像识别
答案: B
解析: RAG最擅长的就是让大模型回答私有知识库中的问题。
知识点: 大模型应用开发
关于上下文窗口,以下哪种说法是错误的?
A. 上下文窗口大小是有限的
B. 超出上下文窗口限制会导致错误
C. 上下文越长,回答质量一定越好
D. 上下文过长会增加成本和延迟
答案: C
解析: 无关的上下文会干扰模型,不是越长越好。
知识点: 大模型应用开发
以下哪项不是千问大模型支持的能力?
A. 视觉理解
B. 音频理解
C. 文生图
D. 量子计算
答案: D
解析: 千问支持多模态能力,但不涉及量子计算。
知识点: 大模型应用开发
千问API中,enable_search参数的作用是什么?
A. 启用向量检索功能
B. 让大模型可以搜索互联网信息丰富回答
C. 搜索本地文件系统
D. 启用日志搜索功能
答案: B
解析: enable_search让模型可以联网搜索获取实时信息。
知识点: 大模型应用开发
以下哪个模型具有最强的推理能力,会先输出思考过程再输出答案?
A. qwen-turbo
B. qwen-plus
C. qwen3-thinking系列
D. qwen-long
答案: C
解析: qwen3-thinking系列模型具有深度思考能力,会输出完整思考链。
知识点: 大模型应用开发
如果需要处理超长文档问答,应该优先选择哪个模型?
A. qwen-turbo
B. qwen-plus
C. qwen-max
D. qwen-long
答案: D
解析: qwen-long针对长上下文进行了优化,支持超长文档处理。
知识点: 大模型应用开发
对于简单的信息查询和总结任务,哪个模型性价比最高?
A. qwen-turbo
B. qwen-plus
C. qwen-max
D. qwen3-72B
答案: A
解析: qwen-turbo速度快、成本低,适合简单任务。
知识点: 大模型应用开发
构建法律领域的RAG应用,建议优先选择哪个模型?
A. qwen-turbo
B. qwen-plus
C. farui-plus
D. qwen-long
答案: C
解析: farui-plus是面向法律领域训练的专用模型。
知识点: 大模型应用开发
以下哪个不是阿里云百炼提供的模型?
A. qwen-turbo
B. gpt-4o
C. qwen-plus
D. qwen-max
答案: B
解析: GPT-4o是OpenAI的模型,不是阿里云提供的。
知识点: 大模型应用开发
提示词工程的核心目标是什么?
A. 让提示词尽可能长
B. 精确引导模型输出符合预期的内容
C. 降低API调用成本
D. 隐藏用户的真实意图
答案: B
解析: 通过精心设计的指令引导模型的思考方式和输出格式。
知识点: 大模型提示词工程
一个好的系统提示词不应该包含以下哪项?
A. 明确的角色定位
B. 具体的任务描述
C. 输出格式要求
D. 用户的个人隐私信息
答案: D
解析: 提示词中不应包含敏感隐私信息。
知识点: 大模型提示词工程
在提示词中使用分隔符(如---、###)的主要目的是什么?
A. 美化排版
B. 明确区分不同部分,避免歧义
C. 减少token消耗
D. 提升生成速度
答案: B
解析: 分隔符帮助模型清晰识别指令、输入、输出等不同部分。
知识点: 大模型提示词工程
"Let's think step by step" 这种提示词主要用于提升模型的什么能力?
A. 创意生成
B. 逻辑推理
C. 文本摘要
D. 翻译质量
答案: B
解析: 引导模型逐步思考可以显著提升推理类任务的表现。
知识点: 大模型提示词工程
Few-shot prompting指的是什么?
A. 很少使用提示词
B. 在提示词中提供几个示例
C. 只用几个词的简短提示
D. 很少调用模型
答案: B
解析: Few-shot通过提供少量示例让模型理解任务要求。
知识点: 大模型提示词工程
Zero-shot prompting和Few-shot prompting的主要区别是什么?
A. 是否提供示例
B. 提示词的长度
C. 调用模型的次数
D. 消耗的token数量
答案: A
解析: Zero-shot不提供示例直接提问,Few-shot提供少量示例。
知识点: 大模型提示词工程
Chain-of-Thought(思维链)提示词最适合哪种任务?
A. 文本翻译
B. 数学推理
C. 文章摘要
D. 情感分类
答案: B
解析: 思维链特别适合需要多步推理的复杂问题。
知识点: 大模型提示词工程
在提示词中要求"输出JSON格式",这属于哪类指导?
A. 角色设定
B. 任务描述
C. 格式约束
D. 质量要求
答案: C
解析: 明确输出格式属于格式约束类指导。
知识点: 大模型提示词工程
"如果你不确定答案,就说'我不知道'",这条提示词主要是为了什么?
A. 减少回答长度
B. 避免模型编造信息(幻觉)
C. 加快响应速度
D. 降低token消耗
答案: B
解析: 明确要求不编造可以有效减少模型幻觉。
知识点: 大模型提示词工程
提示词中使用"你是一名资深的软件架构师..."属于什么技巧?
A. 角色设定
B. 示例演示
C. 分步思考
D. 格式约束
答案: A
解析: 给模型设定专业角色可以提升输出的专业性和质量。
知识点: 大模型提示词工程
如果模型总是输出过于冗长的回答,应该如何调整提示词?
A. 增加temperature值
B. 明确要求"简洁回答,不超过3句话"
C. 增加更多示例
D. 使用思维链技巧
答案: B
解析: 明确的长度约束可以有效控制输出篇幅。
知识点: 大模型提示词工程
模型输出的JSON格式经常解析失败,以下哪种方法最不可能解决这个问题?
A. 明确要求"输出纯JSON,不要有任何解释文字"
B. 提供正确的JSON格式示例
C. 要求"使用json和包裹输出"
D. 增大temperature值
答案: D
解析: 增大随机性反而可能让格式更不稳定,应该降低随机性。
知识点: 大模型提示词工程
以下哪条提示词的设计更合理?
A. "写点东西"
B. "作为产品经理,为一款AI写作工具写一篇300字的微信公众号推广文章,目标用户是内容创作者,突出高效生成和质量提升两大优势"
C. "帮我写文案"
D. "AI写作工具推广文案"
答案: B
解析: 包含角色、目标、字数、受众、核心卖点的完整提示效果最好。
知识点: 大模型提示词工程
如果模型总是忽略提示词中的某些要求,以下哪种方法最有效?
A. 把重要要求重复强调几遍
B. 用大写字母写重要要求
C. 把重要要求放在提示词末尾或用特殊标记突出
D. 减少提示词长度
答案: C
解析: 模型对提示词开头和结尾的内容关注度更高,用标记也能增强注意力。
知识点: 大模型提示词工程
"请先输出思考过程,用标签包裹,然后输出最终答案",这种技巧的主要作用是什么?
A. 美化输出格式
B. 提升模型推理的可解释性和准确性
C. 减少token消耗
D. 加快生成速度
答案: B
解析: 显式的思考过程可以提升推理质量并便于调试。
知识点: 大模型提示词工程
需要从长文档中提取特定信息时,提示词中最重要的是什么?
A. 要求模型通读全文
B. 明确列出需要提取的字段和格式
C. 要求用中文回答
D. 设置低temperature
答案: B
解析: 明确的提取目标是信息抽取任务的关键。
知识点: 大模型提示词工程
提示词中的"负面提示"(如"不要使用专业术语")的主要作用是什么?
A. 减少输出长度
B. 明确禁止的行为,避免不符合预期的输出
C. 降低理解难度
D. 加快生成速度
答案: B
解析: 负面提示明确了不该做什么,缩小输出空间。
知识点: 大模型提示词工程
使用结构化提示词(分点列出要求)相比大段文字的优势不包括?
A. 模型更容易理解和遵循
B. 便于调试和修改
C. 减少token消耗
D. 减少遗漏要求的概率
答案: C
解析: 结构化可能反而增加少量token,但收益远大于成本。
知识点: 大模型提示词工程
做文本分类任务时,提示词中最关键的是什么?
A. 明确分类的类别定义和判断标准
B. 要求快速回答
C. 设置高temperature
D. 使用英文提示
答案: A
解析: 类别定义越清晰,分类准确率越高。
知识点: 大模型提示词工程
做摘要任务时,以下哪条提示词效果最好?
A. "总结一下"
B. "请用不超过100字总结这段文字,保留核心观点和关键数据"
C. "帮我缩短一下"
D. "写个摘要"
答案: B
解析: 明确字数、保留内容的摘要要求效果最佳。
知识点: 大模型提示词工程
做翻译任务时,以下哪条提示词最合理?
A. "翻译成中文"
B. "将以下英文专业文档翻译成中文,保留技术术语的准确性,符合中文技术文档的表达习惯,遇到不确定的术语请保留原文"
C. "帮我翻一下"
D. "中文翻译"
答案: B
解析: 明确原文类型、质量要求、特殊情况处理策略的提示词效果最好。
知识点: 大模型提示词工程
做创意写作任务时,提示词中应该特别强调什么?
A. 严格的格式要求
B. 创意方向、目标受众、风格偏好
C. 极低的temperature
D. 快速输出
答案: B
解析: 创意任务需要明确方向和约束,否则可能偏离目标。
知识点: 大模型提示词工程
做代码生成任务时,以下哪项不是必须在提示词中说明的?
A. 编程语言
B. 功能需求
C. 代码规范要求
D. 开发者的姓名
答案: D
解析: 开发者姓名与代码生成任务无关。
知识点: 大模型提示词工程
在构建问答机器人时,系统提示词中"要求模型根据检索到的上下文回答,不知道就说不知道"主要是为了?
A. 提升回答速度
B. 减少模型幻觉,确保答案有据可依
C. 减少token消耗
D. 简化提示词
答案: B
解析: 这是RAG应用中减少幻觉的关键提示词技巧。
知识点: 大模型提示词工程
需要模型对内容进行审核时,提示词中最重要的是什么?
A. 明确审核标准和违规类型的定义
B. 要求快速审核
C. 使用英文提示词
D. 设置高temperature
答案: A
解析: 审核标准越明确,判断的一致性和准确性越高。
知识点: 大模型提示词工程
RAG的全称是什么?
A. Retrieval-Augmented Generation
B. Rapid Automatic Generation
C. Resource-Aware Generation
D. Reliable Answer Generation
答案: A
解析: 检索增强生成技术的标准缩写。
知识点: 大模型检索增强RAG
RAG技术的核心思想是什么?
A. 训练更大的模型
B. 先检索相关知识再生成答案
C. 只使用向量检索
D. 完全替代传统搜索
答案: B
解析: RAG = 检索 + 生成,结合两者优势。
知识点: 大模型检索增强RAG
相比模型微调,RAG的主要优势不包括?
A. 知识更新更灵活
B. 可以引用信息来源
C. 训练成本更低
D. 模型推理速度更快
答案: D
解析: RAG需要额外的检索步骤,推理速度通常不会比纯模型更快。
知识点: 大模型检索增强RAG
RAG应用的典型流程不包括以下哪一步?
A. 文档加载与解析
B. 文档切片(Chunking)
C. 重新训练大模型
D. 检索相关切片
答案: C
解析: RAG不需要重新训练大模型,是即插即用的方案。
知识点: 大模型检索增强RAG
构建RAG系统时,"索引"指的是什么?
A. 数据库的主键
B. 文档切片的向量表示集合
C. 图书的目录页
D. 搜索引擎的倒排索引
答案: B
解析: RAG索引是文档向量化后的存储结构,用于相似度检索。
知识点: 大模型检索增强RAG
文档切片(Chunking)的主要目的是什么?
A. 减少存储占用
B. 让每个切片包含完整语义,便于精准检索
C. 加快文档读取速度
D. 便于分布式处理
答案: B
解析: 合理的切片平衡了语义完整性和检索精准度。
知识点: 大模型检索增强RAG
以下哪种切片方法是按语义相关性进行分割的?
A. Token切片
B. 句子切片
C. 语义切片
D. 固定长度切片
答案: C
解析: 语义切片会根据内容的语义连贯性智能选择分割点。
知识点: 大模型检索增强RAG
专门针对Markdown格式文档优化的切片方法是?
A. 按字符数切片
B. 按token数切片
C. 按标题层级切片
D. 随机切片
答案: C
解析: Markdown有天然的标题层级结构,可以按标题智能切片。
知识点: 大模型检索增强RAG
句子窗口切片(Sentence Window)的核心思想是什么?
A. 只检索单个句子
B. 用小句子检索,返回时扩展到周围句子的上下文
C. 每个切片必须包含固定数量的句子
D. 只使用窗口内的句子生成答案
答案: B
解析: 解决小切片缺上下文、大切片不精准的矛盾。
知识点: 大模型检索增强RAG
如果切片太小(如只有一两句话),最可能出现什么问题?
A. 检索速度变慢
B. 缺少必要的上下文信息,影响回答质量
C. 向量存储空间不足
D. 解析错误率上升
答案: B
解析: 过短的切片丢失了上下文,模型无法准确理解含义。
知识点: 大模型检索增强RAG
如果切片太大(如整篇文档),最可能出现什么问题?
A. 检索返回的内容包含太多无关信息
B. 向量化速度太慢
C. 存储空间不足
D. 文档解析失败
答案: A
解析: 过大的切片会混入大量无关内容,干扰答案生成。
知识点: 大模型检索增强RAG
处理包含表格的PDF文档时,最佳实践是什么?
A. 直接按纯文本切片
B. 使用专门的文档解析器保留表格结构
C. 跳过表格内容
D. 把表格转成图片
答案: B
解析: 表格是结构化信息,需要特殊处理才能正确检索。
知识点: 大模型检索增强RAG
DashScopeParse的主要功能是什么?
A. 快速解析PDF并转换为结构化Markdown
B. 解析网络数据包
C. 解析编程语言代码
D. 解析图片内容
答案: A
解析: 阿里云提供的文档智能解析服务。
知识点: 大模型检索增强RAG
文档切片时的overlap(重叠)主要是为了什么?
A. 增加切片数量
B. 避免重要信息在切片边界被截断
C. 提升检索召回率
D. 减少token消耗
答案: B
解析: 重叠部分保证跨切片的语义单元不会被分割丢失。
知识点: 大模型检索增强RAG
LlamaIndex中默认的切片方法是什么?
A. TokenTextSplitter
B. SentenceSplitter
C. MarkdownNodeParser
D. SemanticSplitter
答案: B
解析: 句子切片是默认且通用的切片策略。
知识点: 大模型检索增强RAG
在RAG中,为什么需要将文本向量化?
A. 压缩文本减小存储空间
B. 可以计算文本间的语义相似度
C. 加快文本传输速度
D. 加密文本内容
答案: B
解析: 向量空间中的距离可以衡量语义相似度。
知识点: 大模型检索增强RAG
余弦相似度衡量的是什么?
A. 两个向量在空间中的角度距离
B. 两个向量的长度差异
C. 两个向量的元素和之差
D. 两个向量的点积绝对值
答案: A
解析: 余弦相似度衡量向量方向的相似性,取值范围[-1, 1]。
知识点: 大模型检索增强RAG
两个文本语义越相似,它们的余弦相似度值会?
A. 越接近1
B. 越接近0
C. 越接近-1
D. 越接近无穷大
答案: A
解析: 余弦相似度为1表示完全同向,语义最相似。
知识点: 大模型检索增强RAG
text-embedding-v3相比v2的主要改进是什么?
A. 支持更长的输入文本
B. 语义表示更准确,检索效果更好
C. 生成速度更快
D. 消耗的token更少
答案: B
解析: 新版本Embedding模型通常在质量上有显著提升。
知识点: 大模型检索增强RAG
选择Embedding模型时,最重要的考量因素是什么?
A. 模型名称是否好听
B. 发布时间是否最新
C. 在目标任务上的实际表现
D. 是否免费
答案: C
解析: 实际效果是选择模型的最重要标准。
知识点: 大模型检索增强RAG
以下哪个不是阿里云提供的Embedding模型?
A. text-embedding-v2
B. text-embedding-v3
C. gte-rerank
D. word2vec
答案: D
解析: word2vec是经典的传统词向量方法,不是阿里云提供的。
知识点: 大模型检索增强RAG
关于Embedding,以下哪种说法是正确的?
A. 不同模型生成的向量可以混用
B. 查询和文档需要使用相同的Embedding模型
C. Embedding向量的维度越小越好
D. 中文和英文必须用不同的Embedding模型
答案: B
解析: 必须使用同一模型生成的向量才能正确计算相似度。
知识点: 大模型检索增强RAG
Embedding模型的维度通常代表什么?
A. 可以处理的最大文本长度
B. 语义空间的丰富程度
C. 生成速度
D. 模型参数量
答案: B
解析: 更高维度通常意味着更丰富的语义表示能力。
知识点: 大模型检索增强RAG
开发测试阶段,最简单的向量存储方案是什么?
A. Milvus
B. 内存向量存储
C. Elasticsearch
D. PostgreSQL
答案: B
解析: LlamaIndex内置的内存存储无需额外部署,适合快速开发。
知识点: 大模型检索增强RAG
生产环境中,不建议使用内存向量存储的主要原因是?
A. 速度太慢
B. 数据无法持久化,重启后索引丢失
C. 不支持相似度检索
D. 占用内存太多
答案: B
解析: 内存存储是临时性的,进程退出后数据丢失。
知识点: 大模型检索增强RAG
阿里云向量检索服务DashVector的主要优势不包括?
A. 按量付费,自动扩缩容
B. 支持向量+标量混合检索
C. 完全免费
D. 托管服务无需运维
答案: C
解析: DashVector是云服务,按实际使用量计费。
知识点: 大模型检索增强RAG
向量检索中"标量过滤+向量相似度"的混合检索主要解决什么问题?
A. 提升检索速度
B. 先按条件缩小范围再做语义检索,提升精准度
C. 减少存储成本
D. 支持更长的文档
答案: B
解析: 先用结构化条件过滤,再在小范围内做语义检索,效果更好。
知识点: 大模型检索增强RAG
similarity_top_k参数的作用是什么?
A. 设置检索的最大耗时
B. 设置返回最相关的前k个文档切片
C. 设置相似度阈值
D. 设置最大切片数量
答案: B
解析: 控制单次检索返回的相关切片数量。
知识点: 大模型检索增强RAG
如果发现检索总是返回无关的内容,最可能的问题是什么?
A. 向量数据库太慢
B. similarity_top_k设置太大
C. Embedding模型质量不佳或切片不合理
D. 文档太少
答案: C
解析: 检索质量主要取决于Embedding质量和切片策略。
知识点: 大模型检索增强RAG
如果发现检索总是漏掉相关内容,以下哪种方法最不可能改善?
A. 增大similarity_top_k
B. 更换更好的Embedding模型
C. 优化切片策略
D. 减小similarity_top_k
答案: D
解析: 减小返回数量只会让漏掉的可能性更大。
知识点: 大模型检索增强RAG
更多题目我已经更新到了 "题主"小程序中。