华为HCIA-AI Solution H13-313题库（带详细解析）

最近有没有考HCIA-AI Solution H13-313的，整理了一部分题库，完整版已经上传到"题主"小程序上了，需要的可以自己去找一下。

以下哪些选项属于LLM的高效微调方法？

A、Adapter Tuning

B、P-tuning

C、Prefix-tuning

D、LoRA

答案：ABCD

解析：以上所有选项都是大语言模型（LLM）的高效微调（Parameter-Efficient Fine-Tuning， PEFT）技术。Adapter Tuning（A）在模型中插入小型适配器模块；P-tuning（B）和Prefix-tuning（C）通过优化连续的提示（前缀）向量来引导模型；LoRA（D）通过低秩分解在权重矩阵旁增加可训练的旁路矩阵。这些方法都只更新少量参数，从而大幅降低微调所需的计算和存储成本。

以下哪些部分属于Vision Transformer的组成结构？

A、Positional Encoding

B、Patch Embedding

C、Transformer Encoder

D、MLP Head

答案：BCD

解析：Vision Transformer（ViT）是将Transformer架构应用于图像分类的模型。其核心结构包括：将图像分割成块并进行线性映射的Patch Embedding（B）；用于特征提取和交互的Transformer Encoder堆叠（C）；以及用于最终分类的MLP Head（D，即分类头）。位置编码（Positional Encoding， A）虽然常被提及，但在标准的ViT论文中，使用的是可学习的1D位置嵌入（Learnable 1D Position Embedding），它是Patch Embedding的一部分（相加），并非一个完全独立于Patch Embedding的"Positional Encoding"模块。题目可能基于广义理解或不同实现将A纳入，但根据标准ViT架构和常见考题，位置信息处理已融入Patch Embedding后的步骤，而不单独列为与B、C、D并列的核心"组成结构"。因此更常见的标准答案不包括A。

基于传统统计的方法进行文本分类，需要进行以下哪几个步骤？

A、特征提取

B、选择分类器

C、特征选择

D、综合分析

答案：ABC

解析：传统基于统计的文本分类（如使用TF-IDF特征和SVM分类器）的典型流程包括：从文本中提取原始特征（A，如词袋、TF-IDF）；为了提升效果和效率，通常需要进行特征选择（C，如选择信息增益高的特征）；最后选择一个合适的分类器（B，如朴素贝叶斯、SVM）进行训练和预测。"综合分析"（D）并非流程中一个具体的标准步骤，可能指模型评估或结果解释，不属于核心流程步骤。

各大公司在推出自家的大模型系列的时候，也预见了模型越大，部署所需算力越大的瓶颈，故给出了模型的量化版本，以下哪些选项为系列模型的量化版本？

A、Pangu-pi-1B

B、LLaMA-7B

C、Phi2-2.7B

D、Qwen-1.8B

答案：ACD

解析：题目中的"量化版本"可能指模型名称中带有特定标识、或广泛被认为是某个更大模型的量化或压缩变体。Pangu-pi-1B（A）通常是盘古大模型的一个较小或压缩版本；Phi-2-2.7B （C）是微软Phi系列的一个较小规模模型；Qwen-1.8B（D）是通义千问系列的轻量版本。这些都可以视为针对部署优化的"量化"或"小型化"版本。而LLaMA-7B（B）是Meta开源的原始基础模型之一（7B参数），其本身并非一个量化版本，虽然用户可以后期对其进行量化，但其名称不直接代表量化版本。

盘古政务大模型不仅能处理文本文档数据相关的问题，模型预测练阶段也包括图片、视频、音频等多模态数据，以下场景中涉及模型多模态能力的有哪几项？

A、政务公文撰写

B、政务文案生成

C、政务数字人

D、政务热线

答案：CD

解析：政务数字人（C）通常需要结合语音、视觉（形象、表情）和文本交互，属于多模态应用场景。政务热线（D）的智能化可能涉及语音识别（音频转文本）和语音合成（文本转音频），也涉及多模态（音频与文本）。政务公文撰写（A）和政务文案生成（B）主要处理文本内容，属于纯文本（单模态）任务。

大模型目前有以下哪些应用领域？

A、工业生产

B、设备巡检

C、会议助手

D、创意营销

答案：ABCD

解析：大模型（尤其是多模态和行业大模型）的应用已广泛渗透到各个领域。在工业生产（A）中，可用于流程优化、知识问答等；在设备巡检（B）中，可结合视觉分析故障；会议助手（C）可进行会议纪要、内容总结；创意营销（D）可生成广告文案、策划方案等。因此，所有选项均为大模型当前的实际应用领域。

如图为大模型训练的网络关键技术PFC示意图，关于PFC功能描述正确的是哪几项？

A、只有队列里面的报文全部排空，PFC反压帧率才会停止发送

B、RoCE报文可以支持8个队列，并且报文封装在UDP层

C、在图中，交换机A---Priority7端口可能会接受到来自交换机B---Priority6的PFC报文

D、交换机A和交换机B都必须支持PFC技术

答案：BD

解析：PFC是一种链路层流量控制机制。RoCE（RDMA over Converged Ethernet）是运行在以太网上的RDMA协议，它依赖于PFC等无损网络技术。RoCE v2报文确实封装在UDP层之上，并支持8个优先级队列（B正确）。要使PFC生效，链路两端的设备（如交换机A和B）都必须支持该技术（D正确）。关于A：PFC反压的触发和停止基于队列的拥塞阈值（如Xon/Xoff阈值），并非必须等队列完全排空才停止发送。关于C：PFC帧的发送是基于本端口某个优先级队列发生拥塞，并向对端设备发送对应优先级的PFC暂停帧，通常不会出现从优先级6的端口向优先级7的端口发送PFC帧来控制优先级7流量的情况（除非有特殊映射），因此该描述可能不正确。

当需要对规模较大且较为复杂的网络进行管理时，通常会用到一些技术或协议，以下关于这些技术或协议描述错误的是哪些项？

A、网络运营与维护的过程中，为了便于业务监测和故障定位，网络管理员可以通过镜像技术获取设备上的业务报文进行分析

B、PFC功能实现端到端的流控时，只需要开启任意一台交换机的队列功能即可实现全域的PFC功能

C、SNMP是广泛用于TCP/IP网络的网络管理标准协议，共有三个版本：SNMPv1、SNMPv2c和SNMPv3

D、ECN是一项监控设备性能和故障的远程数据采集技术，它采用"推模式"获取监控数据，最高可达分钟级的数据采集精度

答案：BD

解析：A正确，端口镜像（SPAN）是常见的网络监测手段。B错误，PFC（基于优先级的流量控制）是一种链路层逐跳（hop-by-hop）的流量控制机制，需要在可能发生拥塞的链路上两端设备都启用和支持，而不仅仅是任意一台交换机开启队列功能。C正确，SNMP（简单网络管理协议）的三个主要版本如所述。D错误，ECN（显式拥塞通知）是TCP/IP协议栈中的一项拥塞控制机制，用于在网络发生拥塞时通知终端减速，而非用于远程监控设备性能的"数据采集技术"。远程监控通常使用SNMP、Telemetry等技术。

以下哪些模型可用于视频的生成？

A、Video Diffusion Model

B、GPT3

C、Sora

D、BERT

答案：AC

解析：视频生成是生成连续图像序列的任务。Video Diffusion Model（A）是扩散模型在视频生成领域的应用；Sora（C）是OpenAI开发的文生视频模型。两者都专用于视频生成。GPT3（B）是大语言模型，主要用于文本理解和生成。BERT（D）是基于Transformer的文本编码模型，用于自然语言理解任务。两者均不具备视频生成能力。

以下哪些选项是MindFormers大模型套件提供的用户使用方式？

A、图形界面

B、API使用

C、镜像

D、脚本使用

答案：BD

解析：MindFormers是华为MindSpore生态中的大模型开发套件，主要面向开发者提供编程接口和工具。其主要使用方式包括通过Python API（B）进行调用和集成，以及通过提供的示例脚本（D）进行任务启动和配置。它不是一个提供图形用户界面（A）的桌面应用。虽然官方可能提供容器镜像（C）以简化环境部署，但"镜像"更多是一种部署和环境载体，而非直接的"用户使用方式"，脚本和API才是用户在镜像内部实际操作模型的方式。因此，核心的用户使用方式是B和D。

在RAG系统中，以下关于生成组件的功能描述，正确的是哪些项？

A、生成组件只使用用户的原始查询作为输入，不结合从检索器模块得到的任何文本片段

B、生成组件可能会生成多个候选答案，并通过去噪、筛选和重排序的后处理步骤，选择最优的回答输出

C、生成组件可以直接从检索到的文本生成答案，无需理解上下文或用户的查询

D、生成组件通过理解输入的上下文和用户的查询，生成自然语言回答，涉及文本生成和语法一致性

答案：BD

解析：在检索增强生成（RAG）系统中，生成组件（通常是大语言模型）的输入是用户的原始查询结合检索器返回的相关文本片段（上下文），因此A错误。生成组件需要理解整合后的上下文和查询意图，才能生成准确的答案，因此C错误。生成过程可能涉及生成多个候选答案并进行后处理优化（B正确），其核心任务正是基于整合的输入信息，生成流畅、连贯、符合语法的自然语言回答（D正确）。

MindFormers在线分布式推理支持以下哪些高阶API？

A、text_generator接口

B、pipeline

C、Trainer.generate

D、Trainer.predict

答案：AB

解析：MindFormers为方便用户进行大模型推理，提供了多种高阶API。text_generator接口（A）是专门用于文本生成的接口。pipeline（B）是一种更通用的、面向任务（如文本生成、分类）的简易调用方式。Trainer类是MindFormers中用于训练和评估的核心类，虽然它可能包含generate和predict方法，但"在线分布式推理"场景更典型地使用专为推理优化的轻量级接口（如A和B），而非主要通过Trainer类进行。根据MindFormers的官方文档和使用模式，text_generator和pipeline是更直接和常用的分布式推理高阶API。

大模型高效微调技术可以粗略分为以下三大类：增加额外参数（Addition---Based）、选取一部分参数更新（Selection---Based）、引入重参数化（Reparametrization---Based）。以下哪些选项属于增加额外参数这类方法？

A、Adapter Tuning

B、QLoRA

C、P-Tuning

D、Prefix Tuning

答案：ACD

解析：根据题干分类：增加额外参数类方法是在预训练模型结构中插入新的、可训练的小型参数模块，而保持原有参数冻结。Adapter Tuning（A）插入适配器模块；P-Tuning（C）和Prefix Tuning（D）引入可训练的连续提示（前缀）向量，这些都属于增加额外参数。QLoRA（B）是基于LoRA的方法，LoRA属于"引入重参数化"类（通过低秩分解引入可训练矩阵，对原始权重进行重参数化），而非简单地增加独立的新模块。

一个有效的思维链应该具有以下那些特点？

A、逻辑性

B、全面性

C、可验证性

D、可行性

答案：ABCD

解析：思维链（Chain-of-Thought， CoT）旨在通过一系列中间推理步骤引导大模型得出最终答案。一个有效的思维链应具备：逻辑性（A，步骤之间推理严谨、符合逻辑）、全面性（B，涵盖问题的主要方面和关键因素）、可验证性（C，中间步骤可以被检查或评估其正确性）以及可行性（D，推理路径在现实或给定约束下是合理且可实现的）。这些特点共同保证了思维链的有效性和可靠性。

以下关于大模型与小模型的描述中，正确的有哪几项？

A、小模型适用于数据量较小、计算资源有限的场景

B、大模型具有更强的表达能力和更高的准确度

C、小模型具有轻量级、高效率、易于部署等特点

D、大模型适用于数据量较大、计算资源充足的场景

答案：ABCD

解析：大模型和小模型各有其适用场景和特点。小模型（A）参数量少，对数据和算力要求低，易于训练和部署（C）。大模型（D）通常在海量数据和强大算力上训练，具有更强的表征能力和潜力达到更高的准确度（B），尤其在复杂任务上。这些描述都是对大、小模型特点的准确概括。

若要面向对话问答场景构建和业务相关的问答助手，在模型选型阶段，可选择如下哪些开源模型？

A、LLaMA-2

B、Midjourney

C、DALL-E 2

D、Bloom

答案：AD

解析：对话问答助手需要基于语言理解和生成能力强的模型。LLaMA-2 （A）和Bloom（D）都是开源的、能力强大的大语言模型，适用于对话和问答任务。Midjourney（B）和DALL-E 2（C）是文本到图像生成模型，不具备对话功能，因此不适用于问答助手场景。

各大公司在推出自家的大模型系列的时候，也预见了模型越大，部署所需算力越大的瓶颈，故给出了模型的量化版本，这些量化版本模型对哪些模型部署推理的场景更加友好？

A、端侧部署

B、云端部署

C、集群部署

D、边缘侧部署

答案：AD

解析：模型量化通过降低参数精度（如从FP16到INT8）来减小模型大小和计算量，从而降低资源消耗。这对于资源受限的部署环境尤为重要。端侧部署（A，如手机、嵌入式设备）和边缘侧部署（D，如边缘服务器、IoT网关）通常计算、内存和功耗预算有限，量化模型能显著提升其部署的可行性。云端（B）和集群（C）部署虽然也受益于量化带来的效率提升，但它们通常拥有更充裕的算力资源，对量化的依赖性不如资源严格受限的端侧和边缘侧场景强，因此量化模型对A和D场景"更加友好"。