华为HCIA-AI Solution H13-313题库(带详细解析)

最近有没有考HCIA-AI Solution H13-313的,整理了一部分题库,完整版已经上传到"题主"小程序上了,需要的可以自己去找一下。

以下哪些选项属于LLM的高效微调方法?

A、Adapter Tuning

B、P-tuning

C、Prefix-tuning

D、LoRA

答案:ABCD

解析:以上所有选项都是大语言模型(LLM)的高效微调(Parameter-Efficient Fine-Tuning, PEFT)技术。Adapter Tuning(A)在模型中插入小型适配器模块;P-tuning(B)和Prefix-tuning(C)通过优化连续的提示(前缀)向量来引导模型;LoRA(D)通过低秩分解在权重矩阵旁增加可训练的旁路矩阵。这些方法都只更新少量参数,从而大幅降低微调所需的计算和存储成本。

以下哪些部分属于Vision Transformer的组成结构?

A、Positional Encoding

B、Patch Embedding

C、Transformer Encoder

D、MLP Head

答案:BCD

解析:Vision Transformer(ViT)是将Transformer架构应用于图像分类的模型。其核心结构包括:将图像分割成块并进行线性映射的Patch Embedding(B);用于特征提取和交互的Transformer Encoder堆叠(C);以及用于最终分类的MLP Head(D,即分类头)。位置编码(Positional Encoding, A)虽然常被提及,但在标准的ViT论文中,使用的是可学习的1D位置嵌入(Learnable 1D Position Embedding),它是Patch Embedding的一部分(相加),并非一个完全独立于Patch Embedding的"Positional Encoding"模块。题目可能基于广义理解或不同实现将A纳入,但根据标准ViT架构和常见考题,位置信息处理已融入Patch Embedding后的步骤,而不单独列为与B、C、D并列的核心"组成结构"。因此更常见的标准答案不包括A。

基于传统统计的方法进行文本分类,需要进行以下哪几个步骤?

A、特征提取

B、选择分类器

C、特征选择

D、综合分析

答案:ABC

解析:传统基于统计的文本分类(如使用TF-IDF特征和SVM分类器)的典型流程包括:从文本中提取原始特征(A,如词袋、TF-IDF);为了提升效果和效率,通常需要进行特征选择(C,如选择信息增益高的特征);最后选择一个合适的分类器(B,如朴素贝叶斯、SVM)进行训练和预测。"综合分析"(D)并非流程中一个具体的标准步骤,可能指模型评估或结果解释,不属于核心流程步骤。

各大公司在推出自家的大模型系列的时候,也预见了模型越大,部署所需算力越大的瓶颈,故给出了模型的量化版本,以下哪些选项为系列模型的量化版本?

A、Pangu-pi-1B

B、LLaMA-7B

C、Phi2-2.7B

D、Qwen-1.8B

答案:ACD

解析:题目中的"量化版本"可能指模型名称中带有特定标识、或广泛被认为是某个更大模型的量化或压缩变体。Pangu-pi-1B(A)通常是盘古大模型的一个较小或压缩版本;Phi-2-2.7B (C)是微软Phi系列的一个较小规模模型;Qwen-1.8B(D)是通义千问系列的轻量版本。这些都可以视为针对部署优化的"量化"或"小型化"版本。而LLaMA-7B(B)是Meta开源的原始基础模型之一(7B参数),其本身并非一个量化版本,虽然用户可以后期对其进行量化,但其名称不直接代表量化版本。

盘古政务大模型不仅能处理文本文档数据相关的问题,模型预测练阶段也包括图片、视频、音频等多模态数据,以下场景中涉及模型多模态能力的有哪几项?

A、政务公文撰写

B、政务文案生成

C、政务数字人

D、政务热线

答案:CD

解析:政务数字人(C)通常需要结合语音、视觉(形象、表情)和文本交互,属于多模态应用场景。政务热线(D)的智能化可能涉及语音识别(音频转文本)和语音合成(文本转音频),也涉及多模态(音频与文本)。政务公文撰写(A)和政务文案生成(B)主要处理文本内容,属于纯文本(单模态)任务。

大模型目前有以下哪些应用领域?

A、工业生产

B、设备巡检

C、会议助手

D、创意营销

答案:ABCD

解析:大模型(尤其是多模态和行业大模型)的应用已广泛渗透到各个领域。在工业生产(A)中,可用于流程优化、知识问答等;在设备巡检(B)中,可结合视觉分析故障;会议助手(C)可进行会议纪要、内容总结;创意营销(D)可生成广告文案、策划方案等。因此,所有选项均为大模型当前的实际应用领域。

如图为大模型训练的网络关键技术PFC示意图,关于PFC功能描述正确的是哪几项?

A、只有队列里面的报文全部排空,PFC反压帧率才会停止发送

B、RoCE报文可以支持8个队列,并且报文封装在UDP层

C、在图中,交换机A---Priority7端口可能会接受到来自交换机B---Priority6的PFC报文

D、交换机A和交换机B都必须支持PFC技术

答案:BD

解析:PFC是一种链路层流量控制机制。RoCE(RDMA over Converged Ethernet)是运行在以太网上的RDMA协议,它依赖于PFC等无损网络技术。RoCE v2报文确实封装在UDP层之上,并支持8个优先级队列(B正确)。要使PFC生效,链路两端的设备(如交换机A和B)都必须支持该技术(D正确)。关于A:PFC反压的触发和停止基于队列的拥塞阈值(如Xon/Xoff阈值),并非必须等队列完全排空才停止发送。关于C:PFC帧的发送是基于本端口某个优先级队列发生拥塞,并向对端设备发送对应优先级的PFC暂停帧,通常不会出现从优先级6的端口向优先级7的端口发送PFC帧来控制优先级7流量的情况(除非有特殊映射),因此该描述可能不正确。

当需要对规模较大且较为复杂的网络进行管理时,通常会用到一些技术或协议,以下关于这些技术或协议描述错误的是哪些项?

A、网络运营与维护的过程中,为了便于业务监测和故障定位,网络管理员可以通过镜像技术获取设备上的业务报文进行分析

B、PFC功能实现端到端的流控时,只需要开启任意一台交换机的队列功能即可实现全域的PFC功能

C、SNMP是广泛用于TCP/IP网络的网络管理标准协议,共有三个版本:SNMPv1、SNMPv2c和SNMPv3

D、ECN是一项监控设备性能和故障的远程数据采集技术,它采用"推模式"获取监控数据,最高可达分钟级的数据采集精度

答案:BD

解析:A正确,端口镜像(SPAN)是常见的网络监测手段。B错误,PFC(基于优先级的流量控制)是一种链路层逐跳(hop-by-hop)的流量控制机制,需要在可能发生拥塞的链路上两端设备都启用和支持,而不仅仅是任意一台交换机开启队列功能。C正确,SNMP(简单网络管理协议)的三个主要版本如所述。D错误,ECN(显式拥塞通知)是TCP/IP协议栈中的一项拥塞控制机制,用于在网络发生拥塞时通知终端减速,而非用于远程监控设备性能的"数据采集技术"。远程监控通常使用SNMP、Telemetry等技术。

以下哪些模型可用于视频的生成?

A、Video Diffusion Model

B、GPT3

C、Sora

D、BERT

答案:AC

解析:视频生成是生成连续图像序列的任务。Video Diffusion Model(A)是扩散模型在视频生成领域的应用;Sora(C)是OpenAI开发的文生视频模型。两者都专用于视频生成。GPT3(B)是大语言模型,主要用于文本理解和生成。BERT(D)是基于Transformer的文本编码模型,用于自然语言理解任务。两者均不具备视频生成能力。

以下哪些选项是MindFormers大模型套件提供的用户使用方式?

A、图形界面

B、API使用

C、镜像

D、脚本使用

答案:BD

解析:MindFormers是华为MindSpore生态中的大模型开发套件,主要面向开发者提供编程接口和工具。其主要使用方式包括通过Python API(B)进行调用和集成,以及通过提供的示例脚本(D)进行任务启动和配置。它不是一个提供图形用户界面(A)的桌面应用。虽然官方可能提供容器镜像(C)以简化环境部署,但"镜像"更多是一种部署和环境载体,而非直接的"用户使用方式",脚本和API才是用户在镜像内部实际操作模型的方式。因此,核心的用户使用方式是B和D。

在RAG系统中,以下关于生成组件的功能描述,正确的是哪些项?

A、生成组件只使用用户的原始查询作为输入,不结合从检索器模块得到的任何文本片段

B、生成组件可能会生成多个候选答案,并通过去噪、筛选和重排序的后处理步骤,选择最优的回答输出

C、生成组件可以直接从检索到的文本生成答案,无需理解上下文或用户的查询

D、生成组件通过理解输入的上下文和用户的查询,生成自然语言回答,涉及文本生成和语法一致性

答案:BD

解析:在检索增强生成(RAG)系统中,生成组件(通常是大语言模型)的输入是用户的原始查询结合检索器返回的相关文本片段(上下文),因此A错误。生成组件需要理解整合后的上下文和查询意图,才能生成准确的答案,因此C错误。生成过程可能涉及生成多个候选答案并进行后处理优化(B正确),其核心任务正是基于整合的输入信息,生成流畅、连贯、符合语法的自然语言回答(D正确)。

MindFormers在线分布式推理支持以下哪些高阶API?

A、text_generator接口

B、pipeline

C、Trainer.generate

D、Trainer.predict

答案:AB

解析:MindFormers为方便用户进行大模型推理,提供了多种高阶API。text_generator接口(A)是专门用于文本生成的接口。pipeline(B)是一种更通用的、面向任务(如文本生成、分类)的简易调用方式。Trainer类是MindFormers中用于训练和评估的核心类,虽然它可能包含generate和predict方法,但"在线分布式推理"场景更典型地使用专为推理优化的轻量级接口(如A和B),而非主要通过Trainer类进行。根据MindFormers的官方文档和使用模式,text_generator和pipeline是更直接和常用的分布式推理高阶API。

大模型高效微调技术可以粗略分为以下三大类:增加额外参数(Addition---Based)、选取一部分参数更新(Selection---Based)、引入重参数化(Reparametrization---Based)。以下哪些选项属于增加额外参数这类方法?

A、Adapter Tuning

B、QLoRA

C、P-Tuning

D、Prefix Tuning

答案:ACD

解析:根据题干分类:增加额外参数类方法是在预训练模型结构中插入新的、可训练的小型参数模块,而保持原有参数冻结。Adapter Tuning(A)插入适配器模块;P-Tuning(C)和Prefix Tuning(D)引入可训练的连续提示(前缀)向量,这些都属于增加额外参数。QLoRA(B)是基于LoRA的方法,LoRA属于"引入重参数化"类(通过低秩分解引入可训练矩阵,对原始权重进行重参数化),而非简单地增加独立的新模块。

一个有效的思维链应该具有以下那些特点?

A、逻辑性

B、全面性

C、可验证性

D、可行性

答案:ABCD

解析:思维链(Chain-of-Thought, CoT)旨在通过一系列中间推理步骤引导大模型得出最终答案。一个有效的思维链应具备:逻辑性(A,步骤之间推理严谨、符合逻辑)、全面性(B,涵盖问题的主要方面和关键因素)、可验证性(C,中间步骤可以被检查或评估其正确性)以及可行性(D,推理路径在现实或给定约束下是合理且可实现的)。这些特点共同保证了思维链的有效性和可靠性。

以下关于大模型与小模型的描述中,正确的有哪几项?

A、小模型适用于数据量较小、计算资源有限的场景

B、大模型具有更强的表达能力和更高的准确度

C、小模型具有轻量级、高效率、易于部署等特点

D、大模型适用于数据量较大、计算资源充足的场景

答案:ABCD

解析:大模型和小模型各有其适用场景和特点。小模型(A)参数量少,对数据和算力要求低,易于训练和部署(C)。大模型(D)通常在海量数据和强大算力上训练,具有更强的表征能力和潜力达到更高的准确度(B),尤其在复杂任务上。这些描述都是对大、小模型特点的准确概括。

若要面向对话问答场景构建和业务相关的问答助手,在模型选型阶段,可选择如下哪些开源模型?

A、LLaMA-2

B、Midjourney

C、DALL-E 2

D、Bloom

答案:AD

解析:对话问答助手需要基于语言理解和生成能力强的模型。LLaMA-2 (A)和Bloom(D)都是开源的、能力强大的大语言模型,适用于对话和问答任务。Midjourney(B)和DALL-E 2(C)是文本到图像生成模型,不具备对话功能,因此不适用于问答助手场景。

各大公司在推出自家的大模型系列的时候,也预见了模型越大,部署所需算力越大的瓶颈,故给出了模型的量化版本,这些量化版本模型对哪些模型部署推理的场景更加友好?

A、端侧部署

B、云端部署

C、集群部署

D、边缘侧部署

答案:AD

解析:模型量化通过降低参数精度(如从FP16到INT8)来减小模型大小和计算量,从而降低资源消耗。这对于资源受限的部署环境尤为重要。端侧部署(A,如手机、嵌入式设备)和边缘侧部署(D,如边缘服务器、IoT网关)通常计算、内存和功耗预算有限,量化模型能显著提升其部署的可行性。云端(B)和集群(C)部署虽然也受益于量化带来的效率提升,但它们通常拥有更充裕的算力资源,对量化的依赖性不如资源严格受限的端侧和边缘侧场景强,因此量化模型对A和D场景"更加友好"。

相关推荐
集芯微电科技有限公司18 小时前
替代HT6310/KP3310离线式AC-DC无感线性稳压器
数据结构·人工智能·单片机·嵌入式硬件·fpga开发
悟道心18 小时前
6. 自然语言处理NLP - 迁移学习
人工智能·transformer
juxieyiyi87818 小时前
CDN与PCDN在边缘计算中的分工
人工智能·边缘计算·cdn·pcdn·平台搭建·互联网项目·pcdn平台搭建双收益
peixiuhui18 小时前
OpenPLC与RK3576边缘计算网关中结合应用的技术案例与分析
人工智能·边缘计算·rk3588·rk3568·openplc·rk3576·g8701
vyuvyucd18 小时前
Python库使用全攻略
人工智能
十三画者18 小时前
【文献分享】SpatialZ弥合从平面空间转录组学到三维细胞图谱之间的维度差距
人工智能·数据挖掘·数据分析·数据可视化
一条咸鱼_SaltyFish19 小时前
[Day13] 微服务架构下的共享基础库设计:contract-common 模块实践
开发语言·人工智能·微服务·云原生·架构·ai编程
童欧巴19 小时前
DeepSeek V4,定档春节
人工智能·aigc
爱学习的张大19 小时前
深度学习中稀疏专家模型研究综述 A REVIEW OF SPARSE EXPERT MODELS IN DEEP LEARNING
人工智能·深度学习