国科大2025秋自然语言处理基础与大模型期末

一、标注题

----一段文字-----

1、用斜线对这段文字分词

2、标出这段文字里的命名实体,说明其类型

3、----一句话----- 画出这句话的短语结构树

4、----一句话---- 画出这句话的依存关系

二、简答题

1、与前馈神经网络、循环神经网络、自注意力网络相比,卷积神经网络能做语言模型吗?如果能做,说明优势和不足,如果不能,说明理由。

2、ELMO由两层LSTM构成,与Bert、GPT等Transformer预训练结构相比,有什么优势和不足。

3、词表V的大小对于效率和性能的影响。

4、简要说明Zero1/2/3的原理,并说明它们在工作时要同步的信息分别是什么。

5、指令微调和基于人类反馈的对齐分别的目的是什么?基于人类反馈的对齐中,如何才能将人类价值观内化到参数里?

三、计算题

1、给出一个词表{----------},用该词表对下面的句子进行切分。计算压缩比。

2、--------------一个译文句子,两个参考答案句子----------------------------------------------

(1)计算译文与答案的编辑距离。

(2)按照BLEU中的一元、二元、三元、四元文法,计算译文的精确率。

四、大模型会不知道自己不知道什么,有幻觉,设计一个算法解决这个问题

相关推荐
yumgpkpm2 小时前
在AI语言大模型时代 Cloudera CDP(华为CMP 鲲鹏版)对自有知识的保护
人工智能·hadoop·华为·zookeeper·spark·kafka
沃达德软件2 小时前
巡防勤务可视化管理
大数据·人工智能·数据挖掘·数据分析
小码hh2 小时前
【PonitNet++】2. 点云输入深度神经网络前的常见表示形式
人工智能·神经网络·dnn
sww_10262 小时前
Spring-AI MCP 源码浅析
java·人工智能·spring
HyperAI超神经2 小时前
在线教程丨微软开源3D生成模型TRELLIS.2,3秒生成高分辨率的全纹理资产
人工智能·深度学习·机器学习·3d
永霖光电_UVLED2 小时前
连续波 UV-B 激光二极管问世,实现全球首次
大数据·人工智能·uv
有Li2 小时前
LoViT:用于手术阶段识别的长视频Transformer/文献速递-基于人工智能的医学影像技术
论文阅读·人工智能·深度学习·文献·医学生
油泼辣子多加2 小时前
【信创】华为昇腾NLP算法训练
人工智能·算法·机器学习·华为·自然语言处理
杨_晨2 小时前
大模型微调训练FAQ - Batch Size与参数配置
人工智能·机器学习·ai·语言模型·batch