国科大2025秋自然语言处理基础与大模型期末

一、标注题

----一段文字-----

1、用斜线对这段文字分词

2、标出这段文字里的命名实体,说明其类型

3、----一句话----- 画出这句话的短语结构树

4、----一句话---- 画出这句话的依存关系

二、简答题

1、与前馈神经网络、循环神经网络、自注意力网络相比,卷积神经网络能做语言模型吗?如果能做,说明优势和不足,如果不能,说明理由。

2、ELMO由两层LSTM构成,与Bert、GPT等Transformer预训练结构相比,有什么优势和不足。

3、词表V的大小对于效率和性能的影响。

4、简要说明Zero1/2/3的原理,并说明它们在工作时要同步的信息分别是什么。

5、指令微调和基于人类反馈的对齐分别的目的是什么?基于人类反馈的对齐中,如何才能将人类价值观内化到参数里?

三、计算题

1、给出一个词表{----------},用该词表对下面的句子进行切分。计算压缩比。

2、--------------一个译文句子,两个参考答案句子----------------------------------------------

(1)计算译文与答案的编辑距离。

(2)按照BLEU中的一元、二元、三元、四元文法,计算译文的精确率。

四、大模型会不知道自己不知道什么,有幻觉,设计一个算法解决这个问题

相关推荐
大龄程序员狗哥2 小时前
第47篇:使用Speech-to-Text API快速构建语音应用(操作教程)
人工智能
KKKlucifer2 小时前
数据安全合规自动化:策略落地、审计追溯与风险闭环技术解析
人工智能·安全
RWKV元始智能2 小时前
RWKV超并发项目教程,RWKV-LM训练提速40%
人工智能·rnn·深度学习·自然语言处理·开源
dyj0952 小时前
Dify - (一)、本地部署Dify+聊天助手/Agent
人工智能·docker·容器
墨染天姬2 小时前
【AI】Hermes的GEPA算法
人工智能·算法
小超同学你好2 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
紫微AI2 小时前
前端文本测量成了卡死一切创新的最后瓶颈,pretext实现突破了
前端·人工智能·typescript
码途漫谈3 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
易连EDI—EasyLink3 小时前
易连EDI–EasyLink实现OCR智能数据采集
网络·人工智能·安全·汽车·ocr·edi
冬奇Lab3 小时前
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
人工智能·langchain·llm