国科大2025秋自然语言处理基础与大模型期末

一、标注题

----一段文字-----

1、用斜线对这段文字分词

2、标出这段文字里的命名实体,说明其类型

3、----一句话----- 画出这句话的短语结构树

4、----一句话---- 画出这句话的依存关系

二、简答题

1、与前馈神经网络、循环神经网络、自注意力网络相比,卷积神经网络能做语言模型吗?如果能做,说明优势和不足,如果不能,说明理由。

2、ELMO由两层LSTM构成,与Bert、GPT等Transformer预训练结构相比,有什么优势和不足。

3、词表V的大小对于效率和性能的影响。

4、简要说明Zero1/2/3的原理,并说明它们在工作时要同步的信息分别是什么。

5、指令微调和基于人类反馈的对齐分别的目的是什么?基于人类反馈的对齐中,如何才能将人类价值观内化到参数里?

三、计算题

1、给出一个词表{----------},用该词表对下面的句子进行切分。计算压缩比。

2、--------------一个译文句子,两个参考答案句子----------------------------------------------

(1)计算译文与答案的编辑距离。

(2)按照BLEU中的一元、二元、三元、四元文法,计算译文的精确率。

四、大模型会不知道自己不知道什么,有幻觉,设计一个算法解决这个问题

相关推荐
晚霞的不甘2 分钟前
守护智能边界:CANN 的 AI 安全机制深度解析
人工智能·安全·语言模型·自然语言处理·前端框架
谢璞3 分钟前
中国AI最疯狂的一周:50亿金元肉搏,争夺未来的突围之战
人工智能
池央4 分钟前
CANN 算子生态的深度演进:稀疏计算支持与 PyPTO 范式的抽象层级
运维·人工智能·信号处理
方见华Richard5 分钟前
世毫九实验室(Shardy Lab)研究成果清单(2025版)
人工智能·经验分享·交互·原型模式·空间计算
Maynor9965 分钟前
OpenClaw 玩家必备:用 AI 自动追踪社区最新动态
java·服务器·人工智能
aini_lovee5 分钟前
MATLAB基于小波技术的图像融合实现
开发语言·人工智能·matlab
ujainu15 分钟前
CANN仓库中的AIGC多模态统一抽象工程:昇腾AI软件栈如何用一套接口驾驭图文音视
人工智能·aigc
AC赳赳老秦20 分钟前
代码生成超越 GPT-4:DeepSeek-V4 编程任务实战与 2026 开发者效率提升指南
数据库·数据仓库·人工智能·科技·rabbitmq·memcache·deepseek
液态不合群22 分钟前
推荐算法中的位置消偏,如何解决?
人工智能·机器学习·推荐算法
饭饭大王66626 分钟前
当 AI 系统开始“自省”——在 `ops-transformer` 中嵌入元认知能力
人工智能·深度学习·transformer