2024自然语言处理期末回忆

2024.6.19考

总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。

就是说,这门课很抽象,能不选就别选了。

1.(1)什么是预训练词向量

(2)其思想和目标是什么

(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式

2.(1)什么是中文分词

(2)中文分词有什么挑战

(3)新词的统计指标

(4)"我们经常有意见"的前向和后向分词结果

3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X| λ \lambda λ)(5)引入前向函数并用存储矩阵存储。 α \alpha αt(i)=P(x1...xt,yt=si| λ \lambda λ),给出初始化、递推过程和终止条件

4.(1)什么是句法分析,句法分析的作用(?)

(2)什么是依存句法

(3)什么是成分句法 (似乎就是上下文无关文法...)

(4)对比依存句法和成分句法的优势和不足

5.(1)什么是语言模型

(2)如何评价语言模型

(3)N-gram语言模型概率统计问题有哪些?

(4)大预言模型的训练任务

(5)根据图写出tansformer的multihead-attetion机制

相关推荐
民乐团扒谱机8 分钟前
【AI笔记】精密光时频传递技术核心内容总结
人工智能·算法·光学频率梳
不惑_20 分钟前
通俗理解GAN的训练过程
人工智能·神经网络·生成对抗网络
OpenCSG1 小时前
对比分析:CSGHub vs. Hugging Face:模型管理平台选型对
人工智能·架构·开源
云上凯歌1 小时前
传统老旧系统的“AI 涅槃”:从零构建企业级 Agent 集群实战指南
人工智能
cskywit1 小时前
破解红外“魅影”难题:WMRNet 如何以频率分析与二阶差分重塑小目标检测?
人工智能·深度学习
无名修道院1 小时前
AI大模型应用开发-RAG 基础:向量数据库(FAISS/Milvus)、文本拆分、相似性搜索(“让模型查资料再回答”)
人工智能·向量数据库·rag·ai大模型应用开发
自可乐1 小时前
Milvus向量数据库/RAG基础设施学习教程
数据库·人工智能·python·milvus
Loo国昌2 小时前
【大模型应用开发】第二阶段:语义理解应用:文本分类与聚类 (Text Classification & Clustering)
人工智能·分类·聚类
XX風2 小时前
3.2K-means
人工智能·算法·kmeans
可触的未来,发芽的智生2 小时前
发现:认知的普适节律 发现思维的8次迭代量子
javascript·python·神经网络·程序人生·自然语言处理