2024自然语言处理期末回忆

2024.6.19考

总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。

就是说,这门课很抽象,能不选就别选了。

1.(1)什么是预训练词向量

(2)其思想和目标是什么

(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式

2.(1)什么是中文分词

(2)中文分词有什么挑战

(3)新词的统计指标

(4)"我们经常有意见"的前向和后向分词结果

3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X| λ \lambda λ)(5)引入前向函数并用存储矩阵存储。 α \alpha αt(i)=P(x1...xt,yt=si| λ \lambda λ),给出初始化、递推过程和终止条件

4.(1)什么是句法分析,句法分析的作用(?)

(2)什么是依存句法

(3)什么是成分句法 (似乎就是上下文无关文法...)

(4)对比依存句法和成分句法的优势和不足

5.(1)什么是语言模型

(2)如何评价语言模型

(3)N-gram语言模型概率统计问题有哪些?

(4)大预言模型的训练任务

(5)根据图写出tansformer的multihead-attetion机制

相关推荐
SuperHeroWu74 分钟前
【HarmonyOS 7】鸿蒙应用 AI Coding 工具链 DevEco Code 到 DevEco CLI
人工智能·华为·ai编程·harmonyos·cli·code
虾壳云官方7 分钟前
openclaw 一键安装教程(2026年6月15最新)
运维·人工智能·windows·自动化·openclaw
不爱土豆唯爱马铃薯8 分钟前
AiPy 是什么?
人工智能
deephub8 分钟前
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类
人工智能·机器学习·kmeans·聚类·rag
渡众机器人10 分钟前
第八届全球校园人工智能算法精英大赛-算法应用赛-空地协同侦排挑战赛规则
人工智能·算法
前端不太难11 分钟前
从 ChatBot 到 Agent:AI 应用的范式升级
人工智能
渡众机器人11 分钟前
智能体对抗挑战赛和空地协同侦排挑战赛的报名流程
人工智能·自动驾驶·无人机·智能体·报名流程
yongyoudayee14 分钟前
跳出“AI套壳“陷阱,销售易定义中国AI CRM新标杆
人工智能·paas
小马哥crazymxm19 分钟前
Arxiv论文周选 (2026-W24)
论文阅读·人工智能·考研
Rain50920 分钟前
2.2 数据基础:数据库集成与 ORM(TypeORM / Prisma)
数据库·人工智能·ai·数据分析·node.js·自动化·ai编程