2024自然语言处理期末回忆

2024.6.19考

总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。

就是说,这门课很抽象,能不选就别选了。

1.(1)什么是预训练词向量

(2)其思想和目标是什么

(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式

2.(1)什么是中文分词

(2)中文分词有什么挑战

(3)新词的统计指标

(4)"我们经常有意见"的前向和后向分词结果

3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X| λ \lambda λ)(5)引入前向函数并用存储矩阵存储。 α \alpha αt(i)=P(x1...xt,yt=si| λ \lambda λ),给出初始化、递推过程和终止条件

4.(1)什么是句法分析,句法分析的作用(?)

(2)什么是依存句法

(3)什么是成分句法 (似乎就是上下文无关文法...)

(4)对比依存句法和成分句法的优势和不足

5.(1)什么是语言模型

(2)如何评价语言模型

(3)N-gram语言模型概率统计问题有哪些?

(4)大预言模型的训练任务

(5)根据图写出tansformer的multihead-attetion机制

相关推荐
数新网络2 小时前
The Life of a Read/Write Query for Apache Iceberg Tables
人工智能·apache·知识图谱
Yangy_Jiaojiao2 小时前
开源视觉-语言-动作(VLA)机器人项目全景图(截至 2025 年)
人工智能·机器人
gorgeous(๑>؂<๑)3 小时前
【ICLR26匿名投稿】OneTrackerV2:统一多模态目标跟踪的“通才”模型
人工智能·机器学习·计算机视觉·目标跟踪
坠星不坠3 小时前
pycharm如何导入ai大语言模型的api-key
人工智能·语言模型·自然语言处理
周杰伦_Jay3 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘
王哈哈^_^3 小时前
【完整源码+数据集】课堂行为数据集,yolo课堂行为检测数据集 2090 张,学生课堂行为识别数据集,目标检测课堂行为识别系统实战教程
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
Elastic 中国社区官方博客3 小时前
Observability:适用于 PHP 的 OpenTelemetry:EDOT PHP 加入 OpenTelemetry 项目
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索·php
ytttr8734 小时前
Landweber迭代算法用于一维、二维图像重建
人工智能·算法·机器学习
feifeigo1234 小时前
Matlab编写压缩感知重建算法集
人工智能·算法·matlab
紫小米4 小时前
提示词(Prompt)工程与推理优化
人工智能·ai·prompt·ai agent