2024自然语言处理期末回忆

2024.6.19考

总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。

就是说,这门课很抽象,能不选就别选了。

1.(1)什么是预训练词向量

(2)其思想和目标是什么

(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式

2.(1)什么是中文分词

(2)中文分词有什么挑战

(3)新词的统计指标

(4)"我们经常有意见"的前向和后向分词结果

3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X| λ \lambda λ)(5)引入前向函数并用存储矩阵存储。 α \alpha αt(i)=P(x1...xt,yt=si| λ \lambda λ),给出初始化、递推过程和终止条件

4.(1)什么是句法分析,句法分析的作用(?)

(2)什么是依存句法

(3)什么是成分句法 (似乎就是上下文无关文法...)

(4)对比依存句法和成分句法的优势和不足

5.(1)什么是语言模型

(2)如何评价语言模型

(3)N-gram语言模型概率统计问题有哪些?

(4)大预言模型的训练任务

(5)根据图写出tansformer的multihead-attetion机制

相关推荐
薛定猫AI5 分钟前
【深度解析】从 Claude Jupiter 到 ARC-AGI 3:大模型发布信号、评测体系与多模型工程接入实践
人工智能·agi
刘一说9 分钟前
AI 热点资讯日报-2026-05-01
人工智能
threelab11 分钟前
Three.js 代码云效果 | 三维可视化 / AI 提示词
开发语言·javascript·人工智能
Java小生不才11 分钟前
Spring AI文生音
java·人工智能·spring
jinanwuhuaguo13 分钟前
(第二十八篇)OpenClaw成本与感知的奇点——从“Token封建制”到“全民养虾”的本体论地基
android·人工智能·kotlin·拓扑学·openclaw
byte轻骑兵17 分钟前
【HID】规范精讲[8]: 蓝牙HID核心之L2CAP层——无线人机交互的通信桥梁设计解析
人工智能·人机交互·蓝牙·键盘·hid
Peter·Pan爱编程18 分钟前
第一篇:什么是 Vibe Coding?核心素养与范式转移
人工智能·ai编程
V搜xhliang024619 分钟前
OpenClaw科研全场景用法:从文献到实验室的完整自动化方案
运维·开发语言·人工智能·python·算法·microsoft·自动化
05候补工程师21 分钟前
【ROS 2 具身智能】Gazebo 仿真避坑指南:从“幽灵机器人”到传感器数据流打通
人工智能·经验分享·笔记·ubuntu·机器人
kaikaile199525 分钟前
风、浪、流环境模型的船舶三自由度(纵荡、横荡、艏摇)运动仿真MATLAB
开发语言·人工智能·matlab