2024自然语言处理期末回忆

2024.6.19考

总体来说,很离谱,那么多ppt,考之前以为肯定会考算法,看了好久的算法,结果考了很多概念题。

就是说,这门课很抽象,能不选就别选了。

1.(1)什么是预训练词向量

(2)其思想和目标是什么

(3)word2vec中,基于噪声对比的方法的训练优化过程,写出负采样的过程,给出详细公式

2.(1)什么是中文分词

(2)中文分词有什么挑战

(3)新词的统计指标

(4)"我们经常有意见"的前向和后向分词结果

3.(1)什么是文本序列标注(2)文本序列标注的应用(3)给定CRF的五元组形式CRF=(S,V,A,B,P),写出CRF的假设和优缺点(4)给出观测序列X,求P(X| λ \lambda λ)(5)引入前向函数并用存储矩阵存储。 α \alpha αt(i)=P(x1...xt,yt=si| λ \lambda λ),给出初始化、递推过程和终止条件

4.(1)什么是句法分析,句法分析的作用(?)

(2)什么是依存句法

(3)什么是成分句法 (似乎就是上下文无关文法...)

(4)对比依存句法和成分句法的优势和不足

5.(1)什么是语言模型

(2)如何评价语言模型

(3)N-gram语言模型概率统计问题有哪些?

(4)大预言模型的训练任务

(5)根据图写出tansformer的multihead-attetion机制

相关推荐
qq_3148108111 分钟前
AI与IT人:协作而非替代
人工智能
骑猪兜风23319 分钟前
深度解析 ChatGPT 和 Claude 的记忆机制
人工智能·chatgpt·ai编程
蒋星熠36 分钟前
脑机接口(BCI):从信号到交互的工程实践
人工智能·python·神经网络·算法·机器学习·ai·交互
大模型铲屎官43 分钟前
【数据结构与算法-Day 37】超越二分查找:探索插值、斐波那契与分块查找的奥秘
人工智能·python·大模型·二分查找·数据结构与算法·斐波那契·分块查找
数智顾问1 小时前
Transformer模型:深度解析自然语言处理的革命性架构——从注意力机制到基础架构拆解
人工智能·rnn·深度学习
IT_陈寒1 小时前
React Hooks 实战:这5个自定义Hook让我开发效率提升了40%
前端·人工智能·后端
KKKlucifer1 小时前
Gartner 2025 中国网络安全成熟度曲线深度解读:AI 安全如何重构防御逻辑
人工智能·安全·web安全
不摸鱼1 小时前
CEO回去写代码!AI时代,不懂细节的管理层终将被淘汰 | 不摸鱼的独立开发者日报(第128期)
人工智能·开源·资讯
春末的南方城市1 小时前
港大和字节携手打造WorldWeaver:以统一建模方案整合感知条件,为长视频生成领域带来质量与一致性双重飞跃。
人工智能·深度学习·机器学习·计算机视觉·aigc·音视频
FreeBuf_2 小时前
微软警示AI驱动的钓鱼攻击:LLM生成的SVG文件绕过邮件安全检测
人工智能·安全·microsoft