这本书已经无敌!一本书学懂NLP自然语言(附PDF文档)

自然语言处理被誉为"人工智能皇冠上的明珠"。深度学习等技术的引入为自然语言处理技术带来了一场革命,尤其是近年来出现的基于预训练模型的方法,已成为研究自然语言处理的新范式。而今天给大家推荐的这本《自然语言处理:基于预训练模型的方法》正是学NLP自然语言非常牛逼的一本书!

本书在介绍自然语言处理、深度学习等基本概念的基础上,重点介绍新的基于预训练模型的自然语言处理技术。

包括基础知识、预训练词向量和预训练模型三大部分:

  • 基础知识部分介绍自然语言处理和深度学习的基础知识和基本工具;
  • 预训练词向量部分介绍静态词向量和动态词向量的预训练方法及应用;
  • 预训练模型部分介绍几种典型的预训练语言模型及应用,以及预训练模型的最新进展。

除了理论知识,本书还有针对性地结合具体案例提供相应的PyTorch 代码实现,不仅能让读者对理论有更深刻的理解,还能快速地实现自然语言处理模型,达到理论和实践的统一。

适宜人群

本书既适合具有一定机器学习基础的高等院校学生、研究机构的研究者,以及希望深入研究自然语言处理算法的计算机工程师阅读,也适合对人工智能、深度学习和自然语言处理感兴趣的学生和希望进入人工智能应用领域的研究者参考。

本书作者

  • 车万翔:

博士,哈尔滨工业大学计算学部长聘教授、博士生导师,社会计算与信息检索研究中心副主任。

  • 郭江

麻省理工学院计算机科学与人工智能实验室,博士后研究员。

  • 崔一鸣

科大讯飞北京研究院副院长、资深级主管研究员。

                                      郭江

书籍目录

推荐序III

推荐语IV

前言V

数学符号IX

第1 章绪论1

  • 1.1 自然语言处理的概念 2
  • 1.2 自然语言处理的难点2
  • 1.3 自然语言处理任务体系.4
  • 1.4 自然语言处理技术发展历史7

第2 章自然语言处理基础11

  • 2.1 文本的表示.12
  • 2.2 自然语言处理任务20
  • 2.3 基本问题35
  • 2.4 评价指标40
  • 2.5 小结43

第3 章基础工具集与常用数据集45

  • 3.1 NLTK 工具集46
  • 3.2 LTP 工具集51
  • 3.3 PyTorch 基础52
  • 3.4 大规模预训练数据61
  • 3.5 更多数据集.66
  • 3.6 小结68

第4 章自然语言处理中的神经网络基础69

  • 4.1 多层感知器模型70
  • 4.2 卷积神经网络78
  • 4.3 循环神经网络83
  • 4.4 注意力模型.89
  • 4.5 神经网络模型的训练96
  • 4.6 情感分类实战101
  • 4.7 词性标注实战113
  • 4.8 小结116

第5 章静态词向量预训练模型119

  • 5.1 神经网络语言模型120
  • 5.2 Word2vec 词向量130
  • 5.3 GloVe 词向量140
  • 5.4 评价与应用.143
  • 5.5 小结148

第6 章动态词向量预训练模型151

  • 6.1 词向量------从静态到动态152
  • 6.2 基于语言模型的动态词向量预训练153
  • 6.3 小结171 ##第7 章预训练语言模型173
  • 7.1 概述174
  • 7.2 GPT 177
  • 7.3 BERT 182
  • 7.4 预训练语言模型的应用194
  • 7.5 深入理解BERT .211
  • 7.6 小结.215

第8 章预训练语言模型进阶217

  • 8.1 模型优化.218
  • 8.2 长文本处理.234
  • 8.3 模型蒸馏与压缩244
  • 8.4 生成模型257
  • 8.5 小结.267

第9 章多模态融合的预训练模型269

  • 9.1 多语言融合.270
  • 9.2 多媒体融合.274
  • 9.3 异构知识融合276
  • 9.4 更多模态的预训练模型285
  • 9.5 小结.285

参考文献287

术语表297





相关推荐
秦明月1310 分钟前
【原创教程】自动化工程案例01:8工位插针装配机02
人工智能·机器人·自动化
我可以将你更新哟12 分钟前
【OpenCV-图像形态学操作】礼帽与黑帽、梯度运算、开运算与闭运算、形态学-膨胀操作、形态学-腐蚀操作
人工智能·opencv·计算机视觉
路人甲ing..23 分钟前
openVX加速-常见问题:适用场景、AI加速、安装方式等
c++·图像处理·人工智能·图论·openvx
FL162386312924 分钟前
[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别
人工智能·yolo·目标检测
jndingxin24 分钟前
OpenCV结构分析与形状描述符(21)计算包围给定点集的最小面积三角形函数minEnclosingTriangle()的使用
人工智能·opencv·计算机视觉
Q83431581938 分钟前
海思SD3403(21AP10, 108DC2910 )4K60 的 ISP 图像处理能力,4Tops INT8算力
linux·图像处理·人工智能·嵌入式硬件·视觉检测·视频编解码
机器不会学习CL44 分钟前
分类预测|基于麻雀优化支持向量机的Adaboost集成的数据分类预测Matlab程序SSA-SVM-Adaboost
人工智能·算法·机器学习·支持向量机·matlab·分类
这家伙是个好家伙1 小时前
GitHub Copilot Issue in Visual Studio Code “Status Ready (disabled)“
vscode·github·copilot·issue
科技资讯快报1 小时前
容联云容犀Copilot&Agent入选《中国 AI Agent 产品罗盘》
大数据·人工智能·copilot
爱研究的小牛1 小时前
ESRGAN——老旧照片、视频帧的修复和增强,提高图像的分辨率
人工智能·深度学习·自动化·aigc·音视频