TensorFlow深度学习实战——利用词嵌入实现垃圾邮件检测由于大型语料库生成的各种强大嵌入的广泛适用性,使用这些嵌入将文本输入转换为机器学习模型的输入逐渐变成普遍操作。文本可以视为一系列词元 (tokens),嵌入能够将每个 token 转换为一个密集的固定维度向量。每个 token 都替换为向量,从而将文本序列转换为样本矩阵,每个样本都有固定数量的特征,对应于嵌入的维度。 样本矩阵可以直接用作标准机器学习程序的输入,在本节中,我们将介绍如何在一维卷积神经网络 (Convolutional Neural Network, CNN) 中使用该矩阵,实现垃圾邮件检测