工智能基础知识总结--什么是TextCNN

  1. 什么是TextCNN

    Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN,该模型将卷积神经网络CNN应用到文本分类任务,是卷积神经网络应用到文本分析的开创性工作之⼀。

  2. TextCNN的结构

    TextCNN的结构图如下:

    具体包含如下结构:

    • Embedding层

      将词的One-hot表示映射为稠密向量表示。

    • 一维卷积层

      宽度设为词嵌入维度,高度为卷积核大小(超参数),在word-level上进行一维卷积。虽然文本经过词嵌入后是二维数据,但是在embedding-level上的二维卷积没有意义。同一卷积核大小一般设置多个卷积核来提取不同的特征。

    • 时序最大池化层

      对一个卷积核得到的feature map取最大值,由于一个卷积核是在word-level即按照时序进行卷积的,所以称为时序最大池化(max-over-time pooling)。

    • 全连接层

      将各个卷积、池化后的结果拼接后经过最后一层或多层全连接层将特征转化为label的概率分布。

  3. TextCNN学到了什么

    TextCNN不同大小的卷积核学习到的是卷积核大小n对应的某个n-gram特征,时序最大池化层提取句子中该特征的最大取值,最后的全连接层组合这些n-gram特征进行分类。因此,TextCNN能够学习到很多用于分类的局部的特征,适用于短文本的分类,而对于有较长依赖关系的长文本分类效果较差。

相关推荐
cxr82810 分钟前
大语言模型深度思考与交互增强
人工智能·语言模型·自然语言处理
空中湖16 分钟前
AI大模型原理可视化工具:深入浅出理解大语言模型的工作原理
人工智能·语言模型·自然语言处理
夙愿学长19 分钟前
Manus和Genspark深度测评:第1次体会到被AI替代的恐惧!
人工智能
汀丶人工智能21 分钟前
Dify Agent 驱动轻量级 MCPserver:联动 Zapier 实现智能搜索高效数据流转
人工智能
新智元28 分钟前
永别了,GPT-4!
人工智能·openai
扉间79834 分钟前
深入探索 PyTorch:回归与分类模型的全方位解析
人工智能·pytorch
面包圈蘸可乐42 分钟前
论文学习:《EVlncRNA-net:一种双通道深度学习方法,用于对实验验证的lncRNA进行准确预测》
深度学习·学习·生物信息
仙人掌_lz1 小时前
如何在本地使用Ollama运行 Hugging Face 模型
java·人工智能·servlet·ai·大模型·llm·ollama
张飞飞飞飞飞1 小时前
语音识别——根据声波能量、VAD 和 频谱分析周围是否有人说话
人工智能·语音识别
大神薯条老师1 小时前
Python高级爬虫之JS逆向+安卓逆向1.4节:数据运算
爬虫·python·机器学习·数据分析·网络爬虫