文本预处理——文本数据分析

目录

文本数据分析

中文酒店评价语料


获得训练集和验证集的标签数量分布




获取训练集和验证集的句子长度分布





获取训练集和验证集的正负样本长度散点分布



获得训练集和验证集不同词汇总数统计


获得训练集上正负的样本的高频形容词词云




获得验证集上正负的样本的形容词词云



相关推荐
一晌小贪欢4 小时前
【Python数据分析】数据分析与可视化
开发语言·python·数据分析·数据可视化·数据清洗
Danceful_YJ7 小时前
35.微调BERT
人工智能·深度学习·bert
愿没error的x7 小时前
深度学习基础知识总结(一):深入理解卷积(Convolution)
人工智能·深度学习
DisonTangor8 小时前
FIBO是首个基于长结构化描述训练、专为JSON设计的开源文本生成图像模型。
语言模型·自然语言处理·ai作画·开源
咋吃都不胖lyh8 小时前
激活函数是什么,神经网络中为什么要有激活函数
人工智能·深度学习·神经网络·激活函数
Ma0407138 小时前
【论文阅读15】-DiagLLM:基于大型语言模型的多模态推理,用于可解释的轴承故障诊断
人工智能·语言模型·自然语言处理
啥都鼓捣的小yao8 小时前
一、什么是语言模型?
人工智能·语言模型·自然语言处理
带电的小王9 小时前
【AI大模型技术】4.预训练语言模型(PLMs,Pre-trained Langue Models);5.Transformers Tutorial
人工智能·语言模型·自然语言处理
_codemonster10 小时前
深度学习实战(基于pytroch)系列(五)线性回归的pytorch实现
pytorch·深度学习·线性回归
算法与编程之美10 小时前
探究pytorch中多个卷积层和全连接层的输出方法
人工智能·pytorch·深度学习·神经网络·cnn