文本预处理——文本数据分析

目录

文本数据分析

中文酒店评价语料


获得训练集和验证集的标签数量分布




获取训练集和验证集的句子长度分布





获取训练集和验证集的正负样本长度散点分布



获得训练集和验证集不同词汇总数统计


获得训练集上正负的样本的高频形容词词云




获得验证集上正负的样本的形容词词云



相关推荐
yuanyuan2o27 小时前
模型预训练:Hugging Face Transformers 基础
算法·ai·语言模型·自然语言处理·nlp·深度优先
瑶总迷弟10 小时前
使用 mis-tei 在昇腾310P上部署 bge-m3模型
pytorch·python·华为·语言模型·自然语言处理·cnn·unix
冰西瓜60012 小时前
深度学习的数学原理(四十一)—— KV Cache
人工智能·深度学习
Chunyyyen12 小时前
【第四十七周】自然语言处理课程作业记录
人工智能·自然语言处理
tzc_fly14 小时前
ELF:连续扩散语言模型
人工智能·语言模型·自然语言处理
码界筑梦坊14 小时前
282-基于Python的豆瓣音乐可视化分析推荐系统
开发语言·python·信息可视化·数据分析·flask·vue
啦啦啦_999914 小时前
4. 注意力机制介绍
自然语言处理
冰西瓜60014 小时前
深度学习的数学原理(四十)—— Transformer 推理全过程
人工智能·深度学习·transformer
汽车仪器仪表相关领域14 小时前
Kvaser Hybrid CAN/LIN 单通道三合一总线分析仪:高性价比CAN FD/LIN集成测试利器
运维·服务器·网络·数据挖掘·数据分析·单元测试·集成测试