绘制音频时长核密度分布图

py 复制代码
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 读取文件到DataFrame # 可以读百万行文件
df = pd.read_csv('wav_dur_million.info', sep=' ', header=0, names=['音频名', '音频时长'])

# 绘制核密度图
sns.kdeplot(df['音频时长'], fill=True)
plt.xlabel('duration')
plt.ylabel('Kernel Density Estimation')
plt.title('Kernel Density Plot of Audio Durations')
plt.show()

# 保存图形到文件
plt.savefig('wav_dur_plot.png')

这条命令使用 Pandas 的 read_csv 函数从名为 'wav_dur_million.info' 的文件中读取数据,并做了以下设置:

  • sep=' ':指定数据文件中的列是以空格作为分隔符。
  • header=0:表示第一行是数据文件中的列名。
  • names=['音频名', '音频时长']:给读取的列添加了自定义的列名,分别为 '音频名''音频时长'

因此,这条命令的作用是从文件中读取带有列名的数据,其中列名分别为 '音频名''音频时长',并将其存储在名为 df 的 Pandas 数据框中。

相关推荐
2501_947575805 小时前
计算机毕业设计之jsp开山车行二手车交易系统
java·开发语言·hadoop·python·信息可视化·django·课程设计
骑士雄师5 小时前
java面试题 4:鉴权
java·开发语言
Byron__6 小时前
AI学习_06_短期记忆与长期记忆
人工智能·python·学习
时间的拾荒人6 小时前
C语言字符函数与字符串函数完全指南
c语言·开发语言
2501_948106916 小时前
计算机毕业设计之基于jsp教科研信息共享系统
java·开发语言·信息可视化·spark·课程设计
取经蜗牛7 小时前
Python 第一阶段完全指南:从零到第一个实用工具
开发语言·python
创世宇图7 小时前
【Python工程化实战】OpenTelemetry 在 Python 中的全链路追踪落地:从埋点到可视化的完整实战指南
python·分布式链路追踪·性能监控·opentelemetry·微服务可观测性
dog2507 小时前
从重尾到截断流量模型的演进
开发语言·php
qq_401700418 小时前
Qt QSS 完全入门写出漂亮界面以及解决样式不生效问题
开发语言·qt
许彰午8 小时前
72_Python爬虫基础BeautifulSoup
爬虫·python·beautifulsoup