绘制音频时长核密度分布图

py 复制代码
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 读取文件到DataFrame # 可以读百万行文件
df = pd.read_csv('wav_dur_million.info', sep=' ', header=0, names=['音频名', '音频时长'])

# 绘制核密度图
sns.kdeplot(df['音频时长'], fill=True)
plt.xlabel('duration')
plt.ylabel('Kernel Density Estimation')
plt.title('Kernel Density Plot of Audio Durations')
plt.show()

# 保存图形到文件
plt.savefig('wav_dur_plot.png')

这条命令使用 Pandas 的 read_csv 函数从名为 'wav_dur_million.info' 的文件中读取数据,并做了以下设置:

  • sep=' ':指定数据文件中的列是以空格作为分隔符。
  • header=0:表示第一行是数据文件中的列名。
  • names=['音频名', '音频时长']:给读取的列添加了自定义的列名,分别为 '音频名''音频时长'

因此,这条命令的作用是从文件中读取带有列名的数据,其中列名分别为 '音频名''音频时长',并将其存储在名为 df 的 Pandas 数据框中。

相关推荐
微刻时光1 分钟前
影刀RPA:循环相似元素列表深度解析与实战指南
java·人工智能·python·机器人·自动化·rpa·影刀
IT观测4 分钟前
2026年六家视频音频格式转换软件品牌深度解析:格式转化器选型指南
音视频
froginwe1116 分钟前
Python3 实例
开发语言
2301_8166602116 分钟前
golang如何实现SSRF防护策略_golang SSRF防护策略实现方案
jvm·数据库·python
xiaoshuaishuai817 分钟前
C# ZLibrary数字资源分发
开发语言·windows·c#
淘矿人18 分钟前
Claude辅助算法设计与优化
人工智能·python·算法·microsoft·github·bug·pygame
小碗羊肉19 分钟前
【从零开始学Java | 第四十二篇】生产者消费者问题(等待唤醒机制)
java·开发语言
流年如夢20 分钟前
自定义类型进阶:联合与枚举
java·c语言·开发语言·数据结构·数据库·c++·算法
解救女汉子21 分钟前
CSS3 按钮悬停时显示手型光标(cursor- pointer)的正确写法
jvm·数据库·python
Little At Air24 分钟前
C++stack模拟实现
linux·开发语言·c++·算法