绘制音频时长核密度分布图

py 复制代码
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 读取文件到DataFrame # 可以读百万行文件
df = pd.read_csv('wav_dur_million.info', sep=' ', header=0, names=['音频名', '音频时长'])

# 绘制核密度图
sns.kdeplot(df['音频时长'], fill=True)
plt.xlabel('duration')
plt.ylabel('Kernel Density Estimation')
plt.title('Kernel Density Plot of Audio Durations')
plt.show()

# 保存图形到文件
plt.savefig('wav_dur_plot.png')

这条命令使用 Pandas 的 read_csv 函数从名为 'wav_dur_million.info' 的文件中读取数据,并做了以下设置:

  • sep=' ':指定数据文件中的列是以空格作为分隔符。
  • header=0:表示第一行是数据文件中的列名。
  • names=['音频名', '音频时长']:给读取的列添加了自定义的列名,分别为 '音频名''音频时长'

因此,这条命令的作用是从文件中读取带有列名的数据,其中列名分别为 '音频名''音频时长',并将其存储在名为 df 的 Pandas 数据框中。

相关推荐
hefaxiang6 分钟前
分支循环(下)(二)
c语言·开发语言·数据结构
PixelMind21 分钟前
【超分辨率专题】FlashVSR:单步Diffusion的再次提速,实时视频超分不是梦!
深度学习·音视频·超分辨率·vsr
一个散步者的梦28 分钟前
一键生成数据分析报告:Python的ydata-profiling模块(汉化)
python·数据挖掘·数据分析
黑客思维者42 分钟前
Python大规模数据处理OOM突围:从迭代器原理到TB级文件实战优化
开发语言·python·github·迭代器·oom
weixin_421133411 小时前
应用日志监控
python
繁华似锦respect1 小时前
C++ 智能指针底层实现深度解析
linux·开发语言·c++·设计模式·代理模式
lkbhua莱克瓦241 小时前
IO流练习(加密和解密文件)
java·开发语言·笔记·学习方法·io流·io流练习题
偶像你挑的噻2 小时前
3.Qt-基础布局以及事件
开发语言·数据库·qt
CHANG_THE_WORLD2 小时前
Python 学习三 Python字符串拼接详解
开发语言·python·学习
诸葛老刘2 小时前
next.js 框架中的约定的特殊参数名称
开发语言·javascript·ecmascript