技术栈
音频处理
Eric.Lee2021
2 个月前
开发语言
·
python
·
音视频
·
音频处理
使用 pydub 的 AudioSegment 获取音频时长 - python 实现
通过使用 pydub 的 AudioSegment 获取音频时长,音频常用格式如 m4a,wav等。安装 python 库:
DogDaoDao
3 个月前
人工智能
·
深度学习
·
大模型
·
音视频
·
音频
·
音频处理
·
语音大模型
开源音频处理项目推荐【持续更新】
胖虎1
4 个月前
音频播放
·
音频处理
·
音频波形图
音频播放+音频采样(绘制音波)
在 iOS 平台中,实现音频播放有多种方式。AVAudioPlayer 是一个专门用于播放音频数据的类,易于使用,适合处理简单的音频播放需求。而 AVPlayer 则是一种更通用的播放器,既能播放视频资源,也能处理音频内容,非常适合流媒体和多媒体应用。
io_T_T
5 个月前
python
·
音频处理
python 音频处理(2)——提取PPG特征之whisper库的使用(2.1)
直接pip即可: pip install openai-whisper成功后如下图所示当时用了他这个方法环境直接崩了,已老实
2301_79716471
10 个月前
单片机
·
嵌入式硬件
·
音频处理
·
a/d转换放大
低功耗运放D722,具有9MHz的高增益带宽积,转换速率为8.5V/μs
D722是低噪声、低电压、低功耗运放,应用广泛。D722具有9MHz的高增益带宽积,转换速率为8.5V/μs,静态电流为1.7mA(5V电源电压)。D722具有低电压、低噪声的特点,并提供轨到轨输出能力,D722的最大输入失调电压为4mV。工业级温度范围(−40℃至+125℃),工作电压范围为2.5V至5.5V。
老艾的AI世界
1 年前
人工智能
·
深度学习
·
ai
·
语音识别
·
音频处理
·
音频翻译
·
音频文字提取
·
音频转录
98秒转录2.5小时音频,最强音频翻译神器IFW下载部署
IFW是一款功能强大的音频翻译工具,具备高速转录能力,能在短时间内完成大量音频处理,提高工作效率以下是IFW在 Nvidia A100 - 80GB 上运行的一些基准测试:
刘悦的技术博客
1 年前
人工智能
·
python
·
ai
·
音频处理
·
bert-vits2
本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)
按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。
刘悦的技术博客
1 年前
人工智能
·
python
·
ai
·
音频处理
·
背景音乐
·
扒谱
不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)
所谓"扒谱"是指通过听歌或观看演奏视频等方式,逐步分析和还原音乐作品的曲谱或乐谱的过程。它是音乐学习和演奏的一种常见方法,通常由音乐爱好者、乐手或学生使用。
夏天|여름이다
1 年前
开发语言
·
python
·
音视频
·
音频处理
Speech | 语音处理,分割一段音频(python)
本文主要是关于语音数据在处理过程中的一些脚本文件以及实例,所有代码只需要更改所需处理的文件路径,输出路径等,全部可运行。