技术栈
webm 读取解析
AI视觉网奇
2025-08-05 10:34
读取的话,pyhton opencv可以。
提取音频
复制代码
ffmpeg -i input.webm -vn -acodec pcm_s16le -ar 44100 -ac 2 output.wav
语音识别
上一篇:
硬件-音频学习DAY1——音箱材料选择:密度板为何完胜实木
下一篇:
FFmpeg02:常用命令实战
相关推荐
Luke Ewin
21 小时前
基于FunASR开发的可私有化部署的语音转文字接口 | FunASR接口开发 | 语音识别接口私有化部署
人工智能
·
python
·
语音识别
·
fastapi
·
asr
·
funasr
昨日之日2006
2 天前
Fun-ASR - 多语言多方言的高精度语音识别软件 支持50系显卡 一键整合包下载
人工智能
·
音视频
·
语音识别
第六五
2 天前
语音信号的时域、频域与时频域特征
人工智能
·
语音识别
小oo呆
2 天前
【学习心得】基于FunASR推理的SenseVoiceSmall模型来实现语音识别
人工智能
·
语音识别
Mryan2005
2 天前
基于 NAO 机器人的智能语音交互系统的设计与实现
机器人
·
语音识别
小oo呆
2 天前
【学习心得】基于VOSK的唤醒词检测
语音识别
曦云沐
3 天前
轻量却强大:Fun-ASR-Nano-2512 语音识别模型上手指南
人工智能
·
语音识别
·
asr
·
fun-asr-nano
音元系统
4 天前
现行析音法
语音识别
·
语音合成
·
输入法
·
语音分析
·
语音系统
小咖自动剪辑
4 天前
自动批量混剪视频软件配置流程
实时互动
·
音视频
·
语音识别
·
实时音视频
·
视频编解码
飞睿科技
4 天前
ESP Audio Effects音频库迎来专业升级,v1.2.0 新增动态控制核心
人工智能
·
物联网
·
ffmpeg
·
智能家居
·
语音识别
·
乐鑫科技
·
esp
热门推荐
01
GitHub 镜像站点
02
UV安装并设置国内源
03
Linux下V2Ray安装配置指南
04
RedissonClient的配置解析
05
在VSCode配置Java开发环境的保姆级教程(适配各类AI编程IDE)
06
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
07
BongoCat - 跨平台键盘猫动画工具
08
Open-AutoGLM Windows 安装部署教程
09
jdk21下载、安装(Windows、Linux、macOS)
10
【AutoGLM部署】本地私有化部署AI手机Agent