技术栈
webm 读取解析
AI视觉网奇
2025-08-05 10:34
读取的话,pyhton opencv可以。
提取音频
复制代码
ffmpeg -i input.webm -vn -acodec pcm_s16le -ar 44100 -ac 2 output.wav
语音识别
上一篇:
硬件-音频学习DAY1——音箱材料选择:密度板为何完胜实木
下一篇:
FFmpeg02:常用命令实战
相关推荐
陈天伟教授
7 小时前
人工智能应用-机器听觉:7. 统计合成法
人工智能
·
语音识别
DisonTangor
7 小时前
阿里开源语音识别模型——Qwen3-ASR
人工智能
·
开源
·
语音识别
陈天伟教授
17 小时前
人工智能应用-机器听觉:6. 拼接合成法
人工智能
·
语音识别
陈天伟教授
18 小时前
人工智能应用-机器听觉:5. 参数合成法
人工智能
·
语音识别
colicode
19 小时前
语音报警接口开发参考:紧急情况下快速调用语音API发送安全警报
前端
·
语音识别
runner365.git
19 小时前
ffmpeg8.0合入whisper,语音识别模型终于进入ffmpeg
ffmpeg
·
whisper
·
语音识别
渡我白衣
20 小时前
无中生有——无监督学习的原理、算法与结构发现
人工智能
·
深度学习
·
神经网络
·
学习
·
算法
·
机器学习
·
语音识别
开开心心_Every
2 天前
发票批量打印工具支持双面预览页面方向设置
游戏
·
微信
·
pdf
·
华为云
·
excel
·
语音识别
·
googlecloud
森之鸟
3 天前
鸿蒙CoreSpeechKit语音识别实战:让APP“听懂”用户说话
语音识别
·
xcode
·
harmonyos
Bits to Atoms
3 天前
宇树G1语音助手完整开发指南(下)——从零构建智能知识库对话系统
人工智能
·
机器人
·
音视频
·
语音识别
热门推荐
01
GitHub 镜像站点
02
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示
03
Claude Code Skills 实用使用手册
04
Vue-skills的中文文档
05
OpenCode 入门教程:介绍 · 安装 · 配置第三方 API (如 Claude)
06
UV安装并设置国内源
07
在Trae中使用Pencil MCP
08
2025 年大语言模型发展回顾:关键突破、意外转折与 2026 年展望
09
Clawdbot 中文汉化版 接入微信、飞书
10
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services