音频格式转换

一、场景

项目需求需要App实现声纹识别功能,调用科大讯飞接口:

声纹识别 API 文档 | 讯飞开放平台文档中心

其接口要求音频文件格式为mp3

二、问题产生

在安卓端根据官方文档说明,系统并不支持直接录制mp3格式音频,支持格式如下:

支持的媒体格式 | Android media | Android Developers

苹果端也有类似情况:

Documentation Archive

简单来说,移动端系统支持pcm 或者 wav 这种原始音频文件信息,文件比较大,而科大讯飞接口需要提供压缩后文件比较小的mp3格式音频,因此就需要进行转换处理了。

三、功能实现

刚开始在安卓端查到的资料大多为使用lame库来进行转换处理:
Android集成LAME库,实现pcm转mp3_安卓lame-CSDN博客

但是看到这种需要NDK 开发,并且这个功能以后也不常用,对于框架的维护起来比较麻烦。所以想着换个思路,是否让后端来进行这个转换工作,因为苹果端以后也要进行转码操作,如果java后端实现了,则可以免去移动端两端的烦恼。

查询java端的思路也还是使用lame库或者ffmpeg 库,但是找到几个开源库都是这种star很少的,例如:

https://blog.csdn.net/Fan_1504251998/article/details/126345408

然后应用时不成成功,报各种错误,无法正常转换。

找到一个star 多一点也是如此,例如:

GitHub - a-schild/jave2: The JAVE (Java Audio Video Encoder) library is Java wrapper on the ffmpeg project

就在这种反复尝试无果时,又问了下大模型,给出的其他方案中有使用ffmpeg 转码的,于是想到了之前自己在增加视频关键帧时,曾经下载用命令尝试过,于是查了一下音频转码的命令:

ffmpeg -y -f 采样格式 -ac 声道数 -ar 采样率 -acodec pcm_s16le -i PCM源文件 MP3目标文件

将安卓端录制的pcm音频文件放置到了工具目录下运行:

ffmpeg.exe -y -f s16be -ac 1 -ar 16000 -acodec pcm_s16le -i test_audio.pcm converted.mp3

转换出来的mp3文件能够正常播放,并且使用科大讯飞接口能够成功进行调用。

于是格局打开,思路豁然开朗,感觉大有可为。

继续查询安卓端是否可以直接使用ffmpeg库,而不需要想lame 那样的NDK开发方式,GPT给出了如下引用库: implementation 'com.arthenica:ffmpeg-kit-full:5.1.LTS'

使用方式:

String command = String.format("-y -f s16be -ac 1 -ar 16000 -acodec pcm_s16le -i %s %s",wavPath, mp3Path);

FFmpegSession session = FFmpegKit.execute(command);

if (session.getReturnCode().isSuccess(session.getReturnCode())) {

Log.d("FFmpeg", "WAV to MP3 conversion successful");

} else {

Log.e("FFmpeg", "WAV to MP3 conversion failed: " + session.getFailStackTrace());

}

实现了安卓端的音频mp3转换

相关推荐
9527华安27 分钟前
FPGA实现PCIE3.0视频采集转10G万兆UDP网络输出,基于XDMA+GTH架构,提供工程源码和技术支持
网络·fpga开发·udp·音视频·xdma·pcie3.0·万兆网
电子科技圈1 小时前
XMOS携手合作伙伴晓龙国际联合推出集成了ASRC等功能的多通道音频板
科技·嵌入式硬件·mcu·物联网·音视频·iot
码码哈哈0.01 小时前
免费的视频混剪综合处理工具介绍与下载
音视频
莫固执,朋友1 小时前
网络抓包工具tcpdump 在海思平台上的编译使用
网络·ffmpeg·音视频·tcpdump
深海呐2 小时前
Android 从本地选择视频,用APP播放或进行其他处理
android·音视频·从本地选择视频,用app播放·从本地选择视频,并拿到信息·跳转到本地视频列表
深海呐2 小时前
Android Google登录接入
android·google登录接入·android 谷歌登录接入·google登录·android google
daiyang123...2 小时前
MySQL【知识改变命运】11
android·数据库·mysql
cuijiecheng20182 小时前
音视频入门基础:MPEG2-TS专题(6)——FFmpeg源码中,获取MPEG2-TS传输流每个transport packet长度的实现
ffmpeg·音视频
8931519603 小时前
Android开发教程案例源码分享-匹配动画多个头像飘动效果
android·android开发·android教程·kotlin教程·android头像飘动动画·android匹配动画·android多个头像飘动动画
老码沉思录3 小时前
Android开发实战班 - 网络编程 - WebSocket 实时通信
android·网络·websocket