Android 的音视频分离与合成需要用到 MediaExtractor 和 MediaMuxer,MediaExtractor 可以从一个媒体文件中提取出音频或视频流,并以数据块(buffer)的形式提供给应用程序,MediaMuxer 则可以将音频或视频数据存储到容器中,并将其写入到指定的输出文件中。
分离
MediaExtractor 可以用来分离容器中的视频轨道和音频轨道,支持多种常见的媒体格式,例如 MP4,3GP,WebM,FLV,MPEG-TS 等等。
主要 API 如下:
- setDataSource(String path):设置媒体文件的路径
- getTrackCount():获取媒体文件中的音视频轨道数量
- getTrackFormat(int index):获取指定音视频轨道的格式
- selectTrack(int index):选择指定音视频轨道
- readSampleData(ByteBuffer byteBuf, int offset):读取一帧数据
- advance():读取下一帧数据
- release():释放资源
举个例子,现在有个 mp4 格式的音视频,需要将它的视频和音频分离开来,怎么做呢?这就可以使用 MediaExtractor ,大概的使用步骤是:设置数据源,获取轨道数,选择特定的轨道,然后循环读取每帧的样本数据,完成后释放资源即可,代码如下:
kotlin
private fun separateVideo() {
val mediaExtractor = MediaExtractor()
// 源视频存放的路径
val filePath = getExternalFilesDir(null)!!.absolutePath + "/test_video.mp4"
try {
// 设置数据源,可以是本地文件或者网络地址。
mediaExtractor.setDataSource(filePath)
// 获取轨道数
val trackCount = mediaExtractor.trackCount
// 遍历轨道,查看音频轨道或视频轨道信息
for (i in 0 until trackCount) {
// 获取某一个轨道的媒体格式
val trackFormat = mediaExtractor.getTrackFormat(i)
val keyMime = trackFormat.getString(MediaFormat.KEY_MIME)
if (keyMime.isNullOrEmpty()) {
continue
}
// 通过 MIME 信息识别音频轨道和视频轨道
if (keyMime.startsWith("video/")) {
val outputFile = getOutputFile(mediaExtractor, i, "/video.mp4")
Log.i(TAG, "video file path:${outputFile.absolutePath}")
} else if (keyMime.startsWith("audio/")) {
val outputFile = getOutputFile(mediaExtractor, i, "/audio.aac")
Log.i(TAG, "audio file path:${outputFile.absolutePath}")
}
}
} catch (e: IOException) {
e.printStackTrace()
}
}
其中,getOutputFile 方法就是确定音频轨道或视频轨道后的文件输出,代码如下:
kotlin
@Throws(IOException::class)
private fun getOutputFile(mediaExtractor: MediaExtractor, i: Int, outputName: String): File {
val trackFormat = mediaExtractor.getTrackFormat(i)
mediaExtractor.selectTrack(i)
// 文件保存路径
val outputFile =
File(getExternalFilesDir(Environment.DIRECTORY_MUSIC)!!.absolutePath + outputName)
if (outputFile.exists()) {
outputFile.delete()
}
val mediaMuxer =
MediaMuxer(outputFile.absolutePath, MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4)
// 添加轨道信息
mediaMuxer.addTrack(trackFormat)
// 开始合成
mediaMuxer.start()
// 设置每一帧的大小
val buffer = ByteBuffer.allocate(500 * 1024)
val bufferInfo = MediaCodec.BufferInfo()
var sampleSize: Int
// 循环读取每帧样本数据
while (mediaExtractor.readSampleData(buffer, 0).also { sampleSize = it } > 0) {
bufferInfo.apply {
flags = mediaExtractor.sampleFlags
offset = 0
size = sampleSize
presentationTimeUs = mediaExtractor.sampleTime
}
// 通过 mediaExtractor 解封装的数据通过 writeSampleData 写入到对应的轨道
mediaMuxer.writeSampleData(0, buffer, bufferInfo)
// 读取下一帧数据
mediaExtractor.advance()
}
// 提取完毕
mediaExtractor.unselectTrack(i)
mediaMuxer.stop()
mediaMuxer.release()
return outputFile
}
执行程序之后,我们就会发现 test_video.mp4 这个文件被分离成了视频和音频两个文件。
合成
现在,我们把源音视频文件 test_video.mp4 删了,通过 audio.aac 音频文件和 video.mp4 视频文件合成一个音视频文件 test_video.mp4,这就使用到了 MediaMuxer,其实上面的代码也有用到,只是用途不同而已。MediaMuxer 除了可以生成音频或视频文件,还可以把音频与视频合成一个音视频文件。
主要 API 如下:
- MediaMuxer(String path, int format):path 为输出文件的名称,format 指输出文件的格式
- addTrack(MediaFormat format):添加轨道
- start():开始合成文件
- writeSampleData(int trackIndex, ByteBuffer byteBuf, MediaCodec.BufferInfo bufferInfo):把ByteBuffer 中的数据写入到在构造器设置的文件中
- stop():停止合成文件
- release():释放资源
MediaMuxer 大概的使用步骤是:设置目标文件路径和音视频格式,添加要合成的轨道,包括音频轨道和视频轨道,然后开始合成,循环写入每帧样本数据,完成后释放即可,代码如下:
kotlin
private fun compositeVideo(): String? {
val videoFile = File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), "video.mp4")
val audioFile = File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), "audio.aac")
// 输出文件
val outputFile = File(getExternalFilesDir(null), "test_video.mp4")
if (outputFile.exists()) {
outputFile.delete()
}
if (!videoFile.exists() || !audioFile.exists()) {
return null
}
val videoExtractor = MediaExtractor()
val audioExtractor = MediaExtractor()
try {
val mediaMuxer =
MediaMuxer(outputFile.absolutePath, MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4)
var videoTrackIndex = 0
var audioTrackIndex = 0
//添加视频轨道
videoExtractor.setDataSource(videoFile.absolutePath)
val videoTrackCount = videoExtractor.trackCount
for (i in 0 until videoTrackCount) {
val trackFormat = videoExtractor.getTrackFormat(i)
val mimeType = trackFormat.getString(MediaFormat.KEY_MIME)
if (mimeType.isNullOrEmpty()) {
continue
}
if (mimeType.startsWith("video/")) {
videoExtractor.selectTrack(i)
videoTrackIndex = mediaMuxer.addTrack(trackFormat)
break
}
}
// 添加音频轨道
audioExtractor.setDataSource(audioFile.absolutePath)
val audioTrackCount = audioExtractor.trackCount
for (i in 0 until audioTrackCount) {
val trackFormat = audioExtractor.getTrackFormat(i)
val mimeType = trackFormat.getString(MediaFormat.KEY_MIME)
if (mimeType.isNullOrEmpty()) {
continue
}
if (mimeType.startsWith("audio/")) {
audioExtractor.selectTrack(i)
audioTrackIndex = mediaMuxer.addTrack(trackFormat)
break
}
}
// 开始合成
mediaMuxer.start()
val byteBuffer = ByteBuffer.allocate(500 * 1024)
val bufferInfo = MediaCodec.BufferInfo()
var videoSampleSize: Int
while (videoExtractor.readSampleData(byteBuffer, 0).also { videoSampleSize = it } > 0) {
bufferInfo.apply {
flags = videoExtractor.sampleFlags
offset = 0
size = videoSampleSize
presentationTimeUs = videoExtractor.sampleTime
}
mediaMuxer.writeSampleData(videoTrackIndex, byteBuffer, bufferInfo)
videoExtractor.advance()
}
var audioSampleSize: Int
val audioBufferInfo = MediaCodec.BufferInfo()
while (audioExtractor.readSampleData(byteBuffer, 0).also { audioSampleSize = it } > 0) {
audioBufferInfo.apply {
flags = audioExtractor.sampleFlags
offset = 0
size = audioSampleSize
presentationTimeUs = audioExtractor.sampleTime
}
mediaMuxer.writeSampleData(audioTrackIndex, byteBuffer, audioBufferInfo)
audioExtractor.advance()
}
// 释放资源
videoExtractor.release()
audioExtractor.release()
mediaMuxer.stop()
mediaMuxer.release()
return outputFile.absolutePath
} catch (e: IOException) {
e.printStackTrace()
return null
}
}