音视频开发

音视频牛哥4 天前
音视频开发·视频编码·直播
不只是等待 IDR:SmartMediaKit 播放器对 H.264 GDR 码流的完整适配实践在直播、安防监控、无人机回传、工业视觉和远程巡检等实时视频场景中,H.264 仍然是当前部署最广泛的视频编码标准之一。对于大多数音视频开发者来说,H.264 中的关键帧,尤其是 IDR 帧,几乎是播放器起播、断线重连、录像切片和解码器恢复的基础前提。
三木彤11 天前
音视频开发
语音转文本python基于OpenAI Whisper,完全离线,不用API密钥,支持长音频、多语种,对硬件有一定要求。需额外安装录音库:
鹧鸪晏15 天前
android·音视频开发
Android GLSurfaceView 完全指南GLSurfaceView 是 Android 平台上专门用于 OpenGL ES 渲染的 View 组件。它继承自 SurfaceView,提供了以下核心功能:
ltlovezh18 天前
后端·ffmpeg·音视频开发
AAC 元数据:ADTS 与 ASC 的区别、转换和常见坑在音视频工程里说“AAC 元数据”,通常不是指 ID3、title、artist 这类媒体标签,而是指 解码 AAC 所必须知道的音频配置:AAC profile、采样率、声道配置、SBR/PS 扩展等。
MonkeyKing20 天前
音视频开发
iOS 音频实战:边播边缓存、预加载与断点续播完整实现在 iOS 音频开发中,单纯的“播放功能”早已无法满足用户需求——无论是音乐 App、有声书 App,还是播客类应用,用户都希望实现「网络音频边播边存」「切换音频无等待」「断网/退出后继续播放」的体验。这三个核心功能(边播边缓存、预加载、断点续播),直接决定了音频 App 的用户留存率。
11年老程序猿在线搬砖20 天前
音视频开发·创业·技术选型·社交app开发·语聊app·开发费用
2026年语聊APP开发费用深度拆解:从MVP到百万并发的预算清单2026年,声音社交的热度只增不减。TikTok LIVE、Bigo Live 等平台继续高歌猛进,国内也有大量创业者想在这一赛道分一杯羹。但在我们参与过的多个项目中,最常见的问题就是:“做个语聊APP到底要花多少钱?”很多团队前期没把账算清,导致开发到一半资金断裂,或者盲目投入功能结果用户不买账。
码流怪侠24 天前
android·程序员·音视频开发
Android MediaCodec 全面详解:从入门到精通MediaCodec 是 Android 系统提供的底层媒体编解码接口,用于访问设备上的硬件或软件编解码器。它是 Android 多媒体支持基础设施的核心组件之一,自 API Level 16 (Android 4.1) 开始引入。
L_Xian1 个月前
android·github·音视频开发
StarrySky重新维护了,摆烂了一段时间,想想还是搞搞吧。本来AI时代我觉得很多所谓的功能库其实已经没必要再更新了,也没什么难的,都是一句话AI全帮你解决。但没管了一段时间后再看看自己以前做的东西,感觉还是得交代一下,所以就重新维护了。
ryn483981 个月前
aigc·音视频开发
关于我是如何用AI创作一个1分半的短视频的我最近做了一个大胆的尝试,使用AI来创作AI短视频。我曾经以为这个AI泛滥的时代,制作一条短视频不是轻而易举么?但是事实远远没有我想象得那么简单...
码流怪侠1 个月前
ffmpeg·音视频开发·视频编码
FFmpeg 开发实战全解析:从入门到精通(附完整代码示例)作者: 码流怪侠 日期: 2026-05-01 标签: FFmpeg、音视频开发、H264、AAC、解码、编码、Filter 参考项目: ffmpeg-demo(基于 FFmpeg 4.1)
redreamSo1 个月前
前端·开源·音视频开发
HeyGen 开源了一个"用 HTML 写视频"的框架,我研究了一下,发现事情没那么简单HeyGen 最近开源了一个叫 Hyperframes 的项目,GitHub 上已经拿到 11.2k Star。
MonkeyKing1 个月前
ios·音视频开发
iOS 音频会话 AVAudioSession 完整机制:分类、模式、激活策略在iOS开发中,只要涉及音频播放、录制(如音乐播放器、语音通话、录音APP),就绕不开 AVAudioSession。它是iOS系统管理音频资源的“总管家”,负责协调APP与系统、其他APP之间的音频抢占、路由切换(扬声器/耳机/蓝牙)、音量控制等核心逻辑。
JMchen1232 个月前
opencv·ffmpeg·音视频开发·cmake·jni·ndk·abi 兼容性
集成第三方 C/C++ 库到 Android NDK 项目:OpenCV 与 FFmpeg 实战指南在 Android 开发中,我们经常会遇到这样的场景:实现实时人脸检测、图像滤镜等功能,Java 代码帧率不足 10fps
qwfy2 个月前
app·音视频开发·直播
从零实现一个 IM + 直播 App:Kotlin + Compose 多模块架构全流程记录仓库地址:github.com/qwfy5287/Li…Kotlin 2.0 / Jetpack Compose / Clean Architecture / Hilt / Room / Media3 / Paging 3。
音视频牛哥2 个月前
harmonyos·音视频开发·直播
鸿蒙 NEXT 下 RTSP/RTMP 播放器如何实时调节音量、亮度、对比度与饱和度?本文基于大牛直播 SDK(SmartMediaKit)的鸿蒙 NEXT 移植版本,结合真实的 ArkTS 工程代码,完整介绍播放过程中如何对音量、画面亮度、对比度、饱和度进行实时动态调节。
冬奇Lab2 个月前
android·音视频开发
音视频同步与渲染:PTS、VSYNC 与 SurfaceFlinger 的协作之道你应该有过这种体验:看一段讲课视频,口型和声音差了半秒,难受到想关掉。或者打王者荣耀直播,英雄死了一秒后才听到"一血"的提示音。
冬奇Lab2 个月前
android·音视频开发·源码阅读
MediaPlayer 播放器架构:NuPlayer 的 Source/Decoder/Renderer 三驾马车有没有遇到过这种情况:用 MediaPlayer 播放一段视频,seekTo 完之后画面卡在了之前的帧,音频倒是跳过去了?或者直播流有时候音画不同步,声音跑快了半秒钟?
冬奇Lab2 个月前
android·音视频开发·视频编码
硬件加速与 OMX/Codec2:解密编解码器的底层世界用 MediaCodec 开发的时候,偶尔会看到这样的代码:这些以 vendor. 开头的参数是什么?为什么官方文档里找不到?它们是怎么传递到硬件编码器的?
冬奇Lab2 个月前
android·音视频开发·源码阅读
MediaCodec 编解码基础:Buffer 队列、状态机与零拷贝的艺术MediaCodec 是 Android 视频开发绕不开的核心类。初学者往往觉得它"挺简单的"——创建一个、配置一下、喂数据、取输出——然后在第一个 IllegalStateException 面前愣住,接着花一下午研究为什么 Buffer 一直取不到,最后发现自己把 releaseOutputBuffer 写在了错误的地方……
冬奇Lab2 个月前
android·音视频开发·源码阅读
Camera HAL3 接口:Android 相机的真正底牌如果你花时间学完了 Camera2 API,你大概会有一种感觉:这套 API 设计得挺精妙,但有时候行为很"神秘"——同样的参数,不同手机效果天差地别;明明已经配置了对焦模式,实际却不生效;相机帧率时快时慢……