音视频开发

字节跳动视频云技术团队18 小时前
人工智能·音视频开发
从 VCloud 到 Agentic VCloud:Agent 时代的范式重构想象这样一个场景:你站在大同善化寺的大雄宝殿中,打开与豆包的视频通话,将镜头对准殿左右的金代彩塑,问道:“给我讲讲这些金代彩塑,哪几尊塑像最值得细细端详?”豆包会像真人讲解一样,先“看到和认出”彩塑,再“听懂”问题,然后“思考”如何回答,最后说出答案。
Bigger6 天前
人工智能·图像识别·音视频开发
我写了一个AI图像视频生成工具,免费API+本地部署,分享给大家上个月刷到一条新闻,说有个叫Agnes AI的团队,把旗下文本、图片、视频三个模型的API全部免费开放了,无限期。
ltlovezh15 天前
android·ffmpeg·音视频开发
ROI 编码学习指南:Android 与 FFmpeg 的真实实现边界ROI,Region of Interest,感兴趣区域编码,本质是告诉编码器:一帧里不同区域的重要性不同。人脸、商品、字幕、屏幕共享文字通常比背景墙、天空、桌面更重要。编码器如果能把更多码率分配给重要区域,把更少码率分配给非重要区域,就可以在相同码率下提升主观质量,或在相近主观质量下降低码率。
iOStanhaitao16 天前
音视频开发
23.视频播放器项目实战-音视频播放简单易懂版 | 图文结合 | 生动形象想象餐厅的厨房:记住这个比喻,你就懂了!就像:端菜的盘子就像:餐桌布置
iOStanhaitao17 天前
音视频开发
6.第一个c++安卓程序编译运行序号:6 | Mac Intel芯片 | Android Studio Panda 2 | Pixel 9模拟器
音视频牛哥24 天前
音视频开发·视频编码·直播
不只是等待 IDR:SmartMediaKit 播放器对 H.264 GDR 码流的完整适配实践在直播、安防监控、无人机回传、工业视觉和远程巡检等实时视频场景中,H.264 仍然是当前部署最广泛的视频编码标准之一。对于大多数音视频开发者来说,H.264 中的关键帧,尤其是 IDR 帧,几乎是播放器起播、断线重连、录像切片和解码器恢复的基础前提。
三木彤1 个月前
音视频开发
语音转文本python基于OpenAI Whisper,完全离线,不用API密钥,支持长音频、多语种,对硬件有一定要求。需额外安装录音库:
鹧鸪晏1 个月前
android·音视频开发
Android GLSurfaceView 完全指南GLSurfaceView 是 Android 平台上专门用于 OpenGL ES 渲染的 View 组件。它继承自 SurfaceView,提供了以下核心功能:
ltlovezh1 个月前
后端·ffmpeg·音视频开发
AAC 元数据:ADTS 与 ASC 的区别、转换和常见坑在音视频工程里说“AAC 元数据”,通常不是指 ID3、title、artist 这类媒体标签,而是指 解码 AAC 所必须知道的音频配置:AAC profile、采样率、声道配置、SBR/PS 扩展等。
MonkeyKing1 个月前
音视频开发
iOS 音频实战:边播边缓存、预加载与断点续播完整实现在 iOS 音频开发中,单纯的“播放功能”早已无法满足用户需求——无论是音乐 App、有声书 App,还是播客类应用,用户都希望实现「网络音频边播边存」「切换音频无等待」「断网/退出后继续播放」的体验。这三个核心功能(边播边缓存、预加载、断点续播),直接决定了音频 App 的用户留存率。
11年老程序猿在线搬砖1 个月前
音视频开发·创业·技术选型·社交app开发·语聊app·开发费用
2026年语聊APP开发费用深度拆解:从MVP到百万并发的预算清单2026年,声音社交的热度只增不减。TikTok LIVE、Bigo Live 等平台继续高歌猛进,国内也有大量创业者想在这一赛道分一杯羹。但在我们参与过的多个项目中,最常见的问题就是:“做个语聊APP到底要花多少钱?”很多团队前期没把账算清,导致开发到一半资金断裂,或者盲目投入功能结果用户不买账。
码流怪侠1 个月前
android·程序员·音视频开发
Android MediaCodec 全面详解:从入门到精通MediaCodec 是 Android 系统提供的底层媒体编解码接口,用于访问设备上的硬件或软件编解码器。它是 Android 多媒体支持基础设施的核心组件之一,自 API Level 16 (Android 4.1) 开始引入。
L_Xian2 个月前
android·github·音视频开发
StarrySky重新维护了,摆烂了一段时间,想想还是搞搞吧。本来AI时代我觉得很多所谓的功能库其实已经没必要再更新了,也没什么难的,都是一句话AI全帮你解决。但没管了一段时间后再看看自己以前做的东西,感觉还是得交代一下,所以就重新维护了。
ryn483982 个月前
aigc·音视频开发
关于我是如何用AI创作一个1分半的短视频的我最近做了一个大胆的尝试,使用AI来创作AI短视频。我曾经以为这个AI泛滥的时代,制作一条短视频不是轻而易举么?但是事实远远没有我想象得那么简单...
码流怪侠2 个月前
ffmpeg·音视频开发·视频编码
FFmpeg 开发实战全解析:从入门到精通(附完整代码示例)作者: 码流怪侠 日期: 2026-05-01 标签: FFmpeg、音视频开发、H264、AAC、解码、编码、Filter 参考项目: ffmpeg-demo(基于 FFmpeg 4.1)
redreamSo2 个月前
前端·开源·音视频开发
HeyGen 开源了一个"用 HTML 写视频"的框架,我研究了一下,发现事情没那么简单HeyGen 最近开源了一个叫 Hyperframes 的项目,GitHub 上已经拿到 11.2k Star。
MonkeyKing2 个月前
ios·音视频开发
iOS 音频会话 AVAudioSession 完整机制:分类、模式、激活策略在iOS开发中,只要涉及音频播放、录制(如音乐播放器、语音通话、录音APP),就绕不开 AVAudioSession。它是iOS系统管理音频资源的“总管家”,负责协调APP与系统、其他APP之间的音频抢占、路由切换(扬声器/耳机/蓝牙)、音量控制等核心逻辑。
JMchen1232 个月前
opencv·ffmpeg·音视频开发·cmake·jni·ndk·abi 兼容性
集成第三方 C/C++ 库到 Android NDK 项目:OpenCV 与 FFmpeg 实战指南在 Android 开发中,我们经常会遇到这样的场景:实现实时人脸检测、图像滤镜等功能,Java 代码帧率不足 10fps
qwfy2 个月前
app·音视频开发·直播
从零实现一个 IM + 直播 App:Kotlin + Compose 多模块架构全流程记录仓库地址:github.com/qwfy5287/Li…Kotlin 2.0 / Jetpack Compose / Clean Architecture / Hilt / Room / Media3 / Paging 3。
音视频牛哥2 个月前
harmonyos·音视频开发·直播
鸿蒙 NEXT 下 RTSP/RTMP 播放器如何实时调节音量、亮度、对比度与饱和度?本文基于大牛直播 SDK(SmartMediaKit)的鸿蒙 NEXT 移植版本,结合真实的 ArkTS 工程代码,完整介绍播放过程中如何对音量、画面亮度、对比度、饱和度进行实时动态调节。