音视频开发

冬奇Lab3 天前
android·音视频开发·源码阅读
AudioTrack音频播放流程深度解析上一篇我们搭好了"舞台"——分析了AudioFlinger的整体架构。这一篇我们来追一个具体的"演员":AudioTrack。
冬奇Lab4 天前
android·音视频开发·源码阅读
AudioFlinger架构基础:Android音频系统的心脏你有没有想过,当你同时打开音乐APP播放歌曲、微信来了消息提示音、游戏里的背景音乐也在跑——这三路音频是怎么在同一个手机扬声器里"和平共处"的?
RandySu9005 天前
音视频开发
Soundly 音频DSP流程核心逻辑说明本文档着重介绍 Soundly 项目内 DSP 流程的代码架构逻辑实现细节,周边配套逻辑不做说明录音场景下无法确保周边环境绝对安静,导致生成的录音文件会有杂声、噪音等无关主题内容的声音,影响用户收听最终产物的体验。常见问题真实场景有博客录音、视频会议、VLog等,这些场景一般情况下都会伴随周边杂声等。
程序员_Rya7 天前
实时音视频·音视频开发·技术选型·音视频sdk·音视频sdk对比
语聊房如何选择实时语音SDK?一文说清楚决策要点!语音社交赛道正在持续升温。从早期的语音聊天室到如今的多元语音场景、AI Agent结合语音场景等,[语聊房]这个熟悉的互联网社交娱乐场景正在涌现新玩法,成为深受Z世代欢迎的泛娱乐方式之一。近年来,语音社交、在线K歌、游戏语音等以下几类场景持续给创业者带来较好的收益,是开发者创业的方向:
ZengLiangYi10 天前
前端·音视频开发
用 AudioContext.suspend()/resume() 作为流式音视频的同步门控在"边收帧边播放"的场景中,传统做法是缓冲 N 帧后再启动——本质上是在猜网络速度,猜错了音画就不同步。更可靠的方案:把 AudioContext.suspend() 当作同步门,帧没到就冻结音频时钟,帧到了再放行。这个做法成立的原因是 suspend() 同时冻结音频输出和 currentTime 时钟,天然是一个同步原语。
leafyyuki14 天前
前端·音视频开发
如何优雅地上传大文件?分片上传实战指南当文件体积较大(如视频)时,直接上传容易超时、失败,且无法展示进度。分片上传将文件切成多块依次上传,再在服务端合并,可提升稳定性和体验。
炼金术21 天前
ai编程·音视频开发
AI 驱动的自主开发闭环:从"人工测试员"到"需求驱动"的转变项目地址:SkyPlayerSkyPlayer v1.0.0:移动端 FFmpeg 播放器深度实践SkyPlayer v1.1.0 : 在线视频播放功能更新
冬奇Lab1 个月前
开源·音视频开发
一天一个开源项目(第17篇):ViMax - 多智能体视频生成框架,导演、编剧、制片人全包"如果AI能像真正的电影制作团队一样工作,那该多好?"这是"一天一个开源项目"系列的第17篇文章。今天带你了解的项目是 ViMax(GitHub)。
冬奇Lab1 个月前
开源·aigc·音视频开发
一天一个开源项目(第16篇):Code2Video - 用代码生成高质量教学视频的智能框架"如果生成教学视频就像写代码一样简单,那该多好?"这是"一天一个开源项目"系列的第16篇文章。今天带你了解的项目是 Code2Video(GitHub)。
u1301302 个月前
前端·音视频开发·流媒体·hls·m3u8
深入理解 M3U8 与 HLS 协议:从原理到实战解析在做音视频开发或处理流媒体业务时,我们经常会接触到后缀为 .m3u8 的文件。很多初学者会误以为它是一个视频文件,实际上,M3U8 并不是视频,而是一个索引文件。
字节架构前端2 个月前
前端·chrome·音视频开发
媒体采集标准草案 与 Chromium 音频采集实现简介Media Capture and Streams 是由 W3C WebRTC Working Group 提出的规范草案,主要定义了获取本地媒体的 JavaScript API。目前该草案处于 CRD (Candidate Recommend Draft) 状态,也可以被称为技术报告(Technical Report, TR)
Tiny_React2 个月前
人工智能·音视频开发·vibecoding
使用 Claude Code Skills 模拟的视频生成流程本文档模拟从创建项目到完成的完整流程,包括火山引擎流程和 Sora 流程。场景:创建一个关于友谊的绘本视频
hk11243 个月前
ffmpeg·边缘计算·音视频开发·h.265·测试数据集
【音视频/边缘计算】2025年度H.265/HEVC高并发解码与画质修复(Super-Resolution)基准测试报告(含沙丘/失控玩家核心样本)⚠️ 仿真数据合规与免责声明 (Data Compliance Disclaimer)本文提供的所有测试码流(Bitstream)均截取自公开出版的影视作品或虚拟引擎渲染片段。所有场景仅作为画质抗损耗测试、编解码压力测试及色彩还原度分析的基准参考(Benchmark)。本数据集仅供技术研究与算法调优使用,请勿用于商业分发,测试完成后请及时清理缓存。
李小轰_Rex3 个月前
android·音视频开发
把手机变成听诊器!摄像头 30 秒隔空测心率 - 开箱即用关键词:rPPG、非接触心率、Android、CameraX、MediaPipe、POS 算法、开源 Demo 源码地址:github.com/liyufengrex…
李小轰_Rex3 个月前
android·音视频开发
纯算法AEC:播录并行场景的回声消除实战笔记最近在做一款 AI 语音应用,场景类似“实时通话”:一边让 TTS 播报,一边把麦克风打开做 STT。
否子戈3 个月前
前端·音视频开发·ui kit
WebCut前端视频编辑UI框架一周开源进度自从上次发布了WebCut的开源信息之后,获得了非常多小伙伴的关注,也有很多小伙伴还不知道,所以我打算写一些更新进度文章,让关注的小伙伴了解WebCut的最新进展。
SHERlocked933 个月前
c++·后端·音视频开发
摄像头 RTSP 流视频多路实时监控解决方案实践本文记录我在摄像头 RTSP 流视频多路实时监控项目里,落地的一套「多路 RTSP 低延迟播放」方案的全过程:从选型、编码、到 Web/桌面端播放与硬解优化。
mortimer3 个月前
python·ffmpeg·音视频开发
Python + FFmpeg 视频自动化处理指南:从硬件加速到精确剪辑在 Python 中调用 subprocess.run 执行 FFmpeg 命令是视频自动化处理的常见方案。然而,面对 Windows/Linux/macOS 的跨平台兼容性、NVIDIA/Intel/AMD/Apple 的硬件加速差异,以及“拼接黑帧”、“音画不同步”等经典坑点,写出一套健壮的代码并不容易。
否子戈4 个月前
前端框架·音视频开发·视频编码
做中国人自己的视频编辑UI框架,WebCut正式开源项目地址:github.com/tangshuang/…朋友们晚上好啊,这段时间我在忙着完成最新的开源项目WebCut。这个项目是我这小半年来唯一的开源新项目,这对比我过去几年的一些开源事迹来说,真的是一段低产荒。不过这是正常的,没有任何人可以长时间的一直发布新项目,这种沉寂,正是因为我把时间和精力都投入在其他事情上,所以其实是好事。之所以要发起和开源这个项目,说起来还是有些背景,下面我会来聊一聊关于这个项目的一些背景,以及过程中在技术上的一些探索。
音视频牛哥4 个月前
人工智能·音视频·音视频开发·http-flv播放器·https-flv播放器·ws-flv播放器·wss-flv播放器
从低延迟到高可用:RTMP与 HTTP/HTTPS-FLV在App播放体系中的角色重构在大牛直播SDK(SmartMediakit)的播放器体系中,RTMP 一直是“低延迟播放”的代名词:毫秒级首屏、百毫秒级端到端时延,让它在实时互动、工业视觉、无人机回传等场景中长期占据主导位置。