技术栈
音视频开发
u130130
3 天前
前端
·
音视频开发
·
流媒体
·
hls
·
m3u8
深入理解 M3U8 与 HLS 协议:从原理到实战解析
在做音视频开发或处理流媒体业务时,我们经常会接触到后缀为 .m3u8 的文件。很多初学者会误以为它是一个视频文件,实际上,M3U8 并不是视频,而是一个索引文件。
字节架构前端
12 天前
前端
·
chrome
·
音视频开发
媒体采集标准草案 与 Chromium 音频采集实现简介
Media Capture and Streams 是由 W3C WebRTC Working Group 提出的规范草案,主要定义了获取本地媒体的 JavaScript API。目前该草案处于 CRD (Candidate Recommend Draft) 状态,也可以被称为技术报告(Technical Report, TR)
Tiny_React
16 天前
人工智能
·
音视频开发
·
vibecoding
使用 Claude Code Skills 模拟的视频生成流程
本文档模拟从创建项目到完成的完整流程,包括火山引擎流程和 Sora 流程。场景:创建一个关于友谊的绘本视频
hk1124
25 天前
ffmpeg
·
边缘计算
·
音视频开发
·
h.265
·
测试数据集
【音视频/边缘计算】2025年度H.265/HEVC高并发解码与画质修复(Super-Resolution)基准测试报告(含沙丘/失控玩家核心样本)
⚠️ 仿真数据合规与免责声明 (Data Compliance Disclaimer)本文提供的所有测试码流(Bitstream)均截取自公开出版的影视作品或虚拟引擎渲染片段。所有场景仅作为画质抗损耗测试、编解码压力测试及色彩还原度分析的基准参考(Benchmark)。本数据集仅供技术研究与算法调优使用,请勿用于商业分发,测试完成后请及时清理缓存。
李小轰_Rex
1 个月前
android
·
音视频开发
把手机变成听诊器!摄像头 30 秒隔空测心率 - 开箱即用
关键词:rPPG、非接触心率、Android、CameraX、MediaPipe、POS 算法、开源 Demo 源码地址:github.com/liyufengrex…
李小轰_Rex
1 个月前
android
·
音视频开发
纯算法AEC:播录并行场景的回声消除实战笔记
最近在做一款 AI 语音应用,场景类似“实时通话”:一边让 TTS 播报,一边把麦克风打开做 STT。
否子戈
1 个月前
前端
·
音视频开发
·
ui kit
WebCut前端视频编辑UI框架一周开源进度
自从上次发布了WebCut的开源信息之后,获得了非常多小伙伴的关注,也有很多小伙伴还不知道,所以我打算写一些更新进度文章,让关注的小伙伴了解WebCut的最新进展。
SHERlocked93
1 个月前
c++
·
后端
·
音视频开发
摄像头 RTSP 流视频多路实时监控解决方案实践
本文记录我在摄像头 RTSP 流视频多路实时监控项目里,落地的一套「多路 RTSP 低延迟播放」方案的全过程:从选型、编码、到 Web/桌面端播放与硬解优化。
mortimer
2 个月前
python
·
ffmpeg
·
音视频开发
Python + FFmpeg 视频自动化处理指南:从硬件加速到精确剪辑
在 Python 中调用 subprocess.run 执行 FFmpeg 命令是视频自动化处理的常见方案。然而,面对 Windows/Linux/macOS 的跨平台兼容性、NVIDIA/Intel/AMD/Apple 的硬件加速差异,以及“拼接黑帧”、“音画不同步”等经典坑点,写出一套健壮的代码并不容易。
否子戈
2 个月前
前端框架
·
音视频开发
·
视频编码
做中国人自己的视频编辑UI框架,WebCut正式开源
项目地址:github.com/tangshuang/…朋友们晚上好啊,这段时间我在忙着完成最新的开源项目WebCut。这个项目是我这小半年来唯一的开源新项目,这对比我过去几年的一些开源事迹来说,真的是一段低产荒。不过这是正常的,没有任何人可以长时间的一直发布新项目,这种沉寂,正是因为我把时间和精力都投入在其他事情上,所以其实是好事。之所以要发起和开源这个项目,说起来还是有些背景,下面我会来聊一聊关于这个项目的一些背景,以及过程中在技术上的一些探索。
音视频牛哥
2 个月前
人工智能
·
音视频
·
音视频开发
·
http-flv播放器
·
https-flv播放器
·
ws-flv播放器
·
wss-flv播放器
从低延迟到高可用:RTMP与 HTTP/HTTPS-FLV在App播放体系中的角色重构
在大牛直播SDK(SmartMediakit)的播放器体系中,RTMP 一直是“低延迟播放”的代名词:毫秒级首屏、百毫秒级端到端时延,让它在实时互动、工业视觉、无人机回传等场景中长期占据主导位置。
音视频牛哥
2 个月前
人工智能
·
计算机视觉
·
音视频
·
音视频开发
·
rtsp播放器
·
安卓rtsp服务器
·
安卓实现ipc功能
轻量级RTSP服务的工程化设计与应用:从移动端到边缘设备的实时媒体架构
在实际的音视频系统中,RTSP 依然是设备端、行业端、AIoT 端最稳定、最普遍的实时视频协议之一。 与 WebRTC、RTMP、HTTP-FLV 这些偏“互联网直播分发”的协议不同,RTSP 更强调:
快乐101
2 个月前
音视频开发
Media3 ExoPlayer无法播放不带.m3u8后缀hls媒资
播放报错None of the available extractors (没有可用的媒资提取器) , 错误码 ERROR_CODE_PARSING_CONTAINER_UNSUPPORTED (表示解析媒体容器格式错误)
_AaronWong
2 个月前
前端
·
vue.js
·
音视频开发
基于 Vue 3 的屏幕音频捕获实现:从原理到实践
在日常开发中,我们经常会遇到需要录制音频的场景,比如在线会议、语音笔记、教学录制等。传统的音频录制通常只能捕获麦克风输入,但在某些场景下,我们可能需要录制系统音频,也就是电脑正在播放的声音。
快手技术
2 个月前
音视频开发
超越 VTM-RA!快手双向智能视频编码器 BRHVC 亮相 NeurIPS2025
在视频编码领域,双向编码(RA 模式)一直是高效压缩的“秘密武器”,长期以来被广泛应用于点播、视频存储等场景。然而,在基于深度学习的智能视频编码中,这项技术也面临新的挑战:双向编码采用复杂的大跨度分层参考结构,这导致运动的精确处理变得困难,参考帧的价值利用也存在明显差异。双向智能视频编码的潜力远未被完全激发,仍有巨大的优化空间等待探索。
快乐101
2 个月前
音视频开发
Media3 ExoPlayer扩展切换声道能力
ExoPlayer并没有提供切换左右声道的接口,对于单音轨歌曲切换原伴唱就需要自己实现切换左右声道的能力了。
yangguang
2 个月前
音视频开发
音视频开发全景图:播放器是怎样炼成的
想象一下,你打开一个视频播放器,点击播放按钮:这 0.5 秒内,计算机做了什么?让我们揭开这层神秘面纱。
政采云技术
3 个月前
前端
·
音视频开发
音视频通用组件设计探索和应用
业务层面,基于国家发展改革委办公厅日前印发关于加快推广远程异地评标的通知,部署在全国范围内加快推广远程异地评标,重在解决传统的评标问题,提升整体的公平性和公正性,优化专家资源的评标配置,音视频作为整个业务流程中评标环节关键的桥梁,起着重大的作用。
Android疑难杂症
3 个月前
android
·
harmonyos
·
音视频开发
鸿蒙Media Kit媒体服务开发快速指南
Media Kit是HarmonyOS提供的媒体服务框架,提供音视频播放、录制、编解码等全方位的媒体处理能力。
mortimer
3 个月前
python
·
ffmpeg
·
音视频开发
一键实现人声伴奏分离:基于 `uv`, `FFmpeg` 和 `audio-separator` 的高效解决方案
本文将分享一个用于音频源分离(特别是人声与伴奏分离)的自动化脚本和工作流。该方案利用了 audio-separator 库、FFmpeg 进行媒体预处理,并通过 uv 实现了一个免手动配置、依赖自包含的执行环境。