音视频开发

音视频牛哥21 小时前
音视频开发·视频编码·直播
RTSP|RTMP|GB28181深度解读:如何构建系统级实时视频链路在绝大多数开发者眼中,“直播协议”意味着推流、播放、延迟与带宽。但从系统工程的视角看,协议并不仅仅是一个传输通道,而是 描述时间、状态与控制逻辑的系统契约。
音视频牛哥1 天前
人工智能·计算机视觉·音视频·音视频开发·具身智能·十五五规划具身智能·smartmediakit
SmartMediaKit:如何让智能系统早人一步“跟上现实”的时间架构--从实时流媒体到系统智能的演进智能的本质,从来不仅是“知道”,而是“反应”。在人与机器逐渐共享时空的时代,AI的挑战不再是能否理解世界,而是能否与世界同频。
快乐1012 天前
音视频开发
Media3 ExoPlayer有声音无画面分析播放有声音无画面继续从其它方面分析从日志中可以看到,错误信息ERROR: BadPortIndex(0x8000101b)
mortimer3 天前
openai·音视频开发·视频编码
视频翻译中的最后一公里:口型匹配为何如此难AI视频翻译已自动化语音识别→翻译→语音合成→字幕嵌入,但口型不匹配的“违和感”仍会破坏沉浸。口型同步(Lip Sync),是视频翻译的“最后一公里”——看似短,却障碍重重。
mortimer5 天前
ffmpeg·音视频开发·视频编码
搞懂FFmpeg中2个桀骜不驯的参数:CRF 与 Preset无论你是视频创作者、后期工程师,还是仅仅想压缩一个网络视频,都无法回避视频编码。我们永远在画质、文件体积和编码时间这“不可能三角”中寻求最佳平衡。
mortimer7 天前
ffmpeg·音视频开发
FFmpeg 拼接视频-记录我踩过的坑我用 FFmpeg 合并过上千个视频小片段,也被“命令太长”报错气得想砸键盘。这篇文章是踩坑后的思考与总结,从 MP4 容器、H.264 编码、FFmpeg 设计哲学,浅浅聊下“为啥拼接老失败”。
快乐1019 天前
音视频开发
Media3 ExoPlayer解码器初始化失败分析从日志中看DecoderInitializationException: Decoder init failed: c2.qti.avc.decoder,解码器初始化失败
mortimer9 天前
ffmpeg·音视频开发·视频编码
彻底搞懂「字幕」:从格式、软硬到嵌入,告别所有困惑“我明明把字幕加上了,为什么播放时看不到?” “为什么别人的视频能切换中英文字幕,我的就不行?” “软字幕、硬字幕、.srt、.ass……这些到底是什么鬼?”
快乐10110 天前
音视频开发
Media3 ExoPlayer获取不到TS流时长分析在使用ExoPlayer过程中发现有些TS流获取的时长为-9223372036854775807 ,就是没有正确获取到时长,返回了默认值C.TIME_UNSET
木西20 天前
音视频开发
短视频图文创作不求人:适合新手的工具推荐最近文章更新得少了,主要是在试水图文和短视频。 原因很简单:有时候文字太长,信息反而不够直观, 不如一张图、一段视频来得直接、高效。 所以,先换个方式说话,让内容“被看见”比“被读完”更重要。
哔哩哔哩技术22 天前
音视频开发
B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩暑期,B站多媒体实验室带队参与了 ICCV MIPI (Mobile Intelligent Photography and Imaging) Workshop 的细粒度图像质量定位 (Detailed Image Quality Assessment Track) 国际挑战赛,提出创新的多模态训练策略,将综合指标提升了13.5%,最终获得了第二名的好成绩。本次参赛经历阶段性地验证了实验室在视频质量评价 (Video Quality Assessment,后文统称为 VQA) ,MLLM (Multimo
鹏多多25 天前
前端·javascript·音视频开发
前端音频兼容解决:音频神器howler.js从基础到进阶完整使用指南howler.js 是一款轻量、强大的 JavaScript 音频处理库,专为解决 Web 端音频播放的兼容性、复杂性问题而生。它基于 Web Audio API 和 HTML5 Audio 封装,提供了统一的 API 接口,可轻松实现多音频管理、3D 空间音效、音频淡入淡出、循环播放等功能,同时兼容从桌面端到移动端的几乎所有现代浏览器(包括 IE 10+)。
百度Geek说1 个月前
aigc·音视频开发
百度电商MultiAgent视频生成系统随着人工智能技术的迅猛发展,AIGC(AI-Generated Content,人工智能生成内容)正逐步重塑内容创作行业的格局。尤其在视频内容领域,传统制作流程周期长、成本高、依赖人工创作,已难以满足日益增长的内容消费需求。AIGC技术的引入,为视频创作带来了前所未有的效率与可能性。AIGC工具在短视频应用率从22 年不足5%跃升到25年35%。电商场景下,越来越多的平台帮助商家进行AIGC商品视频的创作,帮助其提高商品转化率。基于上述两点,电商搜索在今年开始探索AIGC视频自动化生产方案,尝试基于视频自
字节跳动视频云技术团队1 个月前
人工智能·云计算·音视频开发
字节跳动多媒体实验室联合ISCAS举办第五届神经网络视频编码竞赛ISCAS 是 IEEE 旗下电路与系统学会的旗舰国际学术会议,全称为电子电气工程师学会电路与系统国际研讨会,是世界上高度活跃的电路与系统理论、设计和实现领域研究人员的年度盛会。据悉 ISCAS2026 ****将于2026年 5 月 24 日至 5 月 27 日在我国上海举办。
x007xyz1 个月前
前端·openai·音视频开发
🚀🚀🚀前端的无限可能-纯Web实现的字幕视频工具 FlyCut CaptionFlyCut Caption是我最近开源的一个项目,是一个不依赖后端,完全由前端实现的,视频编辑工具;可以通过字幕对视频进行剪辑,支持视频字幕生成,字幕视频编辑,合成导出带字幕的视频。而且这个项目是完全不依赖服务器,所有的功能都是由前端实现的,其证明了现在前端的无限可能,在AI、在多媒体领域的可行性。
CrimsonHu2 个月前
android·音视频开发
Android高性能音频:写一个云顶S10强音争霸混音器这个想法是7月底产生的。上半年云顶之弈返场 S10 强音争霸,很喜欢这个版本里面的每个羁绊自带 BGM 而且还可以组合混音的模式,但是在7月底就下线了,不知道再次返场会是什么时候。于是出于对这个模式的喜欢,就有了手搓一个混音器的想法。
bosscheng2 个月前
javascript·音视频开发
0到1理解web音视频从采集到传输到播放系列之《Jessibuca系列篇音视频解封装》本课程主要从关于Jessibuca关于JessibucaPro通过网络请求,请求到了mp4/flv/hls/webm内容。