音视频开发

哔哩哔哩技术2 天前
音视频开发
B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩暑期,B站多媒体实验室带队参与了 ICCV MIPI (Mobile Intelligent Photography and Imaging) Workshop 的细粒度图像质量定位 (Detailed Image Quality Assessment Track) 国际挑战赛,提出创新的多模态训练策略,将综合指标提升了13.5%,最终获得了第二名的好成绩。本次参赛经历阶段性地验证了实验室在视频质量评价 (Video Quality Assessment,后文统称为 VQA) ,MLLM (Multimo
鹏多多5 天前
前端·javascript·音视频开发
前端音频兼容解决:音频神器howler.js从基础到进阶完整使用指南howler.js 是一款轻量、强大的 JavaScript 音频处理库,专为解决 Web 端音频播放的兼容性、复杂性问题而生。它基于 Web Audio API 和 HTML5 Audio 封装,提供了统一的 API 接口,可轻松实现多音频管理、3D 空间音效、音频淡入淡出、循环播放等功能,同时兼容从桌面端到移动端的几乎所有现代浏览器(包括 IE 10+)。
百度Geek说19 天前
aigc·音视频开发
百度电商MultiAgent视频生成系统随着人工智能技术的迅猛发展,AIGC(AI-Generated Content,人工智能生成内容)正逐步重塑内容创作行业的格局。尤其在视频内容领域,传统制作流程周期长、成本高、依赖人工创作,已难以满足日益增长的内容消费需求。AIGC技术的引入,为视频创作带来了前所未有的效率与可能性。AIGC工具在短视频应用率从22 年不足5%跃升到25年35%。电商场景下,越来越多的平台帮助商家进行AIGC商品视频的创作,帮助其提高商品转化率。基于上述两点,电商搜索在今年开始探索AIGC视频自动化生产方案,尝试基于视频自
字节跳动视频云技术团队21 天前
人工智能·云计算·音视频开发
字节跳动多媒体实验室联合ISCAS举办第五届神经网络视频编码竞赛ISCAS 是 IEEE 旗下电路与系统学会的旗舰国际学术会议,全称为电子电气工程师学会电路与系统国际研讨会,是世界上高度活跃的电路与系统理论、设计和实现领域研究人员的年度盛会。据悉 ISCAS2026 ****将于2026年 5 月 24 日至 5 月 27 日在我国上海举办。
x007xyz23 天前
前端·openai·音视频开发
🚀🚀🚀前端的无限可能-纯Web实现的字幕视频工具 FlyCut CaptionFlyCut Caption是我最近开源的一个项目,是一个不依赖后端,完全由前端实现的,视频编辑工具;可以通过字幕对视频进行剪辑,支持视频字幕生成,字幕视频编辑,合成导出带字幕的视频。而且这个项目是完全不依赖服务器,所有的功能都是由前端实现的,其证明了现在前端的无限可能,在AI、在多媒体领域的可行性。
CrimsonHu1 个月前
android·音视频开发
Android高性能音频:写一个云顶S10强音争霸混音器这个想法是7月底产生的。上半年云顶之弈返场 S10 强音争霸,很喜欢这个版本里面的每个羁绊自带 BGM 而且还可以组合混音的模式,但是在7月底就下线了,不知道再次返场会是什么时候。于是出于对这个模式的喜欢,就有了手搓一个混音器的想法。
bosscheng1 个月前
javascript·音视频开发
0到1理解web音视频从采集到传输到播放系列之《Jessibuca系列篇音视频解封装》本课程主要从关于Jessibuca关于JessibucaPro通过网络请求,请求到了mp4/flv/hls/webm内容。
音视频牛哥1 个月前
音视频开发·视频编码·直播
干货分享之如何设计实现跨平台超低延迟RTSP播放器适用平台:Windows / Linux(x86_64, aarch64)/ Android / iOS
音视频牛哥1 个月前
音视频开发·视频编码·直播
从RTSP播放遇到RTP无 Marker探讨RTP规范化打包与稳健切帧下面以“大牛直播SDK 的 RTSP 播放器遇到 RTP 不带 Marker 位(M bit)”为切入点,结合 RTP/RTCP 基础 与 H.264/H.265/AAC 的负载规范,说明发送端如何规范打包,以及接收端如何稳健容错(即使对端未按规范设置 Marker)。
音视频牛哥1 个月前
人工智能·计算机视觉·音视频开发
《“人工智能+”行动意见》深度解析:从智能红利到产业落地,直播模块的技术价值与应用路径随着《“人工智能+”行动意见》的正式发布,中国人工智能发展被提升到国家战略的新高度。这份政策文件不仅是一次科技领域的顶层设计,更是对中国经济社会结构性转型的回应:在人口红利逐渐消退的背景下,如何通过“智能红利”构建新的增长引擎,成为未来十年的核心命题。人工智能不再是单纯的科研热点,而被赋予了重塑生产力体系、推动治理模式创新、塑造国际竞争力的历史使命。
一支鱼1 个月前
前端·node.js·音视频开发
基于 Node.js 的短视频制作神器 ——FFCreator在当今短视频盛行的时代,快速高效地制作短视频成为了很多开发者和内容创作者的需求。FFCreator 就是一款基于 Node.js 的强大短视频制作工具库,它能帮助我们轻松实现短视频的制作与编辑。
AJi1 个月前
ffmpeg·音视频开发·视频编码
编解码原理(一):H264国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。
重启的码农1 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (5) 色彩空间转换器 (RGBToNV12)在上一章中,我们认识了流水线终点NVENC 硬件编码器封装 (NvEncoderD3D11)。我们了解到,这位剪辑师虽然工作效率极高,但它有一个小小的“偏好”:它最喜欢处理一种叫做 NV12 的特殊图像格式。
音视频牛哥2 个月前
音视频开发·视频编码·直播
RTSP流端口占用详解:TCP模式与UDP模式的对比在音视频传输协议中,RTSP(Real-Time Streaming Protocol,实时流传输协议)被广泛用于点播、直播、监控等场景。开发者在实际部署或调试时,常常会遇到一个问题:一路 RTSP 流到底占用多少个端口? 这个问题看似简单,却和传输模式密切相关。本文将结合 TCP 与 UDP 两种情况,为你做一个详细梳理。
重启的码农2 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (4) NVENC 硬件编码 (NvEncoderD3D11)在上一章 桌面复制接口 (DDAImpl) 中,我们认识了流水线中的“高速摄影师”。它为我们源源不断地提供了来自屏幕的原始图像“数字底片”。
重启的码农2 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (3) 桌面复制接口 (Desktop Duplication API)在上一章 应用程序主控 (DemoApplication) 中,我们认识了整个项目的“导演”——DemoApplication 类。
重启的码农2 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (1) 捕获-预处理-编码流水线在我们深入研究代码的细节之前,最重要的事情是理解整个应用程序的核心工作流程。想象一下,你想实现一个屏幕录制软件。你面临的第一个问题是:“我如何将屏幕上看到的动态画面,变成一个可以播放的 .mp4 或 .h264 视频文件呢?”
重启的码农2 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (2) 应用程序主控在上一章 捕获-预处理-编码流水线] 中,我们了解了整个屏幕录制过程就像一条工厂流水线。数据从捕获开始,经过预处理,最后被编码成视频。