视频编码

音视频牛哥4 天前
音视频开发·视频编码·直播
全面解读Android平台GB28181接入方案:SmartGBD的技术实现与应用随着智能化技术的飞速发展,视频监控系统已经渗透到社会各个领域,从城市安全到交通监控,再到智慧教育和车载终端,几乎每个行业都离不开高效的监控和数据传输系统。在此背景下,GB28181协议作为中国公共安全视频监控的国家标准,扮演着至关重要的角色。它不仅定义了视频监控设备与平台之间的数据交换与控制机制,还为实现多设备、多平台的互联互通提供了强有力的技术保障。
音视频牛哥5 天前
音视频开发·视频编码·直播
RTSP|RTMP|GB28181深度解读:如何构建系统级实时视频链路在绝大多数开发者眼中,“直播协议”意味着推流、播放、延迟与带宽。但从系统工程的视角看,协议并不仅仅是一个传输通道,而是 描述时间、状态与控制逻辑的系统契约。
mortimer7 天前
openai·音视频开发·视频编码
视频翻译中的最后一公里:口型匹配为何如此难AI视频翻译已自动化语音识别→翻译→语音合成→字幕嵌入,但口型不匹配的“违和感”仍会破坏沉浸。口型同步(Lip Sync),是视频翻译的“最后一公里”——看似短,却障碍重重。
mortimer9 天前
ffmpeg·音视频开发·视频编码
搞懂FFmpeg中2个桀骜不驯的参数:CRF 与 Preset无论你是视频创作者、后期工程师,还是仅仅想压缩一个网络视频,都无法回避视频编码。我们永远在画质、文件体积和编码时间这“不可能三角”中寻求最佳平衡。
mortimer13 天前
ffmpeg·音视频开发·视频编码
彻底搞懂「字幕」:从格式、软硬到嵌入,告别所有困惑“我明明把字幕加上了,为什么播放时看不到?” “为什么别人的视频能切换中英文字幕,我的就不行?” “软字幕、硬字幕、.srt、.ass……这些到底是什么鬼?”
字节跳动视频云技术团队1 个月前
云计算·视频编码
多媒体实验室画质理解大模型Q-Insight入选NeurIPS 2025 Spotlight近日,NeurIPS 2025公布了录用结果,该会议是机器学习与人工智能领域最具影响力的国际顶级学术会议之一。据悉本次会议共有21575篇投稿进入审稿阶段,最终5290篇论文被录用,录用论文中共有688篇论文(入选比例3%)被选为亮点文章(Spotlight)。
木西1 个月前
视频编码·直播
免费开源神器:OBS 直播+录屏一键搞定OBS Studio 是一款完全免费、开源、无广告的「直播 + 录屏」全能工具,支持 Windows / macOS / Linux,一套配置即可同时完成本地高画质录制与多平台推流直播,是新手和职业主播的标配。
_AaronWong1 个月前
前端·electron·视频编码
Electron视频黑屏之谜:从H265编码到GPU禁用的深度排查最近,我们接到了用户反馈:在我们的Electron客户端内,部分视频无法正常播放。具体表现为:进度条在动,声音也能正常播放,但画面区域始终是一片漆黑。
音视频牛哥2 个月前
音视频开发·视频编码·直播
干货分享之如何设计实现跨平台超低延迟RTSP播放器适用平台:Windows / Linux(x86_64, aarch64)/ Android / iOS
音视频牛哥2 个月前
音视频开发·视频编码·直播
从RTSP播放遇到RTP无 Marker探讨RTP规范化打包与稳健切帧下面以“大牛直播SDK 的 RTSP 播放器遇到 RTP 不带 Marker 位(M bit)”为切入点,结合 RTP/RTCP 基础 与 H.264/H.265/AAC 的负载规范,说明发送端如何规范打包,以及接收端如何稳健容错(即使对端未按规范设置 Marker)。
AJi2 个月前
ffmpeg·音视频开发·视频编码
编解码原理(一):H264国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。
音视频牛哥2 个月前
音视频开发·视频编码·直播
RTSP流端口占用详解:TCP模式与UDP模式的对比在音视频传输协议中,RTSP(Real-Time Streaming Protocol,实时流传输协议)被广泛用于点播、直播、监控等场景。开发者在实际部署或调试时,常常会遇到一个问题:一路 RTSP 流到底占用多少个端口? 这个问题看似简单,却和传输模式密切相关。本文将结合 TCP 与 UDP 两种情况,为你做一个详细梳理。
音视频牛哥3 个月前
音视频开发·视频编码·直播
RTSP/RTMP vs WebRTC:实时视频技术选型的务实之路在实时视频的技术选型中,WebRTC 曾一度被许多团队视为“唯一的正确答案”。凭借浏览器原生支持、点对点传输以及端到端的低时延特性,它确实在在线会议、互动课堂等场景中展现了极大优势。然而,当这些团队尝试把同一套方案推广到更广阔的行业领域时,比如安防巡检、工业监控、医疗观摩、低空经济无人机视频回传、机器人远程操控等,就逐渐暴露出“错配”的问题。
音视频牛哥3 个月前
音视频开发·视频编码·直播
跨平台 RTSP/RTMP 播放器工程化实践:低延迟与高稳定性的挑战与突破在实时视频系统中,播放器常常被误解为一个“简单环节”——拉流、解码、渲染,流程看似清晰明了。但真正的挑战并不在于能否快速跑通一个 Demo,而在于能否在 复杂网络、海量终端、苛刻延迟 的现实场景中,依旧保持稳定、流畅和低时延。
音视频牛哥3 个月前
音视频开发·视频编码·直播
从 H.264/H.265 到 H.266:RTSP播放器的跨代际演进视频编解码的发展历程,始终是 带宽效率与视觉体验的博弈。从 H.264 的普及,到 H.265/HEVC 的深化应用,每一次标准迭代,都在推动视频向更高分辨率、更高帧率、更复杂场景的应用迈进。而 H.266(VVC,Versatile Video Coding)的出现,则被认为是 面向未来十年的关键拐点:它在相同画质下相较 H.265 可节省 30–50% 的码率,为 4K/8K 超高清、XR 沉浸式体验、低空经济中的无人机回传、远程医疗手术视频、工业检测等高带宽场景,带来了现实可行的传输条件。
字节跳动视频云技术团队3 个月前
aigc·音视频开发·视频编码
基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案,助力短剧出海当短剧出海、跨境电商等新兴领域打造全球化内容时,面临着一个棘手的基础问题——原始视频的中文字幕。原始字幕对于海外观众来说,不仅是无效信息,还严重干扰观看体验。传统方案——直接添加对应外语字幕会导致画面杂乱,而使用马赛克或基于 GAN 的字幕擦除补全方案会导致画面模糊、帧间闪烁,都无法彻底解决这一挑战,使得优质内容的出海之路障碍重重。
音视频牛哥3 个月前
音视频开发·视频编码·直播
跨平台轻量级RTSP服务模块技术详解与内网低延迟直播实践在安防视频监控、教育培训、工业生产、医疗健康、智能物联网等领域,内网超低延迟音视频传输不仅是业务刚需,更是系统体验优劣的关键分水岭。无论是工厂生产线的实时监控、智慧教室的互动教学,还是手术室的多终端视频同步,这类场景对链路延迟、部署灵活性和稳定性都有着极高要求。
音视频牛哥3 个月前
音视频开发·视频编码·直播
SmartMediaKit 模块化音视频框架实战指南:场景链路 + 能力矩阵全解析自 2015 年起,大牛直播SDK(SmartMediaKit)便致力于打造一个可深度嵌入、跨平台兼容、模块自由组合的实时音视频基础能力框架。经过多轮技术迭代与场景打磨,该 SDK 已覆盖 Windows / Linux / Android / iOS / Unity 等主流平台,并在 RTSP / RTMP / HTTP-FLV 等协议支持、超低延迟播放、稳定推送、流转发、多通路录制、国标对接 等方面建立了完整的产品能力矩阵。
程序员老舅3 个月前
c++·ffmpeg·音视频·视频编码·h264·音视频编解码·视频解码
C++音视频开发:基础面试题音视频领域技术门槛高,学习资料稀缺,体系化书籍和开发工具有限,新手入门困难。音视频开发涉及众多任务:音频(采集、编解码、降噪等)、视频(采集、编解码、图像处理)、实时传输(RTP/RTCP、RTMP、HLS)、存储与播放等,要求扎实的理论基础和工程经验,自学难度大。