音视频开发

音视频牛哥9 小时前
机器学习·机器人·音视频开发
从「行走」到「思考」:机器人进化之路与感知—决策链路的工程化实践近年来,人形机器人和具身智能频频登上舞台,从马拉松式的步态演示到竞技擂台上的“对打”,一次次制造着社交媒体上的话题热度。然而,炫技过后留下的核心问题是:机器人能否真正走出实验室与秀场,进入工厂车间、医疗手术室、家庭客厅,承担起生产与生活中的真实任务?
chenchao_shenzhen4 天前
ffmpeg·音视频·rk3588·音视频开发·嵌入式开发·瑞芯微rk3568·硬件编解码
RK3568嵌入式音视频硬件编解码4K 60帧 rkmpp FFmpeg7.1 音视频开发RK3568嵌入式音视频硬件编解码4K 60帧 rkmpp FFmpeg7.1 音视频开发1 rkmpp 是瑞芯微提供的多媒体处理平台,主要用于硬件加速的视频编解码,通过调用芯片内置的视频处理单元(如 VPU)来实现高效的视频编码和解码。它是 Rockchip 芯片(如 RK356x、RK3588 等)多媒体处理的核心组件,广泛应用于嵌入式设备、视频监控、流媒体等场景。
码流怪侠6 天前
深度学习·音视频开发
Google SoundStream音频编解码器技术解析在当今数字化时代,音频编解码器作为流媒体、视频会议和语音通信的核心技术,其性能直接影响用户体验和网络资源消耗。传统编解码器如Opus和EVS虽然在中低比特率下表现出色,但在极低比特率(≤3 kbps)场景下质量急剧下降。为解决这一挑战,Google于2021年推出了SoundStream——一种基于神经网络的端到端音频编解码器,开创了音频压缩的新纪元。
字节跳动视频云技术团队7 天前
aigc·音视频开发·视频编码
基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案,助力短剧出海当短剧出海、跨境电商等新兴领域打造全球化内容时,面临着一个棘手的基础问题——原始视频的中文字幕。原始字幕对于海外观众来说,不仅是无效信息,还严重干扰观看体验。传统方案——直接添加对应外语字幕会导致画面杂乱,而使用马赛克或基于 GAN 的字幕擦除补全方案会导致画面模糊、帧间闪烁,都无法彻底解决这一挑战,使得优质内容的出海之路障碍重重。
音视频牛哥8 天前
音视频开发·视频编码·直播
跨平台轻量级RTSP服务模块技术详解与内网低延迟直播实践在安防视频监控、教育培训、工业生产、医疗健康、智能物联网等领域,内网超低延迟音视频传输不仅是业务刚需,更是系统体验优劣的关键分水岭。无论是工厂生产线的实时监控、智慧教室的互动教学,还是手术室的多终端视频同步,这类场景对链路延迟、部署灵活性和稳定性都有着极高要求。
音视频牛哥12 天前
音视频开发·视频编码·直播
SmartMediaKit 模块化音视频框架实战指南:场景链路 + 能力矩阵全解析自 2015 年起,大牛直播SDK(SmartMediaKit)便致力于打造一个可深度嵌入、跨平台兼容、模块自由组合的实时音视频基础能力框架。经过多轮技术迭代与场景打磨,该 SDK 已覆盖 Windows / Linux / Android / iOS / Unity 等主流平台,并在 RTSP / RTMP / HTTP-FLV 等协议支持、超低延迟播放、稳定推送、流转发、多通路录制、国标对接 等方面建立了完整的产品能力矩阵。
子龙_13 天前
前端·javascript·音视频开发
JS解析wav音频数据并使用wasm加速本文探讨两个方面的内容,一个是wav音频数据的解析,另一个是使用wasm对其实现加速第一部分我们先讲音频数据是如何存储在计算机上的,对其结构了然,才能更深入一步。
泉城老铁14 天前
java·vue.js·音视频开发
Spring Boot + Vue + ZLMediaKit 实现 RTSP 拉流播放的完整方案以下是基于 Spring Boot + Vue + ZLMediaKit 实现 RTSP 拉流播放的完整方案,包含架构设计、关键代码和注意事项:
百度Geek说14 天前
音视频开发
播放器音频后处理实践(一)在现代播放器架构中,音频后处理已不仅是锦上添花的功能,而是构建差异化听觉体验的关键组件。尤其在多样化的播放场景(手机外放、耳机、电视音响等)下,通过定制化的音效增强手段,有效提升听感表现已成为基础能力之一。
字节跳动视频云技术团队14 天前
aigc·音视频开发·webvr
探秘史前海洋,火山引擎 x 北京天卓视创带你沉浸式“摸鱼”!这个夏天,北京凤凰中心迎来一场穿越时空的深海奇遇!由中国科学院古脊椎动物与古人类研究所与国内沉浸式体验引领者——北京天卓视创科技有限公司(ONEK MR+)历时一年半联合打造的 VR-LBE 沉浸式体验剧《最后的特提斯之海》,在火山引擎云 XR 技术支持下,配合"触探深海"主题展震撼开启。
音视频牛哥17 天前
人工智能·计算机视觉·音视频开发
智能平台的感知进化:AI × 视频通感在群体终端协同中的应用探索从传统的单兵执行任务到如今的“群体智能平台编组”,现代感知系统正经历一场由 AI、机器人与智能计算平台驱动的深度变革。过去,履带式无人平台在平坦地形中承担支援任务,而今,具备复杂地形通行能力、自主决策与任务执行能力的四足智能地面终端,正逐步成为未来任务体系中的关键节点。
音视频牛哥18 天前
机器人·音视频开发·视频编码
H.266 vs H.265/AV1/H.264:从工程落地看下一代视频系统的技术演进视频编码标准的更迭,从未只是一次简单的技术升级,而是对码率压缩效率、编码复杂度与画质质量三者之间平衡点的持续探索。在 H.264 成为全平台事实标准的十余年里,它成功支撑了 SD 至 1080P 的视频消费浪潮;而随着 4K/8K 超高清视频、VR/AR 沉浸式应用和实时互动直播的迅速崛起,H.264 在压缩效率和带宽控制上的瓶颈已愈发明显。
音视频牛哥18 天前
机器人·音视频开发·视频编码
8K、AI、低空智联,H.266能否撑起下一代视频通路?随着生成式 AI、大模型推理、多模态理解等技术的迅猛发展,视频数据从“记录工具”转变为“感知基础设施”,其在现代智能系统中的战略地位日益凸显。
solo_9918 天前
音视频开发
解决音视频开发中 因mp4中断 无法播放的问题在录制视频的过程中,可能因为一些意外原因,造成视频中断。让视频无法播放。研究了一些处理方法。更换录制的视频格式,直接换成TS文件 解决Android录制视频时异常断电或apk闪退导致视频播放不了问题
音视频牛哥19 天前
人工智能·机器学习·音视频开发
Android端RTMP低延迟播放器在工业与智能场景下的架构与落地近年来,随着 5G 网络普及与高性能移动芯片的发展,实时视频 在移动端的应用正以前所未有的速度扩张。从内容分发到行业应用,RTMP 等经典流媒体协议依然是移动端低延迟视频传输的中坚力量,尤其在以下几类场景中扮演关键角色:
裘乡20 天前
前端·音视频开发
vonage音视频基本使用--web@opentok/client总体来说,vonage算是比较偏向于原生的一个音视频三方包,提供了很多类似原生的api,有些甚至就是原生的api接口包了一层。而这样的一种形式也给开发带来了比较舒适的体验,能很清楚的了解到他的整个运行逻辑,不像腾讯音视频一样,封装了很多层,添加了很多他们自己的功能和服务,vonage更偏向于开发者自行去添加功能,去扩充。
音视频牛哥22 天前
音视频开发·视频编码·直播
可控、安全、可集成:安防RTSP|RTMP视频播放模块工程实践参考在数字化浪潮不断推进的当下,音视频已成为众多行业的“基础设施”:从安防监控、工业视觉,到远程操控、AI 分析、XR 虚拟互动,实时音视频技术不仅要求“能用”,更讲究“稳定、低延迟、可控、易集成”。
音视频牛哥23 天前
人工智能·机器人·音视频开发
如何打造毫秒级响应的RTSP播放器:架构拆解与实战优化指南在安防监控、工业视觉、远程机器人操控、无人机图传、医疗会诊等对实时性与稳定性高度敏感的应用中,RTSP 播放器作为前端图像展示的“最后一公里”,其性能表现直接关系到整个系统的响应效率、操控流畅度与决策时效性。