音视频开发

x007xyz2 天前
前端·openai·音视频开发
🚀🚀🚀前端的无限可能-纯Web实现的字幕视频工具 FlyCut CaptionFlyCut Caption是我最近开源的一个项目,是一个不依赖后端,完全由前端实现的,视频编辑工具;可以通过字幕对视频进行剪辑,支持视频字幕生成,字幕视频编辑,合成导出带字幕的视频。而且这个项目是完全不依赖服务器,所有的功能都是由前端实现的,其证明了现在前端的无限可能,在AI、在多媒体领域的可行性。
CrimsonHu12 天前
android·音视频开发
Android高性能音频:写一个云顶S10强音争霸混音器这个想法是7月底产生的。上半年云顶之弈返场 S10 强音争霸,很喜欢这个版本里面的每个羁绊自带 BGM 而且还可以组合混音的模式,但是在7月底就下线了,不知道再次返场会是什么时候。于是出于对这个模式的喜欢,就有了手搓一个混音器的想法。
bosscheng13 天前
javascript·音视频开发
0到1理解web音视频从采集到传输到播放系列之《Jessibuca系列篇音视频解封装》本课程主要从关于Jessibuca关于JessibucaPro通过网络请求,请求到了mp4/flv/hls/webm内容。
音视频牛哥17 天前
音视频开发·视频编码·直播
干货分享之如何设计实现跨平台超低延迟RTSP播放器适用平台:Windows / Linux(x86_64, aarch64)/ Android / iOS
音视频牛哥17 天前
音视频开发·视频编码·直播
从RTSP播放遇到RTP无 Marker探讨RTP规范化打包与稳健切帧下面以“大牛直播SDK 的 RTSP 播放器遇到 RTP 不带 Marker 位(M bit)”为切入点,结合 RTP/RTCP 基础 与 H.264/H.265/AAC 的负载规范,说明发送端如何规范打包,以及接收端如何稳健容错(即使对端未按规范设置 Marker)。
音视频牛哥19 天前
人工智能·计算机视觉·音视频开发
《“人工智能+”行动意见》深度解析:从智能红利到产业落地,直播模块的技术价值与应用路径随着《“人工智能+”行动意见》的正式发布,中国人工智能发展被提升到国家战略的新高度。这份政策文件不仅是一次科技领域的顶层设计,更是对中国经济社会结构性转型的回应:在人口红利逐渐消退的背景下,如何通过“智能红利”构建新的增长引擎,成为未来十年的核心命题。人工智能不再是单纯的科研热点,而被赋予了重塑生产力体系、推动治理模式创新、塑造国际竞争力的历史使命。
一支鱼21 天前
前端·node.js·音视频开发
基于 Node.js 的短视频制作神器 ——FFCreator在当今短视频盛行的时代,快速高效地制作短视频成为了很多开发者和内容创作者的需求。FFCreator 就是一款基于 Node.js 的强大短视频制作工具库,它能帮助我们轻松实现短视频的制作与编辑。
AJi21 天前
ffmpeg·音视频开发·视频编码
编解码原理(一):H264国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。
重启的码农24 天前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (5) 色彩空间转换器 (RGBToNV12)在上一章中,我们认识了流水线终点NVENC 硬件编码器封装 (NvEncoderD3D11)。我们了解到,这位剪辑师虽然工作效率极高,但它有一个小小的“偏好”:它最喜欢处理一种叫做 NV12 的特殊图像格式。
音视频牛哥25 天前
音视频开发·视频编码·直播
RTSP流端口占用详解:TCP模式与UDP模式的对比在音视频传输协议中,RTSP(Real-Time Streaming Protocol,实时流传输协议)被广泛用于点播、直播、监控等场景。开发者在实际部署或调试时,常常会遇到一个问题:一路 RTSP 流到底占用多少个端口? 这个问题看似简单,却和传输模式密切相关。本文将结合 TCP 与 UDP 两种情况,为你做一个详细梳理。
重启的码农25 天前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (4) NVENC 硬件编码 (NvEncoderD3D11)在上一章 桌面复制接口 (DDAImpl) 中,我们认识了流水线中的“高速摄影师”。它为我们源源不断地提供了来自屏幕的原始图像“数字底片”。
重启的码农25 天前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (3) 桌面复制接口 (Desktop Duplication API)在上一章 应用程序主控 (DemoApplication) 中,我们认识了整个项目的“导演”——DemoApplication 类。
重启的码农1 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (1) 捕获-预处理-编码流水线在我们深入研究代码的细节之前,最重要的事情是理解整个应用程序的核心工作流程。想象一下,你想实现一个屏幕录制软件。你面临的第一个问题是:“我如何将屏幕上看到的动态画面,变成一个可以播放的 .mp4 或 .h264 视频文件呢?”
重启的码农1 个月前
c++·云计算·音视频开发
云游戏技术之高速截屏和GPU硬编码 (2) 应用程序主控在上一章 捕获-预处理-编码流水线] 中,我们了解了整个屏幕录制过程就像一条工厂流水线。数据从捕获开始,经过预处理,最后被编码成视频。
不午睡的探索者1 个月前
c++·github·音视频开发
音视频开发入门:FFmpeg vs GStreamer本文参考自 GitHub 项目:awesome_audio_video_learning音视频技术,作为当今互联网的兵家必争之地,正吸引着越来越多的开发者。从短视频、直播到在线会议,其背后都离不开强大的音视频处理框架。如果你想进入这个领域,FFmpeg 和 GStreamer 是你绕不开的两座大山。
Points1 个月前
harmonyos·音视频开发
开源项目:OpenHarmony WMA音频解码器本项目是参加OpenHarmony多媒体编解码竞赛的参赛作品,旨在为OpenHarmony平台开发一个完整的WMA音频解码器,支持WMA V1/V2/PRO格式解码,提供NDK接口和ArkTS应用层。
李姆斯1 个月前
前端·webrtc·音视频开发
数据与直播画面“神同步”——SEI(补充增强信息)我在过去的一年多中的大部分时间都在和webrtc直播打交道,这一年中,有不少需求都要求dom或canvas的渲染需要和直播画面有着帧级的同步渲染。这个需求抽象出来可以用一句话概括:如何将和每一帧画面强相关的业务数据与直播帧进行同步传输和同步解析?
巴厘猫1 个月前
python·音视频开发
从 Manim 中提取表格 / 坐标系并转 GIF:实用方案与核心代码在数据可视化和数学动画创作中,我们经常需要将 Manim 动画中的表格、坐标系等核心元素单独导出为 GIF。本文整理了四种高效方案,每种方案仅提供核心代码,聚焦关键实现逻辑。
不午睡的探索者1 个月前
c++·github·音视频开发
FFmpeg + WebRTC:音视频开发的两大核心利器在当今的互联网世界,音视频技术已无处不在。从短视频、直播到在线会议,这些应用的背后都离不开强大的音视频技术栈。而在众多技术中,FFmpeg 和 WebRTC 无疑是最核心、最值得深入学习的两大支柱。
哔哩哔哩技术1 个月前
音视频开发
为什么我的 TLS 1.3 多了一个 RTT在正文开始之前,先简要介绍一下 TLS 1.3 与 TLS 1.2 有哪些主要差异:1. 更快的响应速度: