音视频入门基础知识

音视频技术科普

视频怎么生成的?

视频包含图像(RGB)和音频(PCM),视频编码 AVC和HEVC,音频编码 AAC,然后复用成 MP4 等格式的视频

音视频基础框架介绍:

FFmpeg、GStreamer、opencv、openGL

用途:

markdown 复制代码
编解码处理 FFmpeg GStreamer
图像分析 opencv
复杂图像生成 OpenGL

音视频细致围绕的主题:播放和采集

播放原理:

markdown 复制代码
解复用器->音频包队列(AAC)->音频解码->采样帧队列->音频处理

​				-> 视频包队列(H264)->视频解码-> 图像帧队列->图像处理

采集原理:

markdown 复制代码
麦克风->采样帧->音频处理->采样帧队列->音频编码->音频包队列->复用器(音视频封装)

摄像头->图像帧->图像处理->图像帧队列->视频编码->视频包队列->复用器(音视频封装)

视频一些基础概念

视频码率:视频文件在单位时间内使用的数据流量,码率越高越清晰,反之

视频帧率:FPS:帧率越高,给人视觉就越流畅

视频分辨率:影响视频图像的大小

I、P、B帧
markdown 复制代码
I帧:I帧不需要参考其他画面而生成,解码时仅靠自己就重构完整图像(能独立解码,也是视频第一个出现的关键帧)
P帧:解码参考前一帧的不同点来压缩本身数据
B帧:采用双向时间预测,参考前后两帧来压缩数据

音频基础技术

markdown 复制代码
采样频率:每秒钟采样的点的个数
采样精度:每个点的大小,常用大小为 8bit , 16bit,24bit
通道数:单声道、双声道、四声道
相关推荐
永远都不秃头的程序员(互关)9 小时前
基于CANN的ops-signal仓库实现AIGC音频生成中的动态窗函数融合优化——从STFT预处理到端到端低延迟合成
aigc·音视频
薛定谔的猫喵喵9 小时前
基于PyQt5的视频答题竞赛系统设计与实现
开发语言·qt·音视频
byte轻骑兵10 小时前
从HCI报文透视LE Audio重连流程(3):音频流建立、同步与终止
音视频·蓝牙·le audio·cig/cis·广播音频
三十_A10 小时前
零基础通过 Vue 3 实现前端视频录制 —— 从原理到实战
前端·vue.js·音视频
愚公搬代码10 小时前
【愚公系列】《AI短视频创作一本通》018-AI语音及音乐的创作(短视频背景音乐的选择及创作)
人工智能·音视频
sweetone21 小时前
LINN莲CLASSIK桌面音响微修
经验分享·音视频
晚霞的不甘1 天前
CANN 编译器深度解析:UB、L1 与 Global Memory 的协同调度机制
java·后端·spring·架构·音视频
美狐美颜SDK开放平台1 天前
多终端适配下的人脸美型方案:美颜SDK工程开发实践分享
人工智能·音视频·美颜sdk·直播美颜sdk·视频美颜sdk
饭饭大王6661 天前
CANN 生态深度整合:使用 `pipeline-runner` 构建高吞吐视频分析流水线
人工智能·音视频
晚霞的不甘1 天前
CANN 编译器深度解析:TBE 自定义算子开发实战
人工智能·架构·开源·音视频