音视频入门基础知识

音视频技术科普

视频怎么生成的?

视频包含图像(RGB)和音频(PCM),视频编码 AVC和HEVC,音频编码 AAC,然后复用成 MP4 等格式的视频

音视频基础框架介绍:

FFmpeg、GStreamer、opencv、openGL

用途:

markdown 复制代码
编解码处理 FFmpeg GStreamer
图像分析 opencv
复杂图像生成 OpenGL

音视频细致围绕的主题:播放和采集

播放原理:

markdown 复制代码
解复用器->音频包队列(AAC)->音频解码->采样帧队列->音频处理

​				-> 视频包队列(H264)->视频解码-> 图像帧队列->图像处理

采集原理:

markdown 复制代码
麦克风->采样帧->音频处理->采样帧队列->音频编码->音频包队列->复用器(音视频封装)

摄像头->图像帧->图像处理->图像帧队列->视频编码->视频包队列->复用器(音视频封装)

视频一些基础概念

视频码率:视频文件在单位时间内使用的数据流量,码率越高越清晰,反之

视频帧率:FPS:帧率越高,给人视觉就越流畅

视频分辨率:影响视频图像的大小

I、P、B帧
markdown 复制代码
I帧:I帧不需要参考其他画面而生成,解码时仅靠自己就重构完整图像(能独立解码,也是视频第一个出现的关键帧)
P帧:解码参考前一帧的不同点来压缩本身数据
B帧:采用双向时间预测,参考前后两帧来压缩数据

音频基础技术

markdown 复制代码
采样频率:每秒钟采样的点的个数
采样精度:每个点的大小,常用大小为 8bit , 16bit,24bit
通道数:单声道、双声道、四声道
相关推荐
REDcker3 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19983 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君3 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥3 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276423 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk3 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS3 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276423 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838683 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川3 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频