音视频入门基础知识

音视频技术科普

视频怎么生成的?

视频包含图像(RGB)和音频(PCM),视频编码 AVC和HEVC,音频编码 AAC,然后复用成 MP4 等格式的视频

音视频基础框架介绍:

FFmpeg、GStreamer、opencv、openGL

用途:

markdown 复制代码
编解码处理 FFmpeg GStreamer
图像分析 opencv
复杂图像生成 OpenGL

音视频细致围绕的主题:播放和采集

播放原理:

markdown 复制代码
解复用器->音频包队列(AAC)->音频解码->采样帧队列->音频处理

​				-> 视频包队列(H264)->视频解码-> 图像帧队列->图像处理

采集原理:

markdown 复制代码
麦克风->采样帧->音频处理->采样帧队列->音频编码->音频包队列->复用器(音视频封装)

摄像头->图像帧->图像处理->图像帧队列->视频编码->视频包队列->复用器(音视频封装)

视频一些基础概念

视频码率:视频文件在单位时间内使用的数据流量,码率越高越清晰,反之

视频帧率:FPS:帧率越高,给人视觉就越流畅

视频分辨率:影响视频图像的大小

I、P、B帧
markdown 复制代码
I帧:I帧不需要参考其他画面而生成,解码时仅靠自己就重构完整图像(能独立解码,也是视频第一个出现的关键帧)
P帧:解码参考前一帧的不同点来压缩本身数据
B帧:采用双向时间预测,参考前后两帧来压缩数据

音频基础技术

markdown 复制代码
采样频率:每秒钟采样的点的个数
采样精度:每个点的大小,常用大小为 8bit , 16bit,24bit
通道数:单声道、双声道、四声道
相关推荐
阿里巴巴淘系技术团队官网博客2 小时前
TLiveOmni 1.0: 直播视频多模态理解大模型
音视频
Wilbert Lee5 小时前
关于 Adobe Audition CC 2018 多轨音频 VBR 格式导出时长的问题
adobe·音视频
开开心心就好10 小时前
用户推荐的文件解锁与强制操作工具
安全·智能手机·pdf·scala·音视频·symfony·1024程序员节
luoqice10 小时前
linux下安装rtsp流媒体服务器
linux·音视频
searchforAI11 小时前
5款AI笔记工具实测:导入体验、结构化输出、后续能力逐项对比
人工智能·笔记·学习·ai·chatgpt·aigc·音视频
nashane12 小时前
HarmonyOS 6学习:SoundPool音频防抖与Web长截图时序重构
学习·音视频·harmonyos·harmonyos 5
ACP广源盛1392462567312 小时前
OpenAI 推出的 GPT-5.5 大模型,倒逼接口芯片升级迭代@ACP#IX8024应用迭代
网络·人工智能·嵌入式硬件·电脑·音视频
ACP广源盛1392462567312 小时前
OpenAI 推出的 GPT-5.5 大模型,倒逼接口芯片升级迭代@ACP#IX8012应用迭代
大数据·网络·人工智能·嵌入式硬件·电脑·音视频
java小吕布13 小时前
HyperFrames:写 HTML 就能渲染视频,专为 AI 智能体打造的开源渲染框架
人工智能·html·音视频
2601_957879331 天前
短视频矩阵的数据驱动运营:从流量监测到内容迭代的完整技术链路
大数据·矩阵·音视频