音视频基础知识

一、颜色

1、反射

我们日常所见的不发光物体,它们都是靠反光才能让我们眼镜观察到,白色的不发光物体可以反射一切光,黑色则吸收一切光,因此不发光物体是由组成它材料的吸光性来决定的,但是计算机或者是电视屏幕等等,它们本身就是发光体,因此在数字显示的世界里,它们一般使用RGB色彩空间。

2、图像的颜色存储

在计算机中,每一幅图像往往都是一个二维矩形块,存储单位是像素点。比如一个640800大小的图片,就是横向有640个像素的,纵向有800个像素点,一共有640 800也就是512000个像素点。如果是RGB的色彩图像,每个颜色分量称为一个通道(channel)通常每个像素的每种颜色用1字节(8位)表示。为了描述图像透明的性质,又在像素上增加了一个表示透明度的分离 "Alpha" 通道。

注意:因为不同的计算机体系结构(大端小端的问题),为了数据互通,因此出现了多种不同的存储方式,例如 RGBA、ARGB 、BGRA 、ABGR等等。

二、图像

1、分辨率

显示器上横向和纵向的像素点的数量就称为显示器的分辨率,一般以宽X高表示,比如常见的1080p(1920*1080),其中p指的是逐行扫描,而1080i指的是隔行扫描。所以完整扫描一个画面并展示在显示器上是由图像的高度(行数)来决定的。这也是为什么通常称1080p或者720p的由来。

2、帧率

帧率(FPS,Frame Per Seconds)即1秒内展示的帧数。

3、视频编码

为了降低存储空间和传输带宽的占用,一般使用视频压缩技术。

  • JPEG
    人眼并不是对所有颜色都敏感,因此可以去掉一些颜色,对图像进行压缩,这个称为有损压缩。
  • H.264、H.265、VP8、 AVI等
    根据相邻帧之间的画面差异性进行压缩,即I帧、P帧、B帧。

4、YUV

需要编解码的视频图像一般不适用RGB色彩空间,而是采用YUV色彩空间,两者之间有直接的对应关系,但是由于涉及到浮点运算,因此转换过程是有损失的,但是人眼几乎是分辨不出来的。

三、声音

为了将现实的音频放到数字世界里,需要一个模数转换(ADC),也运用到了傅里叶变换。

1、PCM

模数转换中通常使用PCM(脉冲编码调制)方法,它是一种通常的将模拟信号转换成0或1表示的数字信号的方式。

相关推荐
m0_726365838 小时前
Ai漫剧系统 几分钟,让AI 把一篇小说变成了一部漫剧成片:从剧本到视频的全流程系统实现
人工智能·语言模型·ai作画·音视频
非凡ghost12 小时前
可拓浏览器:给手机浏览器装上“外挂“!2W+拓展+AI搜索,玩出无限可能!
windows·智能手机·音视频·firefox
美狐美颜SDK开放平台14 小时前
多场景美颜SDK解决方案:直播APP(iOS/安卓)开发接入详解
android·人工智能·ios·音视频·美颜sdk·第三方美颜sdk·短视频美颜sdk
ai产品老杨16 小时前
深度解析:基于国产化异构计算的 AI 视频管理平台架构——从 GB28181 接入到 NPU 边缘推流的解耦实践
人工智能·架构·音视频
watson_pillow16 小时前
音视频相关基础知识储备入门-字幕
音视频
程序员JerrySUN17 小时前
Jetson边缘嵌入式实战课程第二讲:JetPack 和 SDK Manager 是什么
c语言·开发语言·网络·udp·音视频
weixin_66819 小时前
NVIDIA VSSVideo Search and Summarization视频搜索与摘要蓝图详尽使用说明与技术报告版本
人工智能·音视频
jiayong2319 小时前
国内外视频/图像大模型与智能体工具平台竞品对比
ai·音视频·agent
视频技术分享20 小时前
技术赋能生态革新:音视频产业开启千亿增长新周期 视频会议成核心增长亮点
音视频
reasonsummer20 小时前
【教学类-160-14】20260425 AI视频培训-练习014“豆包AI视频《月下枯蔷(哥特风)》+豆包图片风格:油画”
人工智能·音视频·豆包