8x8离散余弦的快速精确实现使用数据流单指令多数据扩展指令集进行转换MMX 说明书

1.https://www.cs.cmu.edu/~barbic/cs-740/ap922.pdf

2.FFmpeg: libavcodec/x86/fdct.c Source File

再学FDCT快速精确实现协议改写浮点FDCT,

ffmpeg的dct使用的就是这个快速精确协议。

3.http://dspace.fcu.edu.tw/bitstream/2377/30265/1/ICM%204-1.pdf

我想如把所有余弦值用手算算出来,再用if查表应该能缩短时间,可惜数量太大,有8*8*8*8=4096个。还有一种稍微简便的方法改为1D DCT,现在用的是2D,可以缩小到2D四分之一时间。但最好的是用ffmpeg的AAN算法,但太难了,那怕是照搬复制都不容易。

网上讲,2D DCT转为1D 后,转换时间减少四分之三。我理解1D是否是分别对8行原始数据DCT后得到8行S8,,再对S8竖向取8列再DCT?编程验证一下。

8行水平DCT 循环为8*8*8,再加上垂直的DCT,共计2*8*8*8=1024 ,理论上是少了 3/4.

经程序验证。2D DCT 转为1D DCT 的步骤如下:

1.8×8 的块每行先1D DCT,

2,用每行1D DCT后的数据再生成中间8×8块 Sz,

3取Sz 每列 1D DCT 后生成的8×8数据就是2D DCT 系数

相关推荐
王璐WL4 小时前
【C语言入门级教学】函数的概念2
c语言·数据结构·算法
古城小栈6 小时前
Rust 调用 C 语言库 实战指南(企业级)
c语言·开发语言·rust
枕星而眠7 小时前
Linux 线程:原理、属性、实战与面试避坑
linux·运维·c语言·面试
码完就睡8 小时前
C语言——动态内存
c语言·开发语言
arronKler12 小时前
MySQL命令行导出数据库
c语言·数据库·mysql
我命由我1234513 小时前
Android Framework P3 - MediaServer 进程、认识 ServiceManager 进程
android·c语言·开发语言·c++·visualstudio·visual studio·android runtime
三易串口屏13 小时前
实验1 实时显示单片机的参数(整数、小数、中文 系统指令方式)
c语言·单片机·嵌入式硬件·mongodb·串口屏·三易串口屏
聆风吟º14 小时前
深入理解C语言 isupper 函数详解:判断字符是否为大写字母
c语言·开发语言·库函数·字符处理·isupper
東隅已逝,桑榆非晚15 小时前
深度解析数据内存存储与排布规则
c语言·笔记
weixin_4217252615 小时前
C语言、C++与C#深度研究报告:从底层控制到现代企业级开发的演进
c语言·c++·c·内存管理·编译模型