8x8离散余弦的快速精确实现使用数据流单指令多数据扩展指令集进行转换MMX 说明书

1.https://www.cs.cmu.edu/~barbic/cs-740/ap922.pdf

2.FFmpeg: libavcodec/x86/fdct.c Source File

再学FDCT快速精确实现协议改写浮点FDCT,

ffmpeg的dct使用的就是这个快速精确协议。

3.http://dspace.fcu.edu.tw/bitstream/2377/30265/1/ICM%204-1.pdf

我想如把所有余弦值用手算算出来,再用if查表应该能缩短时间,可惜数量太大,有8*8*8*8=4096个。还有一种稍微简便的方法改为1D DCT,现在用的是2D,可以缩小到2D四分之一时间。但最好的是用ffmpeg的AAN算法,但太难了,那怕是照搬复制都不容易。

网上讲,2D DCT转为1D 后,转换时间减少四分之三。我理解1D是否是分别对8行原始数据DCT后得到8行S8,,再对S8竖向取8列再DCT?编程验证一下。

8行水平DCT 循环为8*8*8,再加上垂直的DCT,共计2*8*8*8=1024 ,理论上是少了 3/4.

经程序验证。2D DCT 转为1D DCT 的步骤如下:

1.8×8 的块每行先1D DCT,

2,用每行1D DCT后的数据再生成中间8×8块 Sz,

3取Sz 每列 1D DCT 后生成的8×8数据就是2D DCT 系数

相关推荐
4311媒体网1 小时前
C语言操作符全解析 C语言操作符详解
java·c语言·jvm
二年级程序员1 小时前
一篇文章掌握“顺序表”
c语言·数据结构
傻乐u兔2 小时前
C语言进阶————指针4
c语言·开发语言
历程里程碑2 小时前
Linux22 文件系统
linux·运维·c语言·开发语言·数据结构·c++·算法
2601_949146539 小时前
C语言语音通知接口接入教程:如何使用C语言直接调用语音预警API
c语言·开发语言
知南x11 小时前
【Ascend C系列课程(高级)】(1) 算子调试+调优
c语言·开发语言
2的n次方_13 小时前
Runtime 执行提交机制:NPU 硬件队列的管理与任务原子化下发
c语言·开发语言
凡人叶枫14 小时前
C++中智能指针详解(Linux实战版)| 彻底解决内存泄漏,新手也能吃透
java·linux·c语言·开发语言·c++·嵌入式开发
凡人叶枫16 小时前
C++中输入、输出和文件操作详解(Linux实战版)| 从基础到项目落地,避坑指南
linux·服务器·c语言·开发语言·c++
傻乐u兔16 小时前
C语言进阶————指针3
c语言·开发语言