技术栈
ops-fft
嗝o゚
8 小时前
昇腾
·
cann
·
ops-fft
CANN ops-fft FFT 算子——频域卷积加速原理
大卷积核的卷积操作如果在空域逐点相乘再求和,其计算复杂度为 O(H×W×K×H×K),随着卷积核尺寸增大,计算量呈平方级增长。当卷积核大于 7×7 时,空域卷积的计算开销已经大到难以忽视。FFT(快速傅里叶变换)提供了一条绕过这条困境的路径:将时域卷积转换为频域乘法,从而把复杂度从 O(N²) 降至 O(N log N)。ops-fft 仓正是昇腾 NPU 上 FFT 算子的完整实现,本文剖析它的原理与用法。
我是有底线的