
1 FabricPath 185 天前 因为 FFT 本来就已经非常快了,在 CPU 上随便吊打 DSP ,即使 DSP 有 FFT 加速指令,但是 CPU 凭借几十 W 的功耗,轻松吊打 DSP 。 |
2 rekulas 185 天前 aes 这类算法是因为很多场景确实需要快速计算 傅里叶我想象不出有什么场景有这个需求, 就算有估计也是小众需求,不值得专门搞吧 |
3 soul11201 185 天前 OT:matlab 里面确实是一条指令~~~ |
6 w568w 185 天前 FFT 主要用在信号处理里吧。加密算法你每天上网都要用到( TLS ),但信号处理应该不是什么需要持续做的事情吧 |
7 geelaw 185 天前 via iPhone AES-NI 只是把 AES 中的一部分做成了指令,作用一次 AES PRP 需要调用指令多次,每个指令的参数也是定长的。特别地,并不是一个指令就可以加密任意长的字节数组。 类似的思路运用到 FFT 上,首先需要找出 FFT 中反复用到的同类、定长参数的步骤,然后做成指令,一通分析之后可能会发现没有很好的除了加法、乘法、求余数之外的很好的抽象层。 |
8 rus4db 185 天前 1 、FFT 的硬实现已经做进各类硬件了,比如音视频硬 codec 、DSP 、无线网卡、射频/基带芯片等等。 2 、FFTW 之类的库已经足够快了,做成硬件指令不划算。 3 、FFT 的变体非常多,效率与问题规模有关,与其做成通用指令,不如直接做进应用场景,针对性优化。 |
9 icyalala 185 天前 FFT 变体很多很灵活,要全支持很麻烦,让上层软件去写 SIMD 更划算。 比如苹果的 vDSP: https://developer.apple.com/documentation/accelerate/fast-fourier-transforms |
10 passive 185 天前 via Android 别说 FFT ,连复数的表示都没统一。 做 1 维 FFT ,做不做 2 维?做 2 维 FFT ,做不做 2 维 DCT ?做不做三维 FFT ?做不做任意维度 FFT ? 做了 float 还需要做 double ,那做不做 80 位的浮点? |
13 linearxian 184 天前 FFT 是矩阵乘法算子,但是会形成复数,所以一般都用 DCT 。用 CUDA 会需要把数据拷来拷去,并且一般矩阵纬度不大,杀鸡焉用牛刀 |
14 Alias2023 183 天前 有些指令看似个新的,也是几个指令拼起来的 |
15 InkStone 183 天前 优化过一次 NTT (可以理解为 FFT 的变种),这玩意儿的问题在于,它里面的计算不是固定的……原根可以取不一样的,模数可以取不一样的,乘法可以用几种不同的方法实现,输入格式也很灵活。 |