摘要: |
基于定点数据的快速傅里叶变换(Fast Fourier Transform, FFT)算法能在合理的精度范围内降低对硬件的要求,计算速度更快.文章面向高性能向量数字信号处理器(Digital Signal Processor, DSP)的硬件特征,构建基4复数FFT算法的高效指令级并行处理模型.该模型充分考虑基4方法下的复数FFT计算过程和蝶形组集合的特征,将SIMD计算、向量混洗、索引DMA等技术与复数FFT的基4变换过程充分融合,有效控制计算过程中存储器和片内缓存之间的数据块搬移需求,提升SIMD计算单元的利用率.在基于自主YHFT M7002处理器的FT M7002DSK平台上进行试验研究,验证算法的有效性.试验结果表明:与CCS模拟所得TI的相应TMS320C6678库函数性能相比,所提优化算法的平均加速比达到TI库函数的4.79倍. |
关键词: 定点 FFT SIMD 技术 向量 DSP 向量混洗 索引 DMA |
DOI: |
分类号:TP311 |
基金项目:湖南省自然科学基金资助项目(2023JJ50019);湖南省教育厅科研项目资助(20B242;19A169) |
|
|
|
Abstract: |
|
Key words: |