简介

说明一下，用MATLAB做FFT并不要求数据点个数必须为以2为基数的整数次方。之所以很多资料上说控制数据点数为以2为基数的整数次方，是因为这样就能采用以2为基的FFT算法，提升运算性能。

如果数据点数不是以2为基数的整数次方，处理方法有两种，一种是在原始数据开头或末尾补零，即将数据补到以2为基数的整数次方，这是“补零”的一个用处；第二种是采用以任意数为基数的FFT算法。

MATLAB的FFT并非使用的是蝶形算法。对于非2的幂指数的长度，它使用Cooley-Tukey算法分解因数，再利用现有的库分别计算最后合成。

快速傅里叶变换FFT

比如，现在我有一个信号，这个信号中仅包含两个正（余）弦波，一个是 $1MHz$，一个是 $1.05MHz$，即 $x=\cos(2\pi\times1000000t)+\cos(2\pi\times1050000t)$。设定采样频率为 $F_s=100MHz$，如果采 $1000$ 个点，那么时域信号的时长就有 $10\mu s$。

图1. 1000个数据点

如果，直接对这1000个数据点其做快速傅里叶变换，将得到频谱图：

图2. 1000个数据点做FFT的频谱

可以发现，频谱点稀疏，在1MHz附近根本无法将1MHz 和1.05MHz 的两个频率分开。

clear;clc
close all
%% FFT
Fs = 100e6;		    % 采样频率 Hz
T = 1/Fs;		    % 采样周期 s
L0 = 1000;                  % 信号长度
L = 1000;                   % 数据长度
t0 = (0:L0-1)*T;            % 信号时间序列
x = cos(2*pi*1e6*t0) + cos(2*pi*1.05e6*t0); % 信号函数
t = (0:L-1)*T;              % 数据时间序列
%% Plot
figure(1)
plot(t*1e6,x,'b-','linewidth',1.5)
title ('\fontsize{10}\fontname{Times New Roman}Time domain signal')
xlabel('\fontsize{10}\fontname{Times New Roman}\it t /\rm \mus')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itt\rm)')
grid on;
axis([0 10 -2 2])
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')
%% FFT
Y = fft(x);                   % 快速傅里叶变换
% 计算双侧频谱 P2。然后基于 P2 和偶数信号长度 L 计算单侧频谱 P1。
P2 = abs(Y/L0);
P1 = P2(1:L/2+1);
P1(2:end-1) = 2*P1(2:end-1);
f = Fs*(0:(L/2))/L;% Rfft
figure(2)
plot(f, P1,'r-','Marker','.','markersize',10,'linewidth',1.5)
axis([0.5e6 1.5e6 0 1.5])
title('\fontsize{10}\fontname{Times New Roman}Power Spectrum')
xlabel('\fontsize{10}\fontname{Times New Roman}\it f /\rm Hz')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itf\rm)')
grid on;
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')

频率分辨率

发现频率成分无法被区分开来，第一反应应该就是：频率分辨率不够。那么，如何提高频率分辨率呢？首先要清楚，这里存在两种类型的频率分辨率。

一种叫波形分辨率，其由原始数据的时间长度决定：

$\Delta R_{w}=\frac{1}{T}$

另一种可以称之为视觉分辨率或FFT分辨率，其由采样频率和参与FFT的数据点数决定：

$\Delta R_{f f t}=\frac{F_{s}}{N_{f f t}}$

之所以要区分，就是因为后面要进行“补零”的操作。如果不补零，直接对原始数据做FFT，那么这两种分辨率是相等的。

例如上面，有：

$\Delta R_{w}=\frac{1}{10 \mu s}=\Delta R_{f f t}=\frac{100 M H z}{1000}=100 k H z$

补零

那么，如果现在在原始数据点后补零会有什么效果呢？假设在这1000个原始数据点后面再补充零达到7000个点，那么数据变成了：

图3. 7000个补零后数据点

此时对其做快速傅里叶变换，结果如下：

图4. 7000个补零后数据点做FFT的频谱

可以发现，频谱点密集了不少，但是在$1MHz$附近依然无法将$1MHz$和$1.05MHz$的两个频率成分分开。这是因为从式(1)可以看出，波形分辨率只与原始数据的时长 $T$ 有关，而与参与FFT的数据点数无关。所以，虽然补了很多零，但波形分辨率依然为：$\Delta R_{w}=\frac{1}{10 \mu s}=100 k H z$，该分辨率大于$1MHz$和$1.05MHz$成分之间的距离 $50kHz$。这就好比用筛子分黄豆和大米，分辨率就好像是筛子上孔的大小，如果筛子的孔太大了，就没有办法把这两者分开。

而“时域补零相当于频域插值”，也就是说，补零操作增加了频域的插值点数，让频域曲线看起来更加光滑，也就是增加了FFT频率分辨率，注意式(2)所示，这是“补零”的另一个原因。

clear;clc
close all
%% FFT
Fs = 100e6;		    % 采样频率 Hz
T = 1/Fs;		    % 采样周期 s
L0 = 1000;                  % 信号长度
L = 7000;                   % 数据长度
t0 = (0:L0-1)*T;            % 信号时间序列
x = cos(2*pi*1e6*t0) + cos(2*pi*1.05e6*t0); % 信号函数
t = (0:L-1)*T;              % 数据时间序列
y = zeros(1,L);
y(1:L0) = x;
%% Plot
figure(1)
plot(t*1e6,y,'b-','linewidth',1.5)
title('\fontsize{10}\fontname{Times New Roman}Time domain signal with Zero Padding')
xlabel('\fontsize{10}\fontname{Times New Roman}\it t /\rm \mus')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itt\rm)')
grid on;
axis([0 70 -2 2])
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')
%% FFT
Y = fft(y);                   % 快速傅里叶变换
% 计算双侧频谱 P2。然后基于 P2 和偶数信号长度 L 计算单侧频谱 P1。
P2 = abs(Y/L0);
P1 = P2(1:L/2+1);
P1(2:end-1) = 2*P1(2:end-1);
f = Fs*(0:(L/2))/L;% Rfft
figure(2)
plot(f, P1,'r-','Marker','.','markersize',10,'linewidth',1.5)
axis([0.5e6 1.5e6 0 1.5])
title('\fontsize{10}\fontname{Times New Roman}Power Spectrum')
xlabel('\fontsize{10}\fontname{Times New Roman}\it f /\rm Hz')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itf\rm)')
grid on;
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')

频谱泄露

显然，根据上面的分析可知，在采样频率不变的情况下，要想将$1MHz$和$1.05MHz$这两个频率成分分析出来，光靠“补零”是不够的，必须要改变波形分辨率，也就是要延长原始数据的时长。现在以相同的采样频率对信号采7000个点作为原始信号：

图5. 7000个数据点

对其做快速傅里叶变换，结果如下：

图6. 7000个数据点做FFT的频谱

因为此时的波形分辨率为：$\Delta R_{w}=\frac{1}{70 \mu s} \approx 14 k H z$，小于$1MHz$和$1.05MHz$这两个频率成分之间的距离 $50kHz$ ，所以可以看出有两个明显的峰值。

但是会发现$1MHz$ 对应的幅值为1，与原始信号中该频率成分的幅值一致，但 $1.05MHz$对应的幅值明显低于1，但是其周边的点上却都有不小的幅值，这就是所谓的频谱泄露，因为数据点的个数影响，使得在$1MHz$ 处有谱线存在，但在$1.05MHz$ 处没有谱线存在，使测量结果偏离实际值 ,同时在实际频率点的能量分散到两侧的其它频率点上，并出现一些幅值较小的假谱。

clear;clc
close all
%% FFT
Fs = 100e6;		    % 采样频率 Hz
T = 1/Fs;		    % 采样周期 s
L0 = 7000;                  % 信号长度
L = 7000;                   % 数据长度
t0 = (0:L0-1)*T;            % 信号时间序列
x = cos(2*pi*1e6*t0) + cos(2*pi*1.05e6*t0); % 信号函数
t = (0:L-1)*T;              % 数据时间序列
%% Plot
figure(1)
plot(t*1e6,x,'b-','linewidth',1.5)
title('\fontsize{10}\fontname{Times New Roman}Time domain signal')
xlabel('\fontsize{10}\fontname{Times New Roman}\it t /\rm \mus')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itt\rm)')
grid on;
axis([0 70 -2 2])
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')
%% FFT
Y = fft(x);                   % 快速傅里叶变换
% 计算双侧频谱 P2。然后基于 P2 和偶数信号长度 L 计算单侧频谱 P1。
P2 = abs(Y/L0);
P1 = P2(1:L/2+1);
P1(2:end-1) = 2*P1(2:end-1);
f = Fs/2*linspace(0,1,L/2+1);% Rfft
figure(2)
plot(f, P1,'r-','Marker','.','markersize',10,'linewidth',1.5)
axis([0.5e6 1.5e6 0 1.5])
title('\fontsize{10}\fontname{Times New Roman}Power Spectrum')
xlabel('\fontsize{10}\fontname{Times New Roman}\it f /\rm Hz')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itf\rm)')
grid on;
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')

为了解决这个问题，可以设法使得谱线同时经过$1MHz$和$1.05MHz$这两个频率点，找到他们的公约数。

如果原始数据不变，在后面再补充1000个零点：

图7. 8000个补零后数据点

那么FFT分辨率就是 $12.5kHz$ ，是这两个频率的公约数 $1 M H z=80 \times 12.5 k H z$ ，$1.05 M H z=84 \times 12.5 k H z$，所以谱线同时经过 $1MHz$和$1.05MHz$ 这两个频率点。

对其做快速傅里叶变换，结果如下：

图8. 8000个补零后数据点做FFT的频谱

会发现$1MHz$和$1.05MHz$对应的幅值均为1，与原始信号一致。这也是一种补零操作带来的影响。

clear;clc
close all
%% FFT
Fs = 100e6;	            % 采样频率 Hz
T = 1/Fs;		    % 采样周期 s
L0 = 7000;                  % 信号长度
L = 8000;                   % 数据长度
t0 = (0:L0-1)*T;            % 信号时间序列
x = cos(2*pi*1e6*t0) + cos(2*pi*1.05e6*t0); % 信号函数
t = (0:L-1)*T;              % 数据时间序列
y = zeros(1,L);
y(1:L0) = x;
%% Plot
figure(1)
plot(t*1e6,y,'b-','linewidth',1.5)
title('\fontsize{10}\fontname{Times New Roman}Time domain signal')
xlabel('\fontsize{10}\fontname{Times New Roman}\it t /\rm \mus')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itt\rm)')
grid on;
axis([0 80 -2 2])
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')
%% FFT
Y = fft(y);                   % 快速傅里叶变换
% 计算双侧频谱 P2。然后基于 P2 和偶数信号长度 L 计算单侧频谱 P1。
P2 = abs(Y/L0);
P1 = P2(1:L/2+1);
P1(2:end-1) = 2*P1(2:end-1);
f = Fs/2*linspace(0,1,L/2+1);% Rfft
figure(2)
plot(f, P1,'r-','Marker','.','markersize',10,'linewidth',1.5)
axis([0.5e6 1.5e6 0 1.5])
title('\fontsize{10}\fontname{Times New Roman}Power Spectrum')
xlabel('\fontsize{10}\fontname{Times New Roman}\it f /\rm Hz')
ylabel('\fontsize{10}\fontname{Times New Roman}\it y\rm(\itf\rm)')
grid on;
set(gca,'FontSize', 10 ,'FontName', 'Times New Roman')
set(gcf,'unit','centimeters','position',[15 10 13.53 9.03],'color','white')

图8中会有一些旁瓣出现，这是因为补零影响了原始信号，如果，直接采8000个点作为原始数据，即将程序中的L0改为8000，那么有：

图9. 8000个数据点

并对其做FFT，结果如下：

图10. 8000个数据点做FFT的频谱

这样就不存在补零带来的误差了。

FFT与卷积

时域卷积相当于FFT乘积。卷积的离散定义：

$(f * g)(n)=\sum_{\tau=-\infty}^{\infty} f(\tau) g(n-\tau)$

参考

Zero Padding http://www.bitweenie.com/listings/fft-zero-padding/
Zero Padding Theorem https://ccrma.stanford.edu/~jos/dft/Zero_Padding_Theorem_Spectral.html

RexKing6's Note

快速傅立叶变换补0

简介

快速傅里叶变换FFT

频率分辨率

补零

频谱泄露

FFT与卷积

参考