时间序列去趋势化和傅里叶变换

时间序列去趋势化和傅里叶变换 吴铭 2023-09-04 11:09:13 555

在计算傅里叶变换之前对信号去趋势是一种常见的做法,特别是在处理时间序列时。在这篇文章中,我将从数学和视觉上展示信号去趋势是如何影响傅里叶变换的。

这篇文章的目的是让介绍理解什么是常数和线性去趋势,为什么我们使用它们,以及它们是如何影响信号的傅里叶变换的。

傅里叶变换快速回顾

我们将使用傅里叶变换的如下定义:对于输入序列x[n],当n=0到n时,傅里叶变换的第k个系数为以下复数:

易百纳社区

常量去趋势

序列x[n]可以分解如下:将其写成两个信号的和:“常数部分”等于信号的平均值,“平均值周围的可变性”部分给出实际信号与其平均值之间的差值:

易百纳社区

对于所有样本n,我们有:

易百纳社区

首先,求x均值的傅里叶变换

易百纳社区

这是一个简单的序列,所以在k=0处x的均值为0,在其他地方的值也为0。

易百纳社区

使用下面代码绘制所有指数也可以看到为什么它们的和总是为0(除了k=0)。

 import numpy as np
 import matplotlib.pyplot as plt
 
 N = 10
 ns = np.arange(N)
 
 fig, axes = plt.subplots(1, N//2+1, figsize=(18,8), sharex=True, sharey=True)
 
 for k in range(0, N//2+1):
     eiks = np.exp(-2*1J*np.pi*ns/N*k)
     pretty_ax(axes[k])
     plot_sum_vector(eiks, axes[k])
     axes[k].set_title(f'k={k}')
     axes[k].set_aspect('equal')
 fig.suptitle(f'Complex plot of the $e^{{-2i\pi kn/N}}$ families'

易百纳社区

现在我们把x的傅里叶变换写成这样,分为两部分

易百纳社区

分解x的傅里叶变换,结果是2个傅里叶变换的和:“可变性”部分的傅里叶变换,以及k=0时等于平均值的系数。

也就是说x的傅里叶变换等于其可变性在均值附近的傅里叶变换的和,再加上除k = 0处之外的序列,这个序列都为0,所以他的均值是x。

这就常数去趋势,是在进行傅里叶变换之前去除信号的均值。对于傅里叶系数,就傅里叶系数而言,它对应于将k = 0系数设置为0。

k = 0的系数始终等于信号的平均值,可以使用下面方法证明:

易百纳社区

线性去趋势

方法与前面相同:将输入信号写为2个部分的和:“线性”部分,以及围绕该线性部分的其余变化:

易百纳社区

这里的线性部分是从最小二乘拟合计算。利用指数,可以将线性部分写为:

易百纳社区

其中b是信号的平均值。让我们来看看它的傅里叶变换:

易百纳社区

线性部分的傅里叶变换为,给定傅里叶变换的线性性质:

易百纳社区

线性去趋势包括在进行傅里叶变换之前去除x的线性部分:它从结果中去除aFT(n)+b项,其中a是常数因子(对应于线性拟合的斜率),FT(n)是线性序列[0,1,…]的傅里叶变换,b是信号的平均值(因此第一个傅里叶系数将为0,就像常数去趋势一样)。

python代码

在Python中使用numpy和scipy实现非常简单。

Scipy在它的signal 包中提供了detrend函数,带有一个类型参数来指定我们是想让信号保持常量趋势还是线性趋势。

在下面的例子中,创建了一个长度为20个样本的信号,其中包含一个前导系数为2的线性部分,一个噪声,一个偏移量为4的正弦部分。

import numpy as np
 from scipy.signal import detrend
 import matplotlib.pyplot as plt
 
 N = 20
 # create a sample signal, with linear, offset, noise and sinus parts
 ys = np.arange(N) * 2 + 4 + np.random.randn(N) + 4*np.sin(2*np.pi*np.arange(N)/5)
 # constant and linear detrend
 ys_c = detrend(ys, type='constant')
 ys_l = detrend(ys, type='linear')
 
 fig, axes = plt.subplots(1, 2)
 
 ax = axes[0]
 ax.plot(ys, label='raw')
 ax.plot(ys_c, label='constant-detrended')
 ax.plot(ys_l, label='linear-detrended')
 ax.legend()
 ax.set_title('Input signal')
 
 ax = axes[1]
 # we use rfft since our input signals are real
 ax.plot(np.abs(np.fft.rfft(ys)))
 ax.plot(np.abs(np.fft.rfft(ys_c)))
 ax.plot(np.abs(np.fft.rfft(ys_l)))
 ax.set_title('Module of Fourier-transform')

易百纳社区

在左边我们有原始输入信号,以及它的常数去趋势和线性去趋势版本。

常数去趋势有效地去除信号的平均值,使其在0附近居中。线性去趋势不仅去掉了信号的平均值,而且还去掉了它的线性趋势(又名“直线斜率”)。从视觉上看,在线性去趋势信号上比在原始信号上更容易发现正弦部分。

右边是每个信号的傅里叶变换模块:如果不去除趋势,我们得到蓝色模块。使用常数去趋势法去除平均值可以有效地将0系数设置为0,这在大多数情况下使得图表更容易分析。自线性去趋势的结果是最好的:输出傅里叶系数很好地显示了输出频谱中的频率,线性去趋势的主要优点是它大大减少了频谱泄漏。

线性信号的傅里叶变换

对于不同的K值,我们可以很容易地画出线性信号Kn (K为斜率)的傅里叶变换:

 import numpy as np
 import matplotlib.pyplot as plt
 
 N = 10
 ns = np.arange(N)
 Ks = [-5, 2, 5]
 
 fig, axes = plt.subplots(len(Ks), N//2+1, figsize=(18,8), sharex=True, sharey=True, gridspec_kw={'hspace':0, 'wspace':0})
 
 for i, K in enumerate(Ks):
     xs = K*np.arange(N)
     for k in range(0, N//2+1):
         Zs = xs * np.exp(-2*1J*np.pi*ns/N*k) / N
         ax = axes[i, k]
         pretty_ax(ax)
         plot_sum_vector(Zs, ax)
         ax.set_aspect('equal')
         ax.set_xlabel(f'k={k}')
     axes[i, 0].set_ylabel(f'K={K}')
 fig.tight_layout()

易百纳社区

对于给定的k值,用红色箭头表示的傅里叶系数总是对齐的,并且等于一个比例。所以输出频谱中被去掉的部分总是序列[0,1,…N]的傅里叶变换的部分,其比例因子由线性拟合的斜率给出。

总结

在这篇文章中,我们介绍了常量和线性去趋势:它们分别由去除输入信号的平均值或线性拟合组成。在计算傅里叶变换之前的预处理步骤有助于使输出谱更容易解释。

去除信号的平均值使第0个系数为0。结果图更容易检查,因为大多数情况下,平均值与频谱的其余部分相比可能相当大。如果我们去掉这个系数,y轴的尺度就更容易设定。

线性去趋势除了去掉平均值也去掉了信号中的总体趋势,这通常是原始信号的主导部分,这样可以去掉其他成分例如季节行为等,所以如果需要对季节性进行分析还需要另外的处理。

文章转载自公众号:机器学习算法那些事

声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
吴铭
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
吴铭
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区