1.引言 汇率的波动会对国内的通货膨胀[1]和进出口[2]等产 生一定的影响。而利用历史汇率数据,构造相应的预测模型 来预测未来的汇率变化,可以防患于未然。传统的股票时间 序列预测方法有指数平滑法[3]自回归滑动平均模型[4]等。
这些模型对线性时间序列的预测可获得良好的效果,但在实 际应用中,大多数的时间序列具有不稳定和非线性等特征。
为此,基于非线性特征的支持向量机[5]和神经网络预测模 型[6]被相继提出,并在股票预测方面取得了较好成果。由 于股票受到各方面因素的影响,使序列变得复杂而难以预测, 倘若单一地使用这些方法来进行股票时间序列的预测,会使 训练陷入局部最优,而难以达到满意的效果,因此具有一定的局限性。为解决这个问题,本文提出了一种基于经验模态 分(EMD)和径向基函数网络(RBF)结合的方法,来预测美 元兑人民币的汇率。该方法具有以下几点优势:(1)因为 时间序列具有不稳定和非线性等特点,首先利用EMD方法对 原始汇率数据进行处理,可以使得原始信号更平稳,降低外 界噪音对预测的影响;
(2)RBF神经网络训练速度快,且具 有全局最优的特点,克服了BP神经网络陷入局部最优的情况, 从而获得更高精度的预测结果;
(3)本文还对实验结果进 行了最优参数的挖掘与分析,以获得最佳的预测结果。
本文的剩余部分组织如下:第2部分分别介绍了EMD和 RBF网络的理论并建立了EMD-RBF预测模型;
第3部分进行了 案例分析与参数挖掘;
第4部分得出了实验结论。
2.基于经验模式分解和径向基函数网络的预测模型 2.1经验模态分解 经验模态分解方法[7]是黄锷等人在1998年提出的一种 新型自适应信号时频处理方法,适用于非线性、非平稳信号 的分析处理。经验模态分解方法是依据数据自身的时间尺度 特征来进行信号分解。该方法能使复杂信号分解为若干个本 征模函数和一个残差。所分解出来的各IMF分量包含了原信 号的不同时间尺度的局部特征信号,残差从某种程度上代表 着原始信号的趋势。分解出来的IMF必须满足以下两个条件:
(1)在全部时间序列观测点中,极值点的个数必须要 与零交叉点的个数相等或者最多相差一个。(2)在任意一点上,由局部极大值形成的上包络线和 局部极小值形成的下包络线求得的均值为零。
通常,大多数要分析的时间序列并不是IMF,往往包含 一个或多个震荡模式。因此,需要对数据进行EMD分解,以 获得IMF。EMD分解必须满足以下三个条件:
(1)信号必须有两个极值,一个极大值和一个极小值。
(2)通过极值之间的跨度确定特征时间尺度。
(3)如果数据没有极值点但包含拐点,可以通过对它 进行一次或多次微分来求得极值。
EMD分解原始信号,其实就是信号筛选的过程。原始信 号通过EMD方法分解得到若干个IMF和一个残差向量。信号筛 选步骤如下所示:
第一步:绘制上、下包络线。找到原始信号x(t)中的 所有极大值点max和极小值点min,并利用三次样条插值方法 分别绘制出上、下包络线。
第二步:计算上下包络线对应各点的均值m1。
2.3EMD-RBF模型构建 构建的EMD-RBF模型,首先对原始汇率交易数据进行EMD 变换,然后再使用RBF神经网络来训练预测模型。具体的实 验步骤如下所示。
第一步:加载数据并对数据预处理,设数据长度为L。
第二步:对处理好的外汇数据进行EMD变换,分解出n个 分量,分别是:(n-1)个IMF和1个残差向量。第三步:分别对每个IMF和残差向量以时间窗口长度为k 生成样本。如第一个样本为第1个数据到第k个数据作为输入, 第(k+1)个数据作为目标输出;
第二个样本为第2个数据到 第(k+1)个数据作为输入,第(k+2)个数据作为目标输出;
以此类推,故每个分量都可生成(L-k)个样本。
第四步:分别随机选取每个分量的q个样本作为训练样 本来分别训练每个RBF网络,剩余的样本作为测试样本。
第五步:把测试样本输入对应训练好的RBF网络中,进 行仿真预测,并对每个RBF网络输出的预测值求和,求和值 作为最终预测值。
第六步:模型性能评价:为了验证模型的可靠性,本文 选择平均绝对误差(MAE)、均方误差(MSE)作为模型性能 的评价指标。它们的计算公式分别如下所示:
其中(i=1,2,3…51),n表示样本的数量,xi表示第 i个样本真实输出值, x表示样本真实值得均值,yi表示第i 个的样本的网络预测输出值, y表示预测值的均值。计算出 的MAE和MSE的值越小,则表明预测结果越准确,预测模型就 越可靠。
3.案例分析 在本小节,以美元兑换人民币为案例研究对象,对提出 的模型进行性能评估。使用的数据为美元兑换人民币的日汇 率值,时间从2013年1月2日到2016年6月1日,共855个该数 据,其来源于http://fx.sauder.ubc.ca/data.html。首先对交易数据进行EMD分解,分解结果如图1所示,然 后采用径向基函数网络来训练。
由于在适当范围内,不同样本长度(即输入神经元的个 数)的选择会对实验结果产生重要的影响,并且径向基函数 的密度常数越大,网络预测的性能也越好,因此选择出最优 的参数组合就显得尤为重要。所以,本文通过多次实验来确 定最合适的时间窗长度和最优的密度常数参数,并依据Eq. (9),Eq.(10),Eq.(11)来分析实验结果和验证模型 的准确性与可靠性。
3.1最优时间窗长度 选择不同时间窗长度的数据来训练模型并预测下一次 的汇率,会对预测模型的准确性产生重要的影响,这部分通 过试探实验,分别设定时间窗口长度为3、4、5、6、10这五 个参数,并分别计算它们的MAE、MSE和与原外汇序列的相关 系数R,来确定最优的时间窗口长度。
由表1知,当时间窗长度由3、4到5时,实验所获得的MAE 和MSE在减小,这说明预测模型具有更准确的预测能力;
当 时当时间窗长度由5、6到10时,实验所获的MAE和MSE在增大, 这表明,预测模型的准确性在下降。也由表1知,时间窗长 度由3增加到5时,预测所得序列与真实序列的相关性呈现正 相关的关系;
由时间窗长度5增加到10时,预测序列与真实 序列的相关性呈负相关关系。这再一次验证了,当取时间窗 长度为5时,可以获得最佳的实验效果。3.2最优密度常数 这部分是在时间窗长度为5的情况下,通过计算单一RBF 网络预测模型和EMD-RBF预测模型这两种模型分别在密度常 数参数为2、3、4和5这四组常数下的MAE、MSE这两个个指标 来确定预测模型的最优密度常数。
由表2知,在密度常数为5时,RBF网络预测所得的最小 MAE为0.0072,最小MSE为0.0242。而EMD-RBF模型预测所得 的最小MAE和最小MAE在密度常数为3时获得,它们分别为 0.0029和0.0013。故表明,单一的RBF网络最优密度常数为5, EMD-RBF预测模型最优密度常数为3。
综上所述,由于在各预测模型最优参数设置下,EMD-RBF 预测模型计算得到的MAE和MSE都是最小的,这表明,基于 EMD-RBF的外汇汇率预测较单一的RBF网络预测具有更稳定 和更可靠的特点。
4.结论 本文提出了基于EMD-RBF预测模型方法来预测美元兑换 人民币的外汇时间序列,首先对数据进行EMD分解得到若6个 IMF和1个残差向量,然后把IMF和残差分别输入RBF网络进行 预测,最后对相应的每个预测结果求和作为预测值。通过美 元兑人民币的案例研究,可得出如下结论:(1)通过EMD-RBF 模型预测,所获得的最小MAE和MSE都小于单一使用RBF网络 预测所获得的MAE和MSE;
(2)基于EMD-RBF模型进行美元兑 人民币外汇时间序列的预测比基于RBF径向基函数网络进行外汇时间序列预测更高的准确性和可靠性。因此该预测模型 在实际应用中具有一定的参考价值。本文只是对汇率进行单 步预测,在以后的研究中,将对外汇数据进行多步预测的建 模和验证分析,以提高该预测模型的适用范围。
扩展阅读文章
推荐阅读文章
推荐内容
钻爱网 www.zuanai.cn
Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1