计量经济与时间序列_预测(页 1) - 期货·统计学(Math&Statistics) - 计量学资源 - 龙听期货论坛

龙听发表于 2020-10-5 15:49

计量经济与时间序列_预测

[p=30, 2, left]1. 计量经济学也叫数量经济学或者叫量化经济学，主要的过程是数据结构分析、计量模型建立和预测。因此预测这个话题在时间序列数据中相当重要。他现在仍是一个很活跃的研究领域。很多的量化投资模型最重要应用也就是预测。[/p][p=30, 2, left]2. 这里几种研究以回归为进出的预测方法。[/p][p=30, 2, left]3. 假定我们的主要兴趣是预测一个时间序列过程的[b]将来值[/b]，而不一定是要估计因果性或结构型经济模型。[/p][p=30, 2, left]4. 首先介绍一些与模型具体形式无关的基本预测原理。[/p][p=30, 2, left]　　4.1 假设我们在t 时期(当前时刻)想要预测y 变量在t+1时期(下一个时间窗口)的结果，即yt +1。[/p][p=30, 2, left]　　4.2 所用时间单位可以是一年、一个季度、一个月、一个星期或一天。令[b][font=arial, helvetica, sans-serif]I[/font][/b]t 代表我们在t 时期可以观测到的所有信息。这些信息叫做信息集(information set)，包含yt 和 y 的先导值，常常还包括其他变量在t 或更早时期的值。可以用无数种方法来组合这些信息去预测yt+1。有没有哪一种方法更好呢？[/p][p=30, 2, left]　　4.3 设定与预测误差相联系的损失(loss)，答案便是肯定的。[/p][p=30, 2, left]　　4.4 令一个函数ft 代表在t 期对yt+1所作的预测。称ft 为[b]提前一期预测[/b](one-step-ahead forecast)。[b]预测误差[/b](forecast error)是 et+1 = yt+1 - ft，常见的误差还可以用[b](et +1)2[/b] 来表示。[/p][p=30, 2, left]　　4.5 [b]误差平方这种做法，对称地处理正负误差，越大的误差得到的权重也越大[/b]。还有一种叫|et+1| 的绝对值表示。这些都叫预测误差的[b]损失函数[/b](loss function)。[/p][p=30, 2, left]5. 在t 时期，并不知道et+1的值是多少，因为yt+1是一个[b]随机变量[/b]，所以et+1也是个[b]随机变量[/b]。[/p][p=30, 2, left]6. 所以在给定[b]It[/b] 的所有信息集时，自然而然的我们选择使预测误差平方的期望最小的值：因此这个[b]损失函数[/b]可以表示成下面这种概率表达式：[/p][p=30, 2, left]　　[b]E((et+1)2 | It) = E[(yt+1 - ft)2 | It] (解释为：给定信息集右侧实际值和预测值的平方的期望，等于给定预测值下一时刻的误差平方的期望，也就是说使得这个条件均值最小化，越趋近于0，越好)。[/b][/p][p=30, 2, left]7. 第一种简单预测：[b]指数平滑法[/b](exponenial smoothing)，预测值通过下面的等式求出：[b]ft = αyt + (1-α)ft-1[/b]，yt+1时期的预测值是yt 和在t-1时期对y预测值的加权平均。[/p][p=30, 2, left]8. 第二种简单预测：[b]条件预测[/b](conditional forecast)，已知一个模型的表达式：[b]yt = β0 + β1zt + μt[/b]，那么，[b]E(yt+1 | It) = β0 + β1zt+1[/b]，不行的是我们很少知道zt+1 时刻的其他信息。除非包含时间趋势和季节虚拟变量。[/p][p=30, 2, left]9. 第三种简单预测：[b]无条件预测[/b](unconditional forescast)，这个名词多少有些用词不当，因为我们的预测仍然是以[b]It[/b]中的信息为条件。但是这一名词在预测文献中已经根深蒂固了(无非在用于与测试，被我们赋予一个特定的含义罢了)。[/p][p=30, 2, left]10. 就预测而言，除非由于某些原因使我们不得不用8中的模型，否则最好的设定的模型取决于y和z 的滞后值。这版省却了一些步骤，不必在预测y之前还要预测右边的变量。很容易就想到的一个模型是[b]yt = δ0 + α1yt-1 + γ1zt-1 + μt[/b]。其中根据公式定义[b]E(μt | It-1) = 0[/b]。若已知这些参数(估计出来)那么在t 时期对yt+1的预测值就是这个公式：[b]δ0 + α1yt + γ1zt。[/b][/p][p=30, 2, left]11. [b]提前一期预测[/b]函数可以写成：[b]hat_ƒ = hat_δ0 + hat_α1yn + hat_γ1zn[/b]。[/p][p=30, 2, left]12. 举一个时间序列的预测示例(来自伍德里奇的计量经济学)[/p][p=30, 2, left]　　12.1 第一个模型，简单的AR(1)模型：[/p][p=30, 2, left]　　[b]hat_unemt = 1.572 + 0.732 unemt-1[/b][/p][p=30, 2, left][b]　　　　　　　　 (0.577) (0.097)
[/b][/p][p=30, 2, left][b]　　n(样本数) = 48, R2 = 0.544, hat_σ = 1.049[/b][/p][p=30, 2, left]　　12.2 第二个模型，增加通过膨胀率的一年之后，模型如下：[/p][p=30, 2, left]　　[b]hat_unemt = 1.304 + 0.647 unemt-1 + 0.184 inft-1[/b][/p][p=30, 2, left][b]　　　　　　　　 (0.577) (0.097) (0.041)
[/b][/p][p=30, 2, left][b]　　n(样本数) = 48, R2 = 0.677, hat_σ = 0.833[/b][/p][p=30, 2, left]　　12.3 所有的样本数据都是从1948年-1996年度数据。[/p][p=30, 2, left]　　12.4 预测下年，也就是1997年度数据，需要知道1996年的数据，也就是48条样本中的最后一条以及第二个模型滞后一年(47条)的数据，分别为：5.4 和 3.0。我们分别把这两个值带入到两个模型中，就能得到下一年也就是1997年度的预测值，过程如下：[/p][p=30, 2, left][b]　　模型1：1.572 + 0.732 × 5.4 = 5.52[/b][/p][p=30, 2, left][b]　　模型2：1.304 + 0.647 × 5.4 + 0.184 × 3.0 = 5.35[/b][/p][p=30, 2, left]　　12.5 而美国1997年的实际值为4.9。这两个模型都高估了数值，但是模型2相对好一些。[/p][p=30, 2, left]　　12.6 然后我们把预测区间估计出来：[/p][p=30, 2, left]13. 在实际工作中，有些专业预测员可以固定模型参数，用每一期的预测所用的模型参数保持不变来预测；还有就是新一期数据获得后，更新模型参数，再用更新后的参数预测下一期。（第二种方法需要进行更多的运算，但增加的过做了相对来说是次要的，它可能会（虽然并不一定）更好写，因为这些回归系数至少在一定程度上根据新数据而进行了调整）[/p][p=30, 2, left]14. 样本内准则和样本外准则。[/p][p=30, 2, left]　　14.1 就预测而言，使用样本外准则更好一些，因为预测本质上就是样本外问题。一个模型也许在用于估计其阐述的样本中对y拟合的比较好，但并不一定在与测试就有好的表现。一个样本外准则的方法大致为：用样本前一部分取估计模型中的参数，然后用样本剩余下来的部分判断它的预测能力。这就模拟了我们在不知道变量的将来值所需要的事情。[/p][p=30, 2, left]　　14.2 RMSE = 均方根误，MAE = 绝对平均误差。[/p][p=30, 2, left]　　14.3 还是以上面的为例子。去固定参数，然后累计外推7次预测值，去观察RMSE和MAE在样本外的表现。预测期(1997-2003:7年)。[/p][p=30, 2, left][b]　　　　　在模型1中：RMSE = 0.962,MAE = 0.778[/b][/p][p=30, 2, left][b]　　　　在模型2中：RMSE = 0.673,MAE = 0.628[/b][/p][p=30, 2, left]　　14.4 显然模型2在样本外同样得到了比较好的结果。[/p][p=30, 2, left]　　14.5 当然，还有一种方法。不去固定参数，然后每做一次预测估计一次参数。[/p][p=30, 2, left]15. [b]提前多期预测[/b]：过程也非常简单，用预测出来的值，再代入方程，在预测多两期的预测值，以此类推进行迭代即可。[/p]

页: [1]

龙听期货论坛's Archiver

计量经济与时间序列_预测