ARIMA模型中的三个参数(p, d, q)都是什么意思?

  统计/机器学习 时间序列    浏览次数: 1394
4

这三个数分别有什么具体的含义?能举例说明就更好了!谢谢!

 

Gakki   2017-03-12 03:09



   1个回答 
9

ARIMA(p,d,q)模型中

p是自回归(AR)的项数,用来获取自变量

d是差分(I)的系数,为了使时间序列平稳

q是移动平均(MA)的项数,为了使其光滑


举个例子,假如原来的时间序列是

T Y

1 20

2 22

3 25

4 30

5 40

6 50

7 65

8 88

9 112

10 120

11 115

12


我们先添加自回归项。自回归的意思就是用之前的p个数值当作自变量。若p=2,

T Y X_1 X_2

1 20 \ \

2 22 20 \

3 25 22 20

4 30 25 22

5 40 30 25

6 50 40 30

7 65 50 40

8 88 65 50

9 112 88 65

10 120 112 88

11 115 120 112

12 115 120


下面我们对自变量和应变量做差分。差分的意思就是后一行减前一行。d=1的意思,我们做一次差分。

T Y X_1 X_2

1 20* \ \

2 2 \ \

3 3 2 \

4 5 3 2

5 10 5 3

6 10 10 5

7 15 10 10

8 23 15 10

9 24 23 15

10 8 24 23

11 -5 8 24

12 -5 8

d=2的意思就是再上面的基础上再做一次差分。

T Y X_1 X_2

1 \ \ \

2 2* \ \

3 1 \ \

4 2 1 \

5 5 2 1

6 0 5 2

7 5 0 5

8 8 5 0

9 1 8 5

10 -16 1 8

11 -13 -16 1

12 -13 -16


下面再对每一列取移动平均数。q是移动平均的项数,意思每一行被自身和自身之前的q-1行的平均数取代。例如q=2,

T Y X_1 X_2

1 \ \ \

2 \ \ \

3 \ \ \

4 1.5 \ \

5 3.5 1.5 \

6 2.5 3.5 1.5

7 2.5 2.5 3.5

8 6.5 2.5 2.5

9 4.5 6.5 2.5

10 -7.5     4.5 6.5

11 -14.5 -7.5     4.5

12 -14.5 -7.5


下面就是提取出有数据的6到11行,把X_1, X_2当成自变量,Y当成应变量,用线性回归来预测第12行。最后记得把预测出来的结果用逆差分还原回去。

雷猴   2017-03-13 05:14

d是怎么选的?怎么判断进行了d次差分之后已经平稳了呢? - 小齐   2017-03-14 12:53
请问在做差分的过程中,会损失信息吗 - dzzxjl   2018-04-03 19:05


  相关主题

如何判断时间序列的周期性?   2回答

怎么判断一个时间序列是平稳的?   2回答

python两个日期,求间隔的天数   2回答

python里有现成的卡尔曼滤波器的包吗?   2回答

python中有哪些关于隐马尔可夫模型(HMM)的package?   2回答

像年、月、日、小时这种时间变量一般怎么处理?   1回答

怎么对时间序列进行交叉验证?   1回答

Pandas怎样对dataframe中的一个时间列进行排序?   1回答

请问Python有什么工具可以绘制K线图   1回答

pandas把一列日期转换为星期   2回答

单元根检验的实现   1回答

时序预测怎么做特征工程   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!