Ⅰ 通俗讲解时间序列(一)
什么是时间序列
时间序列是指在一段连续时间段内由时间和所对应的观察值所组成的一段序列,比如某一年的降雨量。
什么是时间序列预测
时间序列预测是指根据某维度数据在过去时间段内的变换情况来预测未来时间段内该数据如何变化,近些年来,随着人工智能技术的发展,时间序列预测被用于金融、商业等多个领域。
如何实现时间序列预测
时间序列预测可以分为单步(one-step)预测和多步(multi-step)预测,单步预测用来预测未来某一时间点的数据,多步时间序列预测用来预测未来时间段内多个时间点数据。以某地一周内的天气最高温度来说,给定前5天最高气温,然后预测未来时间内气温变换情况。one-step单步预测第六天的最高气温,也就是说它只预测一个点的数据,而multi-step可物樱以预测出多天的最高气温,如第6天和第7天。
单时间序列预测可以转化为机器学习中的监督学习来实现,multi-step预测可以通常采用以下四种方法:
(1)Direct Multi-step Forecast Strategy
直接多步预测策略训练多个模型,各个模型之间相互独立,每个模型用来预测一个单时间步。模型结构如下:
PREDICTIONS(T+1) = MODEL(OBS(T-1),OBS(T-2),...(T-N))
PREDICTIONS(T+2) = MODEL(OBS(T-1),OBS(T-2),...(T-N))
这种策略需要训练多个独立模型,训练和维护成本高,没有考虑到t+1和t+2之间的相互依赖关系。
(2)Recursive Multi-step Forest
这种策略是递归多步预测策略,将t+1时刻预测值作为t+2时刻的一个观察值。模型结构如下:
PREDICTION(T+1) = MODEL(OBS(T-1), OBS(T-2), ..., OBS(T-N))
PREDICTION(T+2) = MODEL(PREDICTION(T+1),OBS(T-1), ..., OBS(T-N))
递归多步预测策略将t+1时刻预测输出作为预测t+2时刻的输入,整个过程只训练一个one-step模型,这种策略会使得错误率累加而使模型精度下降。
(3)Direct-Recursive Hybrid Strategies
这种策略是对前两种策略的融合,能够克服前两种策略的局限罩喊丛性。该策略将t+1时刻预测值作为t+2时刻的一个观察值。模型结构如下:
PREDICTION(T+1) = MODEL1(OBS(T-1), OBS(T-2), ..., OBS(T-N))
PREDICTION(T+2) = MODEL2(PREDICTION(T+1),OBS(T-1), ..., OBS(T-N))
这种策略需要训练多个模型
(4)Multiple Output Strategy
多输出策略训练一个模型来一次性输出多个时间点预测结果。模型结构如下:
PREDICTION(T+1), PREDICTION(T+2) = MODEL(OBS(T-1), OBS(T-2), ..., OBS(T-N))
这种策略需要训练所得到的模型训练成渗御本和复杂度较高。
Ⅱ 时间序列分析概述
时间序列具有如下特点:
分类:
五个步骤:特征分析、模型识别渗辩棚、模型参数估计、模型检验、模型应用。
在进行时间序列建模的过程中,首先要对时间序列的特征有所了解,一般的,从时间序列的 随机性、平稳性和季节性 三个方面进行考虑,其中平稳性尤为重要,对于一个非平稳时间序列,通常需进行平稳化处理后在进行建模,也可以根据特性之间建模。
单位根检验 是指判断时间序列中是否存在单位根,即对时间序丛则列的平稳性进行检验。可以证明若存在单位根,则序列是不平稳的,常用的单位根检验方法包括:ADF(Augmented Dickey Fuller)检验、PP(Phillips Person)检验、NP(Nelson Plosser)检验等。
时间序列的模型识别主要包括:确定模型类别和模型阶数两个方面。
在确定时间序列模型的类别方面,平稳序列样本自相关函数和偏相关函数的拖尾性和截尾性是判断模型类别的基本方法。
在确定时间序列模型的阶数方面,主要有以下几种定阶方式。
对时间序列模型的检验分为两大类:模型的显著性检验及模型参数的显著性检验
时间序列模型的显著性检验主要检验模型的有效性。模型的显著性检验的主要任务是看模型是否充分有效地提取了全部信息,即一个好的模型灶橘应该确保残差序列为白噪声,这样确保了再无可利用信息。如果残差是非白噪声,则意味着残差中留有相关信息。
模型参数的显著性检验,是要检验模型中的每一个参数是否显著异于零,目的是使模型更为精简和准确。如果模型中包含了不显著的参数性,则可以说明一方面参数冗余,另一方面会影响其他参数的估计精度。因此要提出模型中那些不显著的参数。
利用模型进行预测分析。
参考:《时间序列模型及预测》 王立柱著;科学出版社
Ⅲ 时间序列的种类
一、绝对数时间序列
1、时期序列:由时期总量指标排列而成的时间序列 。
时期序列的主要特点有:
1)隐宏、序列中的指标数值具有可加性。
2)、序列中每个指标数值的大小与其所反映的时期长短有直接联系。
3)、序列中每个指标数值通常是通过连续不断登记汇总取得的。
2、时点序列:由时点总量指标排列而成的时间序列
时点序列的主要特点有:
1)、序列中的指标数灶姿册值不具可加性。
2)、序列中每个指标数值的大小与其间隔时间的长短没有直接联系。
3)、序列中每个指标数值通常是通过定期的一次登记取得的。
二、相对数时间序列
把一系列同种相对数指标按时间先后顺序排列而成的时间序列叫做相对数时间序列。
三、平均数时间序列
平均数时间序列是指由一系列同类平均指标按时间先后顺序排列的时间序列。
(3)时间序列扩展阅读
时间序列数据变动存在着规律性与不规律性
时间序列中的每个观察值大小,是影响变化的各种不同因素在同一时刻发生作用的综合结果。从这些影响因素发生作用的大小和方向变化的时间特性来看,这些因素造成的时间序列数据的变动分为四种类型。
1、趋势性:某个变量随着时间进展或自变册悔量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不相等。
2、周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
3、随机性:个别为随机变动,整体呈统计规律。
4、综合性:实际变化情况是几种变动的叠加或组合。预测时设法过滤除去不规则变动,突出反映趋势性和周期性变动。
Ⅳ 时间序列
该序列具有明显的趋势性,所以不是通常的平稳序列
比较奇怪的是,和书上的怎么不一样,而且acf绝对值不应该小于1?哪里算错了?我知道了,原来算法都是用:
算的,而不是:
结论就是,自相关图显示出明显的三角对称性, 这时具有单调趋势的非平稳序列的一种典型的自相关图形式.
跳过了
AR模型的自相关系数有俩个显著的性质: 1.拖尾性;2.指数衰减
滞顷激后 阶的自相关系数的通解为:
其中 为差分方程的特征根, 为常数,且不全为0
通过这个通解形式,容易推出 始终有非零取值,不会在 大于某个常数之后就恒等于零,这个性质就是拖尾性.
而以指数衰减的性质就是利用自相关图判断平稳序列时所说的"短期相关"性质.
AR(p)模型的偏自相关系数具有 阶截尾性,利用线性方程组的理论可以证明.事实上,这也是一种确定阶数的方法.另外偏自相关系数可以通过求解Yule-Walker方程获得:
是不是又哪里搞错了,和库里的又不一样了.
MA(q)模型自相关系数 阶截尾,即 阶以后自相关系数为0
MA(q)模型偏自相关系数拖尾
ARMA(p, q)模型自相关系数不截尾,而且偏自相关系数也不截尾
<div>
<style scoped>
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
</style>
<table border="1" class="dataframe">
<thead>
<tr style="text-align: right;">
<th></th>
<th>output</th>
</tr>
</thead>
<tbody>
<tr>
<th>1964-12-31</th>
<td>97.0</td>
</tr>
<tr>
<th>1965-12-31</th>
<td>130.0</td>
</tr>
<tr>
<th>1966-12-31</th>
<td>156.5</td>
</tr>
<tr>
<th>1967-12-31</th>
<td>135.2</td>
</tr>
<tr>
<th>1968-12-31</th>
<td>137.7</td>空告
</tr>
<tr>
<th>1969-12-31</th>
<td>180.5</td>
</tr>
<tr>
<th>1970-12-31</th>
<td>205.2</td>
</tr>
<tr>
<th>1971-12-31</th>
<td>190.0</td>
</tr>
<tr>
<th>1972-12-31</th>
<td>188.6</td>
</tr>
<tr>
<th>1973-12-31</th>
<td>196.7</td>
</tr>
<tr>
<th>1974-12-31</th>
<td>180.3</td>
</tr>
<tr>
<th>1975-12-31</th>
<td>210.8</td>
</tr>
<tr>
<th>1976-12-31</th>
<td>196.0</td>
</tr>
<tr>
<th>1977-12-31</th>
<td>223.0</td>
</tr>
<tr>
<th>1978-12-31</th>
<td>238.2</td>
</tr>
<tr>
<th>1979-12-31</th>
<td>263.5</td>
</tr>
<tr>
<th>1980-12-31</th>
<td>292.6</td>
</tr>
<tr>
<th>1981-12-31</th>
<td>317.0</td>
</tr>
<tr>
<th>1982-12-31</th>
<td>335.4</td>
</tr>
<tr>
<th>1983-12-31</th>
<td>327.0</td>
</斗乎明tr>
<tr>
<th>1984-12-31</th>
<td>321.9</td>
</tr>
<tr>
<th>1985-12-31</th>
<td>353.5</td>
</tr>
<tr>
<th>1986-12-31</th>
<td>397.8</td>
</tr>
<tr>
<th>1987-12-31</th>
<td>436.8</td>
</tr>
<tr>
<th>1988-12-31</th>
<td>465.7</td>
</tr>
<tr>
<th>1989-12-31</th>
<td>476.7</td>
</tr>
<tr>
<th>1990-12-31</th>
<td>462.6</td>
</tr>
<tr>
<th>1991-12-31</th>
<td>460.8</td>
</tr>
<tr>
<th>1992-12-31</th>
<td>501.8</td>
</tr>
<tr>
<th>1993-12-31</th>
<td>501.5</td>
</tr>
<tr>
<th>1994-12-31</th>
<td>489.5</td>
</tr>
<tr>
<th>1995-12-31</th>
<td>542.3</td>
</tr>
<tr>
<th>1996-12-31</th>
<td>512.2</td>
</tr>
<tr>
<th>1997-12-31</th>
<td>559.8</td>
</tr>
<tr>
<th>1998-12-31</th>
<td>542.0</td>
</tr>
<tr>
<th>1999-12-31</th>
<td>567.0</td>
</tr>
</tbody>
</table>
</div>
差分运算
就用个ARMA(1, 1, 4)吧
利用summary查看
<table class="simpletable">
<caption>ARIMA Model Results</caption>
<tr>
<th>Dep. Variable:</th> <td>D.output</td> <th> No. Observations: </th> <td>35</td>
</tr>
<tr>
<th>Model:</th> <td>ARIMA(0, 1, 4)</td> <th> Log Likelihood </th> <td>-156.722</td>
</tr>
<tr>
<th>Method:</th> <td>css-mle</td> <th> S.D. of innovations</th> <td>20.534</td>
</tr>
<tr>
<th>Date:</th> <td>Thu, 13 Jun 2019</td> <th> AIC </th> <td>325.444</td>
</tr>
<tr>
<th>Time:</th> <td>18:06:52</td> <th> BIC </th> <td>334.776</td>
</tr>
<tr>
<th>Sample:</th> <td>12-31-1965</td> <th> HQIC </th> <td>328.666</td>
</tr>
<tr>
<th></th> <td>- 12-31-1999</td> <th> </th> <td> </td>
</tr>
</table>
<table class="simpletable">
<tr>
<td></td> <th>coef</th> <th>std err</th> <th>z</th> <th>P>|z|</th> <th>[0.025</th> <th>0.975]</th>
</tr>
<tr>
<th>const</th> <td> 13.9682</td> <td> 0.726</td> <td> 19.227</td> <td> 0.000</td> <td> 12.544</td> <td> 15.392</td>
</tr>
<tr>
<th>ma.L1.D.output</th> <td> -0.3682</td> <td> 0.200</td> <td> -1.840</td> <td> 0.076</td> <td> -0.761</td> <td> 0.024</td>
</tr>
<tr>
<th>ma.L2.D.output</th> <td> -0.1066</td> <td> 0.182</td> <td> -0.585</td> <td> 0.563</td> <td> -0.463</td> <td> 0.250</td>
</tr>
<tr>
<th>ma.L3.D.output</th> <td> -0.3034</td> <td> 0.196</td> <td> -1.545</td> <td> 0.133</td> <td> -0.688</td> <td> 0.081</td>
</tr>
<tr>
<th>ma.L4.D.output</th> <td> -0.2218</td> <td> 0.176</td> <td> -1.262</td> <td> 0.217</td> <td> -0.566</td> <td> 0.123</td>
</tr>
</table>
<table class="simpletable">
<caption>Roots</caption>
<tr>
<td></td> <th> Real</th> <th> Imaginary</th> <th> Molus</th> <th> Frequency</th>
</tr>
<tr>
<th>MA.1</th> <td> 1.0000</td> <td> -0.0000j</td> <td> 1.0000</td> <td> -0.0000</td>
</tr>
<tr>
<th>MA.2</th> <td> -0.1585</td> <td> -1.4742j</td> <td> 1.4827</td> <td> -0.2670</td>
</tr>
<tr>
<th>MA.3</th> <td> -0.1585</td> <td> +1.4742j</td> <td> 1.4827</td> <td> 0.2670</td>
</tr>
<tr>
<th>MA.4</th> <td> -2.0510</td> <td> -0.0000j</td> <td> 2.0510</td> <td> -0.5000</td>
</tr>
</table>
其中的ma.L1.D.output 表示模型的MA部分的第一个参数,因为我们的AR部分为0,如果存在的话也有ar.L1.D.output的
表示t检验,这里好像检验没通过,我也不知道咋怎.
大于0.05,所以模型是显著的
Ⅳ 时间序列 是什么意思啊
同学你好,很高兴为您解答!
时间序列衡没
以时间为顺序的观测结果序列。
CMA认证能帮助持证者职业发展,保持高水准的职业道德要求,站在财务战略咨询师的枣铅角度进行企业分析决策,推动企业业绩发展,并在企业战略决策过程中担任重要的角色。
希望我的回答能帮助您解决问题,如您满意,请采纳为最佳答案哟。
再次感谢您的提问,更多财会问题欢迎提交给高顿企业知道。
高顿祝您凳拦好生活愉快!
Ⅵ 什么是时间序列它的两个构成要素是什么
时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成尘烂的序列。
构成要素:
要素一:时间t。
要素二:指标数值。
时间序列数据本质上反映的是某个或者某些派旦漏随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,迟肆并利用其对将来的数据做出估计。
编制原则
保证序列中各期指标数值的可比性:
(一)时期长短最好一致;
(二)总体范围应该一致;
(三)指标的经济内容应该统一;
(四)计算方法应该统一;
(五)计算价格和计量单位可比。
Ⅶ 什么是时间序列
在统计学中作为一种常用的预庆穗大测手段被广泛应用.时间序列通常有以下三种方法:
1.方法一是把一个时间序列的数值变动,分解为几个组成部分,通常分为:
(1)倾向变动,亦称长期趋势变动T;
(2)循环变动,亦称周期变动C;
(3)季节变动,即每年有规则地反复进行变动S;
(4)不规则变动,亦称随机变动I等.然后再把这四个组成誉竖部分综合在一起,得出预测结果.
2.方法二是把预测对象、预测目标和对预测的影响因素都看成为具有时序的,为时间的函数,而时间序列法就是研究预测对象自身变化过程及发展趋势.
3.方法三是根据预测对象与影响因素之间的因果关系及其影响程度来推算未来.与目标的相关因素很多,只能选择那些因果关系较强的为预测影响的因素.
时间序列分析在族纯第二次世界大战前应用于经济预测.