用户登录
用户注册

分享至

R软件时间序列建模代码 时间序列建模

  • 作者: 马桶污污污
  • 来源: 51数据库
  • 2020-04-15

R软件时间序列建模代码

大数据挖掘通常用哪些软件

如何使用EViews软件对时间序列进行预测 http://jingyan.baidu.com/article/1709ad8089a69e4634c4f0ff.html做计量分析的目的就是为了探寻经济现象内在的相关关系,而预测效果的好坏则是检验这种关系存在与否以及解释力度大小的标准。

怎么用机器学习模型做时间序列预测

SVM理论是在统计学习理论的基础上发展起来的,由于统计学习理论和SVM方法对有限样本情况下模式识别中的一些根本性的问题进行了系统的理论研究,很大程度上解决了以往的机器学习中模型的选择与过学习问题、非线性和维数灾难、局部极小点问题等。

应用SVM进行回归预测的步骤具体如下:1)实验规模的选取,决定训练集的数量、测试集的数量,以及两者的比例;2)预测参数的选取;3)对实验数据进行规范化处理;4)核函数的确定;5)核函数参数的确定。

其中参数的选择对SVM的性能来说是十分重要的,对于本文的核函数使用RBF核函数,对于RBF核函数,SVM参数包括折衷参数C、核宽度C和不敏感参数E。

目前SVM方法的参数、核函数的参数选择,在国际上都还没有形成统一的模式,也就是说最优SVM算法参数选择还只能是凭借经验、实验对比、大范围的搜寻和交叉检验等进行寻优。

实际应用中经常为了方便,主观设定一个较小的正数作为E的取值,本文首先在C和C的一定范围内取多个值来训练,定下各个参数取值的大概范围,然后利用留一法来具体选定参数值 股价时间序列的SVM模型最高阶确定 股价数据是一个时间序列,从时间序列的特征分析得知,股价具有时滞、后效性,当天的股价不仅还与当天各种特征有关,还与前几天的股价及特征相关,所以有必要把前几天的股价和特征作为自变量来考虑。

最高阶确定基本原理是从低阶开始对系统建模,然后逐步增加模型的阶数,并用F检验对这些模型进行判别来确定最高阶n,这样才能更客观反映股票价格的时滞特性。

具体操作步骤如下:假定一多输入单输出回归模型有N个样本、一个因变量(股价)、m- 1个自变量(特征),由低阶到高阶递推地采用SVM模型去拟合系统(这儿的拓阶就是把昨天股价当做自变量,对特征同时拓阶),并依次对相邻两个SVM模型采用F检验的方法判断模型阶次增加是否合适[ 7]。

对相邻两模型SVM ( n)和SVM ( n+ 1)而言,有统计量Fi为:Fi=QSVR (n)- QSVR( n+1)QSVR (n)1N - m n - (m -1)mi =1,2,,, n(1)它服从自由度分别为m和(N - m n - (m -1) )的F分布,其中QSVR (n)和QSVR( n+1)分别为SVR ( n)和QSVR( n+1)的剩余离差平方和,若Fi前向浮动特征筛选 经过上述模型最高阶数的确定后,虽然确定了阶数为n的SVM模型,即n个特征,但其中某些特征对模型的预测精度有不利影响,本文采用基于SVM和留一法的前向浮动特征特征筛选算法选择对提高预测精度有利影响的特征。

令B= {xj: j=1,2,,, k}表示特征全集, Am表示由B中的m个特征组成的特征子集,评价函数MSE (Am)和MSE (Ai) i =1,2,,, m -1的值都已知。

本文采用的前向浮动特征筛选算法如下[9]:1)设置m =0, A0为空集,利用前向特征筛选方法寻找两个特征组成特征子集Am(m =2);2)使用前向特征筛选方法从未选择的特征子集(B -Am)中选择特征xm +1,得到子集Am+1;3)如果迭代次数达到预设值则退出,否则执行4);4)选择特征子集Am+1中最不重要的特征。

如果xm+1是最不重要的特征即对任意jXm +1, J (Am +1- xm+1)FJ(Am +1- xj)成立,那么令m = m +1,返回2) (由于xm+1是最不重要的特征,所以无需从Am中排除原有的特征);如果最不重要的特征是xr( r =1,2,,, m )且MSE (Am+1- xr) 预测评价指标及参比模型 训练结果评估阶段是对训练得出的模型推广能力进行验证,所谓推广能力是指经训练后的模型对未在训练集中出现的样本做出正确反应的能力。

为了评价本文模型的优劣,选择BPANN、多变量自回归时间序列模型( CAR)和没有进行拓阶和特征筛选的SVM作为参比模型。

采用均方误差(mean squared error, MSE)和平均绝对误差百分率(mean ab-solute percentage error, MAPE)作为评价指标。

MSE和MAP定义如下:M SE=E(yi- y^i)2n( 2)MAPE=E| yi- y^i| /yin( 3)其中yi为真值, y^i为预测值, n为预测样本数。

如果得出M SE, MAPE结果较小,则说明该评估模型的推广能力强,或泛化能力强,否则就说明其推广能力较差

大数据挖掘通常用哪些软件

1.RapidMiner只要是从事开源数据挖掘相关的业内人士都知道,RapidMiner在数据挖掘工具榜上虎踞榜首,叫好叫座。

是什么让RapidMiner得到如此厚誉呢?首先,RapidMiner功能强大,它除了提供优秀的数据挖掘功能,还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。

更厉害的是,它还提供来自WEKA(一种智能分析环境)和R脚本的学习方案、模型和算法,让它成为业界的一棵常春藤。

用Java语言编写的RapidMiner,是通过基于模板的框架为用户提供先进的分析技术的。

它最大的好处就是,作为一个服务提供给用户,而不是一款本地软件,用户无需编写任何代码,为用户尤其是精于数据分析但不太懂编程的用户带来了极大的方便。

2.R-ProgrammingR语言被广泛应用于数据挖掘、开发统计软件以及数据分析中。

你以为大名鼎鼎的R只有数据相关功能吗?其实,它还提供统计和制图技术,包括线性和非线性建模,经典的统计测试,时间序列分析、分类、收集等等。

R,R-programming的简称,统称R。

作为一款针对编程语言和软件环境进行统计计算和制图的免费软件,它主要是由C语言和FORTRAN语言编写的,并且很多模块都是由R编写的,这是R一个很大的特性。

而且,由于出色的易用性和可扩展性,也让R的知名度在近年来大大提高了,它也逐渐成为数据人常用的工具之一。

3.WEKAWEKA支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取,由于功能多样,让它能够被广泛使用于很多不同的应用——包括数据分析以及预测建模的可视化和算法当中。

它在GNU通用公共许可证下是免费的,这也是它与RapidMiner相比的优势所在,因此,用户可以按照自己的喜好选择自定义,让工具更为个性化,更贴合用户的使用习惯与独特需求。

很多人都不知道,WEKA诞生于农业领域数据分析,它的原生的非Java版本也因此被开发了出来。

现在的WEKA是基于Java版本的,比较复杂。

令人欣喜的是,当它日后添加了序列建模之后,将会变得更加强大,虽然目前并不包括在内。

但相信随着时间的推移,WEKA一定会交出一张很好看的成绩单。

4.Orange对很多数据人来说,Orange并不是一个陌生的名字,它不仅有机器学习的组件,还附加有生物信息和文本挖掘,可以说是充满了数据分析的各种功能。

而且,Orange的可视化编程和Python脚本如行云流水,定能让你拥有畅快的使用感。

Orange是一个基于Python语言的功能强大的开源工具,如果你碰巧是一个Python开发者,当需要找一个开源数据挖掘工具时,Orange必定是你的首选,当之无愧。

无论是对于初学者还是专家级大神来说,这款与Python一样简单易学又功能强大的工具,都十分容易上手。

5.NLTK著名的开源数据挖掘工具——NLTK,提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务,因此,在语言处理任务领域中,它一直处于不败之地。

想要感受这款深受数据人喜爱的工具的用户,只需要安装NLTK,然后将一个包拖拽到最喜爱的任务中,就可以继续葛优瘫N日游了,高智能性也是这款工具受人喜爱的最大原因之一。

另外,它是用Python语言编写的,用户可以直接在上面建立应用,还可以自定义小任务,十分便捷。

6.KNIMEKNIME是一个开源的数据分析、报告和综合平台,同时还通过其模块化数据的流水型概念,集成了各种机器学习的组件和数据挖掘。

我们都知道,提取、转换和加载是数据处理最主要的三个部分,而这三个部分,KNIME均能出色地完成。

同时,KNIME还为用户提供了一个图形化的界面,以便用户对数据节点进行进一步的处理,十分贴心。

基于Eclipse,用Java编写的KNIME拥有易于扩展和补充插件特性,还有可随时添加的附加功能。

值得一提的是,它的大量的数据集成模块已包含在核心版本中。

良好的性能,更让KNIME引起了商业智能和财务数据分析的注意。

如何用Eviews软件进行简单时间序列分析

主要是matlab:拿本书认真学上一个月就差不多了;lingo:做线性规划(很简单,可以学,不过没什么必要);SPSS:做统计方面的问题,解决各类回归问题以及统计检验,既简单又给力;eviews:做时间序列回归用的;excel:最简单,随便一学就会;R:等你会用matlab了,就不用学R了,和matlab的编程习惯差不多;

转载请注明出处51数据库 » R软件时间序列建模代码

软件
前端设计
程序设计
Java相关