线性模型中的变量选择及股票市场实证研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xincqu923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性回归分析是各种多元统计分析方法当中应用最为广泛的一种方法,目的是为了研究多个变量间相互依赖的关系。而建立回归模型的过程中,有一个非常重要的问题,就是如何从众多的解释变量中选取对响应变量影响最大的变量,即变量选择问题。变量选择在现代统计学中的地位越来越重要,其中,于1996年Tibshirani提出来的“Lasso”方法受到了学者们的追捧。随着计算机技术的不断发展,现阶段,“Lasso”方法已经被用到各类模型中来解决变量选择问题。本文主要是将“Lasso”方法运用到回归模型,并利用股票市场来进行实证研究。首先,本文从多元回归分析入题,简单介绍了线性回归模型中有偏估计的发展、线性模型中常用的变量选择方法。其次,本文对“Lasso”方法进行了详细的解释,主要介绍了“Lasso”的定义、Lars算法以及”Lasso”的相关方法等等。最后,本文选取上证50指数的5分钟分时数据作为因变量,组成上证50指数的50支股票的相同时间段的5分钟分时收盘价作为自变量进行实证研究。为了体现“Lasso”方法的压缩与选择功能,本文还选择了逐步回归方法作为对比,通过对上证50指数和组成其指数的50只成分股建立回归模型,然后采用“Lasso”方法和Lars算法,运用R软件中Lars程序包对模型进行求解。最后成功选取出了19支对上证50指数影响较大的成分股,通过进一步的拟合分析,发现模型效果是很好的。本文最后还在模型中引入权重,以使用更多的自变量信息,发现引入权重后选择的股票只数并未改变,只是每只股票的系数发生了变化,拟合发现加入权重后效果更好,拟合值与真实值的走势更加接近。可以作为投资者预测股市动态的一部分参考。以达到本文运用变量选择方法研究股市行情的目的。
其他文献
健美先生语:不要一提意大利就想到比萨饼,比"比萨"还好吃的是意大利面条——也就是风行的"斯帕海蒂",健美一族怎可无视"斯帕海蒂"?而若是粉丝再加上肉丸,岂不更HIGH!
近年来,我国经济处于快速的发展的进程当中,基金行业在市场经济大环境下扮演越来越重要的角色。从宏观方面来讲,对我国基金进行绩效评价可以为我国经济持续健康的发展提供了
近年来,大气压等离子体在生物方面的应用日益广泛,但是等离子体对生物体造成的影响还有待进一步研究。自上世纪八十年代开始,等离子体已经被逐渐应用于灭菌、辅助血液凝固和
在网络经济是网上支付快速发展的宏观背景下,本文针对我国网上支付市场的供需特点与发展趋势,重点分析市场发展存在的相关主要障碍,在市场发展的内在规律的指导下,提出我国网
运用能值理论分析方法,选取2004—2014年的统计数据,对长治市水土流失治理生态经济系统的投入产出能值及主要能值指标进行分析。研究表明:系统能值投入波动较大,整体呈增加趋
体育消费作为当今的热门话题之一,理论界近几年来进行了大量的理论和实证研究。本文通过对目前高校普通大学生体育消费的内容及目的,以及类型特点等有关因素做定性和定量的分析
中国的文字自信其实就是汉字自信。汉字有许多足以自信的特质,包括汉字是与时俱进的文字、是包容性和开放性文字、是高颜值文字、是有高度规范的文字。汉字是中国文化软实力
今天的主人公叫张孟晖,一个刚满20岁的小伙子,就读于首都经贸大学,今年上大二,但是练健身已经有4年多的时间了,用他爸爸的话说,从小到大给他报了无数个学习班,但是只有健身他
<正> 第二次世界大战,日军在泰国闪电式登陆,泰国政府为了生存只得屈从。 日军在泰国建立司令部后,便计划修筑战略铁路作为主要运输线。该铁路的起点在泰园叻丕府廊巴多,横贯
以大伙房水库流域4种不同水源涵养林植被类型为研究对象,研究土壤微生物量碳(MBC)、氮(MBN)含量以及土壤理化性质和凋落物养分的变化特征,运用通径分析模型,探讨土壤微生物量