互联网财经新闻对中国股市的影响研究

被引量 : 0次 | 上传用户:davesd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球经济包括中国经济正处在一个关键的转型时期,人们对于资讯的及时性和准确性的需求越来越强烈。股票市场风云变幻,任何消息面的报道都有可能引起股市的大波动,例如公司高管辞职及股权斗争、铁路动车相撞、国家颁布房产限购令等热点事件。那么,如何快速准确的判断消息面的价值,便成为投资者不得不思考的重要内容。由于互联网访问的便捷性和实时性,使得信息的传递更加迅速直接。在信息爆炸的时代里,互联网资讯日益剧增,互联网正逐渐从一个简单的信息发布平台演变为新闻媒体传播的主流载体,其在证券市场对投资者行为的影响也日益加深。因此,如何利用互联网的便捷性和高效性来捕获优质的有价值的信息,无论对于投资者还是上市公司,都变得尤为重要。本文运用自然语言处理技术将非结构化的文本语言进行智能处理,采用事件研究法和构建截面回归模型的方法对公司个股和行业指数数据进行分析,实证研究了互联网财经新闻对中国沪、深股市的影响。研究发现:(1)互联网财经新闻报道会对中国股票市场产生影响。可以说互联网财经新闻对股票分析的影响是不可忽视的。(2)互联网财经新闻报道对沪深两市的股价变动产生的影响不同。研究发现新闻发布对深市股价的影响力度和持续时间均要强于沪市股票。(3)从个股特征、新闻属性、市场状态及行业信息、等多方面来看,互联网财经热点新闻对股价的冲击程度不同。第一,由于沪深两市上市公司规模等特征的不同,个股对新闻的反应表现不同。深市上市公司个股股价变动受新闻影响更大。第二,新闻类别不同,所产生的冲击效果不同。第三,在不同的市场周期(牛、熊市)内,新闻媒体报道对股票价格影响不同。熊市状态下,投资者对新闻报道更为敏感。第四,从行业分析结果来看,行业指数同个股股价对新闻都有较为一致的反应,即,深市股价较于沪市更容易受到新闻报道的冲击。但新闻报道对行业指数造成的变动持续时间比个股更长,可以说行业价格指数作为若干个股的综合表现,其扩大了这种“新闻效应”。同时,本文发现我国在信息披露上存在漏洞,新闻事件在被公开报道之前,股票市场便已提前获知。由此,本文在充分分析了如上实证结果后,提出了相应的几点启示,从市场效率、投资分析、政策监管、公司治理等四方面进行分析总结,希望给学术界及实业界提供可用的建议。本文在研究思路上,首先采用事件研究法对公司个股事件进行分析,探讨在总样本下新闻对股市是否有冲击,分析沪深两市的两分样本下市场对新闻的反应情况。接着,通过支持向量回归技术将文本进行数值量化,构建截面回归模型,精确分析公司新闻报道对股票价格的冲击。此处得到的结论与事件研究法基本一致,并且发现了新闻因子的影响力度值。众所周知,股票市场风云变化,任何一条信息都有可能引起个股股价乃至整个股市的波动,比如国家监管部门颁布的新政策,经济运行状况及国际新动态等。因此,在对公司新闻和个股表现进行有效分析后,本文加大了数据量,对市场上所有的热点和突发事件进行全面分析,在研究方法上采用了事件研究法,分析对象为行业指数数据,希望能够得到新闻报道对行业指数走势的影响和冲击。在对行业信息进行分析时,同样将关注重点分为沪深两市,研究不同类别的新闻事件对行业指数的影响,并分析在不同的市场状态下股价对新闻的敏感性,即,将数据分为牛市和熊市两组进行对比分析。本文的研究技术主要分为两方面:自然语言处理技术与金融学研究方法。(1)本文在运用自然语言处理技术时,采用了支持向量回归的方法将非结构化文本语言量化为结构化数值数据,从而进行回归建模分析;针对海量数据,采用了命名实体识别技术迅速有效的完成了数据匹配工作;运用文本分类技术对新闻文本数据进行分析归类,帮助后文进行深度的实证分析。(2)本文在金融理论的研究方法上,采用了事件研究法和截面回归的方法。事件法主要用来研究新闻事件在报道前后对股价有没有产生冲击。事件研究法是本文的主要研究方法,用来研究公司个股和行业指数对新闻的敏感度。建立截面回归方程主要是针对公司个股进行分析,将个股基本交易数据和新闻文本数据进行结合,能够衡量新闻因子的重要性,并且能够得到比事件法更为精确的结果,从而增加了本文的研究精确度和深度。本文主要的贡献点在于充分考虑了股票交易市场中难以量化和掌握的热点财经新闻,发掘了个股的价值和公司的潜力,并且针对沪深股市的不同表现进行深入的探讨。本文的研究不仅能够发掘新闻中潜在的信息,帮助投资者科学迅速的掌握市场动向,还能对上市公司和市场监管者提供有效建议。(1)本文针对前期个人研究发现的沪深股市的不同表现,进行了深入全面的探讨。本文分析了个股和行业指数在不同情况下对新闻报道的敏感度,是国内首例同时将新闻文本信息和股票的定量指标相结合来分析沪深股市行情的研究。本研究的顺利实施将为提高股票分析的科学性和准确性探索出一条新的途径。(2)本文利用计算机科学中的信息检索技术和自然语言处理技术从海量的互联网新闻中挖掘出有用的市场信息,通过利用媒体资讯来弥补信息不对称。作为信息技术和金融学相结合的交叉学科,金融智能在实际的应用中越来越广泛。本文正是利用金融智能解决实际问题的应用典范。(3)本研究利用互联网新闻来获取宏观和微观的股市信息,互联网新闻的有效利用极大地拓展了市场信息获取的深度和广度,大大的弥补了学术界和实业界在此方面的空白。本文对市场上微观和宏观新闻都进行了深度的分析,研究了个股数据和行业数据,在学术上提出了严谨的科学的观点,在技术上提供了典范,为学术界和实业界提供了很好的借鉴。本文在资料选取中,充分参考了国内外最先进的研究成果。在理论参考上,选取了相关领域国际顶级期刊上的科学研究成果,如金融学领域的的Journal of Finance等,计算机领域的顶级会议研究论文,如ACL等。在技术上,自主开发了有针对性的网络爬虫;自动扩充了国际权威的Harvad-Ⅳ WordNet词库,将GlCS1及中国证监会行业分类标准中的关键词融入其中,得到了科学严谨的金融学词库。同时,采用了IBM的文本分类软件ICM(IBMInfoSphere Classification Module),保证了研究中对文本处理的准确性。本文无论在理论研究还是技术运用中,都参照了国际先进水平的研究成果,将理论和技术研究有效结合,开辟了金融智能领域的一条崭新的研究思路。财经热点信息往往是投资者关注的焦点,是股票分析不可忽略的消息面信息。由于缺乏科学有效的方法,现有的研究中往往难以将文本信息进行科学的定量分析。新闻的文本信息与股票的定量指标相结合,将能更加有效地弥补股票市场的信息不对称。将文本挖掘技术应用到金融市场将是一个大趋势,能够更加充分地考虑股票交易市场中被遗漏的公司新闻文本信息,发掘股票的价值和公司的潜力,为利用媒体资讯来弥补信息不对称,帮助投资者和研究者更好地利用金融信息,进行股票分析提供了一条切实可行的路径。本文不断扩展文本挖掘和分析的范围,对股票市场上不同类型和来源的信息进行挖掘和分析,从中得出一定的模式,生成一定的信息产品,以快速、准确地判断该信息对个股乃至整个股票市场的影响。本文所提出的观点和使用的技术都将对今后的学术和实业界研究提供科学的依据和建议,为我国股票市场的研究提供崭新的思路,帮助金融智能技术更快更好的发展,有效的运用到实践中。
其他文献
当前,生态危机已成为全球性问题,给人类的生存和发展带来巨大威胁。在对生态危机的反思中,人类对生态环境问题的认识越来越深入,“生态文明”概念已成为时代概念,人类迎来了
2009年底,国际三大评级机构对希腊债务评级的相继下调宣告希腊债务危机的正式爆发,自此拉开欧洲债务危机的序幕;其后,希腊政府采取削减财政赤字、发行新的国债等一系列措施,试
2010年国际巴塞尔委员会出台《巴塞尔协议Ⅲ》,继2004年《新巴塞尔协议》落地不过短短6年时间,随后我国为响应国际协议于2011年出台银行监管新规并于2012年正式实施,这一系列
有关全面预算管理,在经济发展迅猛的今天,位于中国企业管理,具有十分宽广的应用,也取得了相应的成绩。但是,只是拥有科学的、完整的一套预算考评体统是不够的,应要通过考评系
目的 探讨淀粉样脑血管病 (CAA)所致脑出血的临床特点。方法 复习文献结合临床 ,对我院 2年来收治的 18例CAA引起的脑出血病人进行临床资料分析。结果 该病例的发现 ,随影
企业每年产出乙烯裂解轻质重馏分20000吨,该馏分富含C9、C10芳烃,目前主要用作燃料,资源浪费严重。在本课题,我们拟开展乙烯裂解轻质重馏分深加工的工艺研究,包括实验研究和
近年来,四川省外商直接投资的规模越来越大,对经济社会的发展起到显著的推动作用。但四川省利用外资的企业数量仍然偏少,投资效益低,分布结构不合理,与四川省产业结构调整和
近些年来研究表明心肌梗死后心脏重构的现象严重,包括结构重构,心电重构,神经重构等。在急性心肌梗死幸存人群中,仍有多数人因致命性心律失常或难治性心力衰竭而死亡。心肌梗
股利政策是一个悠久且经典的研究领域,也是截止现在仍然带着一层神秘面纱的一个谜题。股利政策,或者说股利分配,尽管是一个老生常谈的议题,但相关的研究却源源不断地为这一领