论文部分内容阅读
在上市公司财务分析中,大部分公司对财务数据的使用统计或者报表的分析方法,很多情况下财务人员难以分析处理多年财务相关数据以及整个行业领域的海量信息,不能发现财务数据或者财务属性之间的内在联系。数据挖掘是基于数据库和商业智慧的可以发掘出隐藏的、有用的知识的技术,和以前的分析方式比,它能发掘出累积的大量的财务数据中未知的,难以发现的信息,能够帮助分析人员、和决策者深入认识公司的经营状态.。本文分析对象是在锐思数据库上获得的不同上市企业2014年第三季度的财务数据。首先是介绍聚类分析,决策树分类,关联规则等数据挖掘的算法,然后按照数据挖掘的流程从数据预处理到数据探索和数据挖掘模型的建立,结合运用所学的R,Matlab等多元统计分析软件对数据进行处理和挖掘,发现上市公司13大概念股之间存在更紧密的聚类方式,可以聚类成5个更相似的类别,通过聚类之后的数据对决策树的分类效果有很显著的提高,关联规则分析得到上市公司财务数据中财务指标之间的强相关性和规则以及财务指标对板块概念股的分类有重要影响,如属性中流动比例较低(小于等于1.5)则该公司更可能属于稀缺资源型的公司。数据挖掘技术的运用既能够为辨别财务造假提供数据支持,还能指导股民或者群众进行有针对性的投资,对管理层做出及时、适当的决策也能提供非常大的帮助。