论文部分内容阅读
我国创业板和主板都在蓬勃发展。虽然两市场交易规则、投资者特征以及上市公司特点各有不同,但是两个市场都是符合中国国情的市场,所以两者之间具有可比性和彼此借鉴性。因此,可以找出主板与创业板两个市场企业的显著差异特征,再基于这些差异的特征分析创业板企业的成长性特点,以及该市场的现有制度的不足,提出一些相关的建议和研究的方向,也同时对我国创业型企业的发展提供了一定的参考。本文主要通过数据挖掘中的分类回归树,随机森林,以及Bagging算法在创业板和主板上市公司差异中的应用。首先,本文介绍了数据挖掘技术的理论和其在本文应用的优势;其次,介绍了三种挖掘算法的原理和三者之M的对比分析;同时构建了模型的指标体系,以实现对两市的差异性分类和得到相应的显著差舁特征;最后选取了2011年和2012年创业板和沪深300的上市公司,分别作为训练集和测试集,运用软件实现了上述所需的相关操作。本文研究的结粜,对于创业板和主板来说,三个模型的对测试集的分类效果都比较理想,达到了80%以上的正确率;后续对测试集的预测正确率也很好。从而通过分类的方法实现了降维的目的,得到了三个重要分类指标。然后以主板为基准,基于这三个差异指标分析了创业板上市企业成长性特点,得到了我国创业板目前出现的一些问题。最后通过本文的研究,为后续对我同创业板的相关制度的不足和未来这方面的研究方向做了展望。