基于机器学习的私募股权基金业绩预测模型

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:yobisisi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,为激发社会活力,寻找新的经济增长点,国家积极号召“大众创业、万众创新”,并相继出台多项方针政策为“大众创业,万众创新”清障搭台。“创业、创新”浪潮的兴起也极大地促进了我国私募股权投资市场的发展。私募股权投资(PE)自20世纪80年代中期在中国兴起以来,至今已有30多年的历史,其投资活动的开展一般是通过设立专门的私募股权基金进行的。近年来我国私募股权投资市场不断完善,私募股权基金也呈现出一些新的特点,如:私募股权基金投资规模增长迅速,影响力逐步扩大;本土资本投资超越非本土资本投资,成为主流;投资阶段向后转移;投资地区呈现分散化趋势;投资行业集中于高科技、高附加值行业;退出方式多元化等等。整体来看,中国的私募股权基金日渐发展壮大,受到越来越多投资者和创业者的重视,俨然已经成为中国金融市场上一支不可忽视的重要力量。在这样的背景下,对我国的私募股权基金业绩进行详细的研究显得尤为重要。由于私募股权投资的非公开性,我国私募股权基金并不会定期披露投资业绩,对于其业绩的衡量指标只有投资项目退出时的内部收益率和投资回报倍数;又因为目前为止中国私募股权投资市场上,拥有两次及以上成功投资退出经验的基金非常少,所以,当前对我国私募股权基金业绩的研究基本上等同于对私募股权投资项目退出收益的分析,本文对私募股权基金业绩的研究就是基于投资项目层面的数据展开的。本文在理论分析和文献梳理的基础上,获取了2009年1月1日到2017年12月31日间退出的私募股权投资项目数据共计2776组,从项目特征、投资方案、机构特征和宏观环境四个角度入手选取了较为全面的解释变量对我国私募股权基金业绩进行了层层递进的三个方面的研究:首先,运用线性回归模型和单因素方差分析对私募股权基金业绩的影响因素进行了系统的研究;接着,在影响因素分析的基础上,运用多种机器学习方法建立回归预测模型,选择预测效果最佳的模型,并根据模型输出结果进行变量重要性和偏依赖分析,从非线性的角度反映各个解释变量与私募股权基金业绩的关系;最后,基于多种机器学习分类算法建立了预测性能良好的私募股权基金投资业绩的等级预测模型,进而为投资者提供投资建议。通过研究,本文主要得出以下四点结论:第一,我国私募股权基金投资业绩明显优于公开市场投资业绩,但近年来私募股权投资市场相较于公开市场的收益优势正在缩小,且投资风险不断增大,投资者应谨慎投资。第二,总体而言,投资方案、宏观环境以及项目特征相关的解释变量对私募股权基金投资业绩的影响程度较大,而机构特征相关变量对其投资业绩的影响较小;投资地区及投资阶段不同,私募股权基金投资业绩的影响因素也存在差异,投资者应根据投资项目的具体情况着重考虑相关的影响因素,以期获得较高的投资收益。第三,基于机器学习的私募股权基金业绩回归模型较传统方法有了很大的改进,回归效果最好的随机森林模型对投资业绩的解释力达到了58.5%;但总体来讲,模型的预测效果较差,说明在现有数据的基础上直接预测私募股权基金投资项目的收益数值存在较大难度。第四,随机森林分类模型对私募股权基金投资项目的收益等级预测有良好的性能,模型的整体预测准确度达到了81.59%,说明模型的分类结果可信;具体来看,模型对高、中、低三个收益等级的预测准确度分别为:77.21%、92.19%、54.05%。从模型的混淆矩阵来看,模型的错误分类结果大多发生在相邻类别之间,即错误分类的影响可控,保证了模型应用的科学性。得益于数据量的扩充,与以往的文献相比,本文主要有以下两方面的创新:第一,研究内容的创新。本文从项目特征、投资方案、机构特征以及宏观环境四个方面入手,选取了更加丰富的影响因素变量,详细地研究了相关变量对私募股权基金投资业绩的影响;在此基础上,建立了性能良好的私募股权基金业绩预测模型,拓展了我国私募股权基金投资领域的研究内容。第二,研究方法的创新。现有文献对私募股权基金业绩的研究以线性回归模型为主,而本文在线性回归模型的基础上,又引入了单因素方差分析和多种机器学习算法,从线性和非线性的角度对比研究,提升了实证模型的性能。
其他文献
针对国内泵行业的现状,为泵行业更好更快地发展,提出了一些需要注意的问题,并给出了几点建议。
本文以平遥古城保护实践为例,指出历史文化名城应尊重科学,顺应规律,正确处理历史文化名城保护与发展之间的关系,不断创新思路,在切实保护好文化遗产的前提下,探索多种合理利
从经济学角度看,审计失败可以看作是一种市场失灵。根据经济学的市场失灵理论,审计信息供给的垄断性和竞争性、公共物品性、外部性以及分布的不对称性是导致审计市场失灵的主
近几年来,微信等新媒体的出现,为大学出版社的发展开辟了另一个通道,丰富了大学出版社图书产品的宣传途径,也强化了其品牌形象建设,尤其是多元化的内容形式和文案特色更是为
信用评分和行为评分是帮助金融机构评定借款者信用的技术。基于信用风险理论,利用统计和概率研究的技术来分析信用评分与行为评分体系的发展逻辑,解析目前四种主流利润评分方
高等教育是学生从家庭人成为社会人的转换器,目标是培养社会需要的高级专门人才。本文从高级专门人才的构成要素——知识、技能和思维入手,分析了它们的培养规律差异,指出不
在既有的公司治理和公司财务的研究中,关于高管特征研究的理论基础主要集中在高管人生经历可能形成的心理特征和性格特点上(Malmendier et al.,201 1a,2011b,2015,2016)。但
该文研究不同栽培基质对郁金香生长性状及成花率的影响,以期找到最适合郁金香生长的基质。结果表明:不同基质对郁金香生长的影响有明显差异,以草炭∶蛭石∶珍珠岩=1∶1∶1为
利用微藻吸收工业废气中高浓度的CO2不仅可以显著增加微藻的生物量和油脂产量,还可以达到碳减排的目的,但是CO2在水体中溶解度较低一直是微藻利用高浓度CO2的瓶颈。探讨了CO2
<正>近年来,随着辅助生育技术的开展,促排卵药物的使用成为排卵障碍性不孕症患者的主要治疗方法。在接受促排卵患者中卵巢过度刺激综合征(OHSS)总体发生率为23.3%[1]。根据卵