【摘 要】
:
本文从某证券公司的新客电话营销问题出发,利用真实数据,优化模型及算法,研究如何更好地向新客户推荐理财产品。为了降低数据缺失对模型性能造成影响,我们尝试了三种方案来解决数据缺失问题,分别是单变量插补法、多变量插补法以及引入新特征,我们用实验论证了以上三种方法的合理性。此外,我们用实验证明,额外加入的社会经济指标,会对显著提升模型精准率。我们考察了五种经典的机器学习模型:分别是逻辑斯谛回归、随机森林、
论文部分内容阅读
本文从某证券公司的新客电话营销问题出发,利用真实数据,优化模型及算法,研究如何更好地向新客户推荐理财产品。为了降低数据缺失对模型性能造成影响,我们尝试了三种方案来解决数据缺失问题,分别是单变量插补法、多变量插补法以及引入新特征,我们用实验论证了以上三种方法的合理性。此外,我们用实验证明,额外加入的社会经济指标,会对显著提升模型精准率。我们考察了五种经典的机器学习模型:分别是逻辑斯谛回归、随机森林、支持向量机、神经网络、stacking集成,提出一种基于理财产品推荐的决策支持系统,提高了推荐精准率。逻辑斯谛回归和随机森林的优点是拟合模型容易被人类理解,同时在分类任务中也提供了良好的预测。与前面两个经典的统计模型相比,支持向量机和神经网络显得更加灵活,它们显示了从线性映射到复杂非线性映射的学习能力,二者的模型效果也是不相上下。由于上述这种灵活性,支持向量机与神经网络往往能够提供准确的预测,但所得到的模型很难被直观理解。而stacking正好弥补了它们的不足。但stacking由于涉及两层学习过程,至少需要运行四次不同的模型,导致运行速度偏慢。有趣的是,理论上最优的神经网络分类表现一般,充分说明了理论模型和实验结果存在一定的差异性。本文带给我们的最深刻的启示是:数据驱动生产。我们在做决策时,需要根据数据选合适的模型,进而才能做出合理的决策。一方面,考虑原始数据是否支持我们建立模型,另一方面,考虑模型的输出数据是否与个人诉求相匹配。
其他文献
作为全国首个城市将责任规划师制度写入《北京市城乡规划条例》,北京的城市治理正显现出共建、共治、共享的全新局面。通过顺义祥云小镇缓建步行街的实践,责任规划师已切实
随着计算机行业的快速发展和“互联网+”理念的提出,数据机房供电技术已成为重要研究课题之一。高压直流供电方式具有高可靠性、高功率密度的优点。VIENNA整流器作为高压直流
目的:观察比较针刀松解颈背部肌筋膜链上扳机点与常规针刺治疗神经根型颈椎病的临床疗效差异,对肌筋膜链和扳机点理论指导下针刀治疗神经根型颈椎病的临床疗效进行评价,为神
特色小镇作为新型城镇化的载体以及新农村建设重要的招商引资平台,通过特色产业链聚集,提供多层次、多元化的公共服务供给,优化城乡空间结构,发挥扶贫攻坚与辐射带动效应,助
血吸虫病是一种严重影响人类生命健康和经济社会发展的重大寄生虫病,流行病数据显示全球范围内有2.3至2.5亿人罹患血吸虫病,受血吸虫感染威胁的人数约有7.79亿。在我国仅有日
《非诚勿扰》是一档将现代男女性相亲过程公开化展示的大型服务类栏目。节目中的女性往往能够更加大胆的在公开场合表达自己,展现自己的形象。而节目本身也塑造了形形色色的
[目的]界定治理对象、厘清治理思路是开展农村相对贫困治理的基本前提.[方法]基于文献分析,整理2020年后中国农村相对贫困的治理对象与基本思路.[结果]2020年后中国农村相对
铸造起重机是金属热连轧和浇注工艺中吊运高温液态金属钢包不可缺少的一种繁重作业设备,具有工作环境差、环境温度高、作业频繁等特点,其设计和制造有着较高的要求。传统的铸
国际海事组织提出了严格的海上排放法规,使用天然气等清洁能源替代柴油可以显著改善船机的SOx和NOx排放指标。低压喷射天然气双燃料发动机由于预燃室点火系统和预混燃烧,具有排放低的显著优点,不需要任何后处理装置或者EGR就可满足IMO Tier III排放标准。但是由于预混燃烧而带来的爆震等问题严重阻碍了发动机功率的提升,并且天然气狭窄的燃烧界限提高了对发动机进行空燃比控制的难度。因此本文使用数值模拟
城市涂鸦,通常指兴起于上世纪60年代美国的,利用马克笔和喷雾罐进行的即兴的涂画活动(Halsey,M.&Young,A.,2002),是一种依托于城市空间实体所进行的表达性传播活动。在当代,