基于用户生成内容的潜在客户识别方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:LUOJIAJUN32
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集,结合Stacking分类算法识别潜在客户,分别使用基分类器算法和本文提出的针对不均衡数据集的Stacking分类算法对样本数据进行测试,并通过对比F值验证本文算法的有效性。【结果】本文提出的算法的F值较贝叶斯网络、逻辑回归、C4.5决策树、SMO和朴素贝叶斯5种基分类器算法分别提高17.4%、26.5%、24.1%、29.3%、40.9%,较Stacking、Bagging和Boosting三种集成学习算法分别提高10.1%、5.9%、13.1%。【局限】研究语料来源于汽车行业,具有一定的领域局限性。【结论】该方法能有效识别潜在客户。
其他文献
城市近郊地区贫困、发展困难是全球性问题。经过30多年对城市近郊地区的帮扶,目前城市近郊地区不仅解决了亿万贫困人口的温饱问题,而且显著提高了居民的生活水平。由于中国人
红松无性系种子园的建立及经营管理技术孟广仁(本溪县清河城实验林场117116)建立红松无性系种子园是一项技术性较强,经营管理又比较复杂的工作。我场在承担部省联营林木良种基地一二期
水电站工程中涉及的相关专业的标准、规范不断更新,对水电站厂房渗漏排水系统油水分离方案也有了更高的要求。现对水电站厂房渗漏排水系统油水分离设计方案进行研究,旨在减少