论文部分内容阅读
【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集,结合Stacking分类算法识别潜在客户,分别使用基分类器算法和本文提出的针对不均衡数据集的Stacking分类算法对样本数据进行测试,并通过对比F值验证本文算法的有效性。【结果】本文提出的算法的F值较贝叶斯网络、逻辑回归、C4.5决策树、SMO和朴素贝叶斯5种基分类器算法分别提高17.4%、26.5%、24.1%、29.3%、40.9%,较Stacking、Bagging和Boosting三种集成学习算法分别提高10.1%、5.9%、13.1%。【局限】研究语料来源于汽车行业,具有一定的领域局限性。【结论】该方法能有效识别潜在客户。