论文部分内容阅读
随着社会的进步和通信行业的发展,通过电话进行沟通已经成为人们日常生活的重要组成部分。与此同时,越来越多的公司、团体、个人为了实现其经济利益或政治目的,通过骚扰电话这种方式对其目标人群进行骚扰,主要表现为电话营销、诈骗、反动信息传播等具体形式。这种行为不仅影响了人们正常的生活、工作,占用了有限的网络资源,甚至对于国家安全、社会稳定造成了不良影响。在骚扰电话的危害日益明显的情况下,对于骚扰电话的识别监控已经成为电信运营商需要重点解决的问题之一。在传统情况下,电信运营商都是通过被动的方式来处理骚扰电话,即在客服人员收到用户对骚扰电话的投诉时,通过回拨的方式进行确认。确认为骚扰电话后,发起对骚扰电话的拦截。这种方式效率较低,不能及时主动的发现骚扰电话并进行拦截,用户满意度较差,无法满足当前解决骚扰电话问题的需求。本论文通过对数据挖掘技术中的分类技术进行了研究,应用相关技术实现骚扰电话识别系统,来解决实际的骚扰电话识别问题。通过对电话呼叫数据的分析,主动检测出疑似骚扰电话,提交给客服人员进行回拨测试。通过骚扰电话识别系统,充分利用了历史通话数据,可以实现对骚扰电话的主动识别,并有效减少了客服人员的工作。对于提高骚扰电话识别效率起到了显著的作用。第一章主要介绍本论文所研究的课题的背景和意义,以及所研究课题的国内现状和发展趋势。第二章主要介绍数据挖掘技术相关的背景知识。对数据挖掘的概念、数据挖掘与知识发现的关系、数据挖掘可发现的知识、数据挖掘的分类以及数据挖掘工具的评价标准进行了简要介绍,并主要介绍了数据挖掘中的分类算法。第三章首先介绍了主要的几种贝叶斯分类算法进行了介绍,其次对骚扰电话的特征进行了分析并结合实际要求确定使用最小风险贝叶斯分类法来实现对骚扰电话的识别,最后介绍了算法的实现过程和效果验证。第四章主要介绍基于改进分类算法的骚扰电话识别系统的设计和实现。第五章介绍了应用数据挖掘技术解决骚扰电话识别问题的未来工作和展望。