论文部分内容阅读
至2011年以来,即时通信跃升为中国互联网第一大上网应用,伴随着移动智能终端的普及,手机即时通信用户更是达到了3.52亿,即时通信产品成为了人们生活中常用的沟通交流工具。与此同时,也出现了许多安全问题,据统计63%的即时通信用户遭受了垃圾信息的侵扰。设计针对即时通信垃圾信息的监控和过滤系统变得具有重要的意义,本论文分析了各种过滤技术的优劣势,结合即时通信具有的特征,设计了基于内容和社会网络关系的垃圾信息过滤监管系统。文章分析了目前几种主流的即时通信软件的通信架构与协议,重点对几种明文传输的即时通信软件实现了内容识别,结合关键字加权机制实现了快速匹配,采用文本分类方式实现了深度检测,引用社会网络分析方法实现了另一角度对垃圾信息的过滤。本论文的主要工作有以下几个方面:1.深入分析了目前几种主流的即时通信软件的通信架构与协议,并对其常用的信令格式与作用进行了剖析,为建立基于协议的即时通信系统过滤算法和搭建系统奠定了基础。2.详细地介绍和分析了目前几种主流过滤算法,包括关键字加权机制的过滤算法、关键字匹配的过滤算法、分词的过滤算法、基于贝叶斯分类原理的过滤算法等,同时分析了社会网络在安全内容过滤中的应用。在深入分析已有这些算法基础上提出了改进的过滤算法。3.搭建了即时通信内容过滤测试环境,对每一个模块进行了分别的实现和测试。