论文部分内容阅读
目前,安全审计系统主要关注的大部分都是数据报文的完整性和合法性,对于内容安全的审计研究不多,针对于移动互联网的就更少了。本文研究设计的移动互联网内容安全审计系统,应用模式匹配的相关算法,将单模匹配与多模匹配结合起来,实现了对移动网络交互内容的审查,可以实时监控和审计移动网络内容的安全,辅助监控人员及时发现移动网络中传播的非法信息,并提供事后追究的依据。本文的研究工作主要有以下几个方面:(1)研究了安全审计的基本理论和分析方法,针对移动互联网内容安全审计,选择了模式匹配算法来实现基于本文的移动互联网内容安全审计系统,并介绍了当前比较常用的单模式和多模式匹配算法,比较分析了它们各自的特点和不足。(2)结合中文语境中关键字出现概率分布不均匀的特点,在单模式匹配BM(Boyer-Moore)算法基础上提出了基于汉字频率改进的BMMA (Boyer-Moore Algorithm for Mobile Internet Security Audit)单模式匹配算法。在进行匹配判定的时候根据关键字出现的概率进行优先匹配,从而减少二次匹配的次数,提高匹配效率,使之更加适用于中文语境。(3)针对多模式匹配WM (Wu-Manber)算法的不足进行了改进,提出了WMMA (Wu-Manber Algorithm for Mobile Internet Security Audit)算法,取消了前缀表PREFIX,节约了相应的查询时间和存储空间,并且引入了新的尾字表,在汉字模式串普遍较短的情况下,通过其来减少hash计算的次数,避免过短的模式串给系统增加过多的hash计算负担,并且在多模式匹配中本文应用了TF-IDF关键词权重的不同来进行优先的匹配,从而提高算法整体的效率,也让改进后的算法更加适合中文语境下的移动互联网内容安全审计系统。(4)根据移动互联网内容安全审计的需求和特点,设计和实现了移动互联网内容安全审计系统。该系统通过代理数据采集服务器对移动用户的网络访问进行数据信息抓取和处理,然后通过匹配规则库设定关键词,最后通过内容审计模块中的单模式与多模式匹配算法模型进行内容安全审计。论文最后对设计的系统进行测试,实现了移动网络内容安全审计的基本功能并且在响应时间上对用户的操作体验影响微乎其微,达到了设计要求。论文的工作得到了国家自然科学基金(No.61371071)、北京市自然科学基金(No.4132057)和北京科技计划(No.Z121100007612003)等课题的支持。