基于服务器端的HTTP信息过滤系统设计与实现

被引量 : 0次 | 上传用户:21stsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现阶段,互联网已经成为人类生活和社会发展不可或缺的一部分。但互联网的开放性、平等性、无界性等特征又导致了网络的无限制滥用,大量的不良及敏感信息充斥于网络。网络信息中一个重要信息载体就是网页,而网页是工作在各种各样的服务器端的。如何针对服务器端的HTTP信息过滤,滤除各种不良及敏感信息,消除网络带来的消极及负面影响已成为互联网领域的研究热点,是具有非常重要的意义的。基于上述背景,本文选择HTTP作为研究对象,在研究信息过滤一般原理及常用HTTP过滤技术的基础上,设计并实现了一个基于服务器端的HTTP信息过滤系统。主要的研究工作和取得的成果有以下几个方面:首先,对HTTP协议进行简要介绍,并分析HTTP信息过滤的可行性,包括HTTP过程监控以及TCP连接人为控制等方法。使用winpcap数据包俘获机制对网络数据包进行捕获以达到实现监测网络信息的目的,并提出了优化监测性能的方法。同时,对HTTP数据包中文本信息匹配的方法,简要介绍了当前广泛使用的各种字符串快速匹配算法。其次,为了提高匹配的效率,增强系统的实时性,本文提出了详细的URL过滤方法。即使用哈希的方法,将URL进行哈希处理,减少了URL的存储空间并大大加快了URL的匹配速率。为了处理哈希冲突和优化哈希算法,使用链表的方法来处理哈希冲突并使用位图法加快URL节点查找效率,整体上提高了URL匹配的效率。再次,为了能够快速的匹配HTTP包中的关键词信息,本文在WM多模式匹配算法的基础上做出了一些优化,提出了一个可以快速匹配中文关键词的算法,整体上提高了关键词匹配的效率。最后,结合以上方法,设计并实现了一个基于服务器端的HTTP信息监控系统(原型),并在系统运行中进行了验证与测试。对算法效率的验证表明,本文上述提出的匹配算法同原有算法相比效率有了较为明显的提高。经过系统测试结果表明,该系统具有良好的准确性、可用性、稳定性和可适应性,在HTTP过滤速度和精度方面具有良好的效果。
其他文献
新媒体作为人们网络信息交流和人际交往的新平台,给社会主义核心价值观教育提供了新机遇,促进了核心价值观教育的显隐性转变,丰富了教育的内容,拓展了教育范围,促进了教育方
以大张坨地下储气库设计方案研究为例,在对该气藏进行地质综合研究的基础上,利用油气藏工程等多种方法进行论证,并结合京津市用气规律设计了气库运行基本指标,同时利用试井及
自1986年山东第一个风电场建成至今,我国风电发展不断完善。十八届三中全会中要求继续加强我国风电发展项目,加强新能源发电建设。风电是一种清洁的可再生能源,但风能供电不
为了确定作物长势遥感监测的评价指标,利用2000—2012年吉林省EOS/MODIS数据,采用NDVI旬最大值法,结合吉林省主要农作物生长发育的特点,对主要产粮区作物生长季旱田和水田的N
大张坨储气库是我国开工建设的第一座地下储气库 ,其试油 (气 )设计、施工具有很大的开创性。本文重点对其施工工艺进行了介绍、分析和总结 ,并结合施工实践提出了一些合理化
现阶段国内用于涂料印花的粘合剂绝大部分是聚丙烯酸酯类乳液,普遍存在热粘冷脆等问题。通过有机硅对聚丙烯酸酯改性,可以合成出具有成膜性能好、强度高、粘结性强等优点的聚合
组合测试是一种检测待测软件中由参数间相互作用所引发故障的测试方法,这一方法在实践中的应用离不开测试用例生成、优化约减、覆盖率评估等工具的支持。尽管在组合测试30多年的发展期间已经有了很多各具特色的组合测试工具,但是目前仍缺乏对现有工具的全面分析和比较。基于上述考虑,本文首先调研了现有组合测试工具的发展和应用现状。在此基础上,针对当前组合测试工具难于适应变化频繁的组合测试业务需求的问题,在组合测试工
伴随着网络等新媒体的产生和发展,新媒体打破传统电视、平面媒体“一家独大”的局面,纸媒和网络媒体之间互动、补充、促进,构成更为强大的舆论引导。当网络上升为媒体的时候涉及
在我国,证券市场的兴衰与实体经济的发展状况紧密相关,但是很多情况下证券市场与实体经济的发展也会有背离,导致无法准确把握证券市场的发展情况,预知其发展动向。而且最近一
79刑法将强买强卖、强迫他人提供服务或者强迫他人接受服务的行为规定在第三章破坏社会主义经济秩序罪中。针对此种类型的犯罪行为79刑法并未明确的提出具体的罪名进行规制。