互联网电子公告版内容审计策略的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zrn851207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子公告版,又名BBS,是Internet上一种面向文本的交互式、综合性信息服务系统.随着Internet在中国的高速发展,电子公告版系统已经成为了非常有影响力的信息传播途径.但是随着电子公告版系统传播的信息量急剧扩大,一些反动的、不良的信息也开始以电子公告版作为传播平台,进行宣传活动.如何对电子公告版上反动的、不良的文本内容进行审计,成为信息规范化管理的一个迫切需求.该文针对这种需求,对互联网上电子公告版的内容审计策略进行了研究,并具体实现了一个BBS内容审计系统.该文首先介绍了电子公告版内容审计的研究概况,在比较分析的基础上,提出了将信息过滤技术引入到电子公告版内容审计策略中.该文接着给出了电子公告版内容审计系统的基本系统框架设计和基本审计策略设计.针对电子公告版的特点,设计了一种分布式数据收集,集中分析的系统架构.同时提出了一种两级审计策略,来对电子公告版系统上的文本进行内容审计.即第一级审计先过滤出符合特定主题的文本数据,第二级审计再过滤出符合特定主题的某一倾向的文本数据.随后,该文分别对特定主题文本的审计技术和特定倾向性文本的审计技术进行了详细的研究.针对特定主题文本的审计,该文设计开发了一种基于双拼映射方案的中文关键词模糊匹配机制.针对特定倾向性文本的判断,该文采用了朴素贝叶斯分类算法,并对传统的针对中文的朴素贝叶斯分类算法的两个不足进行了改进,试验证明,改进后的朴素贝叶斯分类算法更能满足倾向性文本实时过滤的性能要求.最后,该文针对教育网上大量使用的火鸟BBS系统,实现了一个火鸟BBS内容审计系统.
其他文献
名实体最初是在MUC(Message Understanding Conference)上被提出的.根据最近的1997年名实体任务的定义,名实体识别包括三个子任务:实体名、时间表示语、数字表示语.其中实体
语音通讯是分布式虚拟环境中用户之间重要的交互方式。语音数据量大,这是所有通过网络传输语音数据的系统所必须考虑的一个问题。两点间的语音通讯,比如IP电话,可以借助语音编码
该文在全面分析移动Agent技术研究现状、研究热点和发展趋势的基础上,重点研究了移动Agent形式化建模、移动Agent规划、移动Agent通信以及移动Agent安全等问题.具体包括:(1)
本文所实现的部分是吉林省科技厅重大科技资助项目――“粮食管理信息智能决策支持系统”中的一部分。本系统主要以吉林省粮食工作为背景,利用数据仓库,数据挖掘,统计分析,知识推
在众多的信息安全技术中,入侵检测系统的发展引人注目。由于目前入侵检测技术的限制,检测系统报警误报率和漏报率都较高。报警数量多,粒度太细,各个报警之间没有联系,因此无法对入
物联网已成为当前世界新一轮经济和科技发展的战略制高点之一,被认为是继计算机、互联网之后,世界信息产业的第三次浪潮。在交通、公共安全、农业、环保、工业生产、电力、物流
信息安全现在已被越来越多的人们所重视,各种安全产品应运而生,如防火墙、入侵检测系统、安全服务器等等,而它们所依赖的系统平台是否安全是这些安全产品能否真正实现其安全功能
该文是国家自然科学基金项目:"电梯交通系统的智能控制及最优配置研究"(69874026)的后续研究.电梯交通配置系统所要解决的是一个复杂的、具有不确定性的决策优化问题.该文在
当前,国内外学者已经做了大量的工作来研究路由协议以及其相应的性能特点,也有少量关于能量方面的协议,但仍然存在许多未解决的问题.该文在总结前人的基础上,对Ad Hoc网络的
本文中,我们提出了两类前沿的基于无线传感网络的目标跟踪算法。第一种使用了射频传感网络;第二种将蚁群优化算法用于目标跟踪,具体如下.  RF传感网络是可以实现人或其它目标