面向主题的实时文本过滤系统

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:hordark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文为了有效地判别文章的观点立场,把一个题材鲜明的"反动"内容信息流视为一种攻击,把内容过滤的问题转化成了一个入侵检测的类似问题.根据过滤主题的域知识,提取攻击的特征,然后采用基于粗糙集的特征约简算法,去掉无关和次要的特征,再利用模式匹配的方法进行内容过滤.我们设计的内容过滤的主要功能包括:模式特征的提取和智能判决.为了避免正方文章因引用"反方论点"被丢弃等误判引起的虚警问题,该文采用了二次过滤的方法,根据不同的特征集合,区分文件内容和主题相关性以及倾向性.采用二次过滤的方法,减少了过滤所花的时间,同时还提高了过滤的准确率.
其他文献
随着互联网的普及与Web2.0技术的日益成熟,网络数据爆炸式增长,人们被淹没在浩如烟海的数据汪洋中而难以获取有用价值的信息。个性化推荐系统作为帮助人们获取有用信息、有效
关联规则是数据依赖关系的有效描述方法,是数据挖掘研究的重要内容。传统的关联规则挖掘缺少挖掘的针对性,挖掘速度慢,挖掘结果难于理解,挖掘结果的数量巨大,需要进行大量的筛选以
本文主要对常规武器监测和虚拟仪器技术做了较为深入细致的研究探讨,设计开发了虚拟仪器系统的硬件和部分系统软件,组建了虚拟仪器开发平台。在硬件的设计中,应用了目前比较流行
随着市场环境的日益成熟,竞争日趋激烈,客户资源日显重要。现代企业管理的重心随之从传统的生产、物流、财务等内部管理转向全面的客户关系管理(CRM).CRM系统因而成为企业的核
该文作者通过参与CodeWarrior平台上的SH处理器的调试器的设计和开发,对新的调试器的体系结构的设计与实现,对目标端调试协议MetroTRK的移植,以及嵌入式开发系统的安全问题作
近年来,机群系统在科学计算和商务服务领域得到日益广泛的应用,人们对机群系统的高性能计算及高可用性也提出了更高的要求.该文首先分析了机群系统中科学计算及商务计算的特
车辆电子综合系统是"九五"兵器重点预研项目,该系统是基于VxWorks实时操作系统,以1553B 作为现场总线.为了控制车辆电子综合系统的通讯,为此需要设计车辆电子综合系统的信息
我国现在已经成为全球主要的半导体封装产业基地之一,半导体封装测试产业也是中国半导体产业的重要支撑点和我国国民经济的重要组成部分。但是,伴随经济全球化和国内市场经济的
该文研究虚拟现实体图形学的一个重要算法——基于体单元(Voxel)的光线追踪算法.该文研究的内容主要有两大部份,一是体单元光线追踪算法原理的研究,二是算法的实现.在算法原
随着网络技术的迅猛发展,分布式应用日益广泛。然而,网络技术发展的多样性以及运行平台的异构性给分布式应用带来很大的困难。设计模式是近年来软件工程领域热门研究的课题,其目