网页内容分级系统的设计与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:xr6088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在社会各个领域的普及和应用,互联网已经成为人类社会不可或缺的重要组成部分。通过互联网传播的网页内容形式多样,如何对这些内容,特别是有害内容进行有效监管,是互联网研究的重要课题。本论文首先分析了世界各国在治理互联网有害信息方面所采取的各种措施,然后从技术角度出发,依据内容分级管理体系思想,结合支持向量机(Support Vector Machine,SVM)网页内容分类算法,提出了一种把网页内容分级和网页自动分级标记相结合的信息过滤系统:该系统以分级标准中的分级条目作为网页自动分级标记的依据,根据提前训练好的分级模板,对用户请求的未分级网页进行自动分级标记,系统最后依据内容分级过滤规则对有害信息进行过滤。在系统实现过程中,论文还引入了一些可行的安全措施,保证整个系统安全高效地运行。归纳起来,本论文主要做了以下几方面的研究工作:(1)论文分析了网页内容分级和当前主流过滤技术在世界各国的研究与实施现状,针对阻碍网页分级实施的各种不利因素,提出了一种把网页内容分级与网页自动分级标记相结合的信息过滤系统;(2)编程实现了对未分级网页的自动分级标记。该过程主要包括网页信息的提取与转换、网页特征向量计算、分类训练、网页分类以及分级标签生成等几部分。论文还搜集了相关网页数据,进行了实验验证;(3)为保证分级标签与相关网页信息的一致性和分级标签的安全性,系统在生成分级标签的同时,生成了对应网页的信息摘要,并将其作为分级标签的一部分储存在分级标签中,而且还对分级标签采取了数字签名,论文给出了详细的实现步骤和方法。
其他文献
文章对煤矸石焙烧相变特征规律,通过热分析、X衍射分析进行研究,阐述了煤矸石在焙烧过程中的物相变化过程,并开发出一种深加工工艺方法,重点研究了以焙烧煤矸石为原料,通过水
弗洛伊德提出个体心理过程服从两种基本倾向:快乐原则与现实原则。两种原则存在于个体的生存结构中,决定着生命的方向和生存的方式。孙犁的《铁木前传》展示了服从不同心理原
通过对西宁地区公众气象服务的需求分析,总结了当前制约西宁地区公众气象服务发展中存在的突出问题,提出了西宁地区公众气象服务的工作思路和公众气象业务体系建设的主要内容
<正>习近平总书记深刻指出:"一个国家、一个民族的强盛,总是以文化兴盛为支撑的""文化自信是更基础、更广泛、更深厚的自信,是更基本、更深沉、更持久的力量"。文化对一个国
本刊文 [1]提出一个猜想后 ,受到读者的广泛关注 .现将对该问题研究的结果按结论的深刻性、证明方法的多样性及来稿的先后顺序选编成文 ,供读者参考 .关于该问题得到正确结论
通过介绍当前具有代表意义的智能双向表计技术、智能电器及插座技术、智能用电终端技术、智能用电信息管理系统技术及互动式用电技术,分析了各项用电技术的特点及在智能电网中
近年来,随着服务贸易在国际贸易中比重的不断增加,服务贸易的竞争就成为逐渐成为国际贸易竞争的新领域。西安作为全国重点发展服务贸易的城市之一,在国际上逐渐显现出其强有
介绍全球疾病负担研究的概况和意义,指出其研究具有明显大数据分析特点。以全球疾病负担2010研究为例,详细阐述其原理、概念框架及技术架构,以期为我国开展类似的大数据分析