网页内容分级系统的设计与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户：xr6088

【摘要】

：

随着互联网在社会各个领域的普及和应用,互联网已经成为人类社会不可或缺的重要组成部分。通过互联网传播的网页内容形式多样,如何对这些内容,特别是有害内容进行有效监管,是

【作者】

：

史正群

【出处】

：

北京交通大学

【发表日期】

：

2015年01期

【关键词】

：

内容分级分级标签文本分类支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网在社会各个领域的普及和应用,互联网已经成为人类社会不可或缺的重要组成部分。通过互联网传播的网页内容形式多样,如何对这些内容,特别是有害内容进行有效监管,是互联网研究的重要课题。本论文首先分析了世界各国在治理互联网有害信息方面所采取的各种措施,然后从技术角度出发,依据内容分级管理体系思想,结合支持向量机(Support Vector Machine,SVM)网页内容分类算法,提出了一种把网页内容分级和网页自动分级标记相结合的信息过滤系统：该系统以分级标准中的分级条目作为网页自动分级标记的依据,根据提前训练好的分级模板,对用户请求的未分级网页进行自动分级标记,系统最后依据内容分级过滤规则对有害信息进行过滤。在系统实现过程中,论文还引入了一些可行的安全措施,保证整个系统安全高效地运行。归纳起来,本论文主要做了以下几方面的研究工作：(1)论文分析了网页内容分级和当前主流过滤技术在世界各国的研究与实施现状,针对阻碍网页分级实施的各种不利因素,提出了一种把网页内容分级与网页自动分级标记相结合的信息过滤系统;(2)编程实现了对未分级网页的自动分级标记。该过程主要包括网页信息的提取与转换、网页特征向量计算、分类训练、网页分类以及分级标签生成等几部分。论文还搜集了相关网页数据,进行了实验验证；(3)为保证分级标签与相关网页信息的一致性和分级标签的安全性,系统在生成分级标签的同时,生成了对应网页的信息摘要,并将其作为分级标签的一部分储存在分级标签中,而且还对分级标签采取了数字签名,论文给出了详细的实现步骤和方法。

其他文献

煤矸石焙烧相变特征、深加工工艺及在绝热材料中的应用前景

文章对煤矸石焙烧相变特征规律,通过热分析、X衍射分析进行研究,阐述了煤矸石在焙烧过程中的物相变化过程,并开发出一种深加工工艺方法,重点研究了以焙烧煤矸石为原料,通过水

期刊

煤矸石焙烧相变特征4A分子筛合成绝热材料

文学家对个体生存心理原则的关注方式与评判——以孙犁《铁木前传》为中心的探讨

弗洛伊德提出个体心理过程服从两种基本倾向:快乐原则与现实原则。两种原则存在于个体的生存结构中,决定着生命的方向和生存的方式。孙犁的《铁木前传》展示了服从不同心理原

期刊

快乐原则现实原则个体生存叙述者

西宁地区公众气象服务需求分析与对策

通过对西宁地区公众气象服务的需求分析,总结了当前制约西宁地区公众气象服务发展中存在的突出问题,提出了西宁地区公众气象服务的工作思路和公众气象业务体系建设的主要内容

会议

公众气象服务需求分析对策

打造湘商文化品牌助力企业改革发展

<正>习近平总书记深刻指出:"一个国家、一个民族的强盛,总是以文化兴盛为支撑的""文化自信是更基础、更广泛、更深厚的自信,是更基本、更深沉、更持久的力量"。文化对一个国

期刊

企业改革发展文化自觉企业文化建设企业管理制度商文化湖湘特色企业转型发展“两微一端”法人治理结构新发展理念经营管理水平企业管理创新湖湘文化

等比数列存在等差子列的若干结论

本刊文 [1]提出一个猜想后 ,受到读者的广泛关注 .现将对该问题研究的结果按结论的深刻性、证明方法的多样性及来稿的先后顺序选编成文 ,供读者参考 .关于该问题得到正确结论

期刊

等比数列等差数列

浅谈刍议智能用电技术

通过介绍当前具有代表意义的智能双向表计技术、智能电器及插座技术、智能用电终端技术、智能用电信息管理系统技术及互动式用电技术，分析了各项用电技术的特点及在智能电网中

期刊

智能用电智能表计智能电器智能插座smart electricity smart metering smart appliances smart sock

西安服务贸易的国际竞争力研究——基于成都的比较分析

近年来,随着服务贸易在国际贸易中比重的不断增加,服务贸易的竞争就成为逐渐成为国际贸易竞争的新领域。西安作为全国重点发展服务贸易的城市之一,在国际上逐渐显现出其强有

期刊

服务贸易国际竞争力比较分析

全球疾病负担研究——大数据分析应用实例

介绍全球疾病负担研究的概况和意义,指出其研究具有明显大数据分析特点。以全球疾病负担2010研究为例,详细阐述其原理、概念框架及技术架构,以期为我国开展类似的大数据分析

期刊

大数据全球疾病负担数据综合分析疾病和伤害危险因素

网页内容分级系统的设计与实现

其他学术论文