贝叶斯算法在智能终端信息过滤中的应用研究

被引量 : 0次 | 上传用户:cuidayue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展,智能终端信息系统以使用方便、快捷、廉价、可靠的特点很快被广大网民所接受,已成为当前最流行的信息交流方式。智能终端信息系统给本文带来便利的同时,垃圾信息应运而生,带来了巨大的危害。因此,开展利用过滤技术研究,阻挡智能终端垃圾信息,解决智能终端信息问题,具有重要意义。贝叶斯过滤技术应用于文本分类等领域,智能终端信息过滤本质上是文本分类问题,因此贝叶斯算法在智能终端信息过滤领域有着很好的应用。以此为出发点,论文分析了目前智能终端信息内容过滤技术,总结和分析了目前基于贝叶斯智能终端信息过滤技术的现状,并对基于贝叶斯的过滤方法提出了一系列改进。以此为基础,论文对朴素贝叶斯算法进行了详细的研究,并且提出了三个方面的改进思路。对于文本方面,主要选择使用指纹作为特征进行表示;在特征方面,主要选择采用类为条件作为发布的特征进行表示;根据学习的不断深入性,提出了阈值动态调整算法。基于这些改进,实现了改进的朴素贝叶斯过滤器。分析邮件结构特点,从邮件结构不同于普通文本出发,提出集成加权模型,以充分利用邮件的结构信息。然后,在此基础上论文运用基于集成加权模型对邮件头和邮件正文分别建立模型,最后通过加权方法集成二者结果,对智能终端信息进行过滤。研究了最小风险贝叶斯和主动学习贝叶斯两种贝叶斯的扩展模型。根据实验结果对比,得到两种扩展模型的最佳应用条件,并提出了改进后的邮件过滤算法。相关测试结果表明,与经典的贝叶斯过滤器相比,论文提出的综合了以上改进和扩展而设计的贝叶斯过滤器的过滤效果具有较高的准确性。论文的研究结果可为类似系统的设计与实现提供一定的理论基础。
其他文献
<正>10月10-11日,"大午集团创业三十周年庆典大会"在河北省徐水县大午集团独立工业园隆重举行。大会以"创业·感恩·共赢"为主题,全国工商联原副主席、中华民营企业联合会会
支持向量机是一种基于结构风险最小化的分类算法,本文将其运用到中医脏腑辨证中,通过对大量实例的研究,阐述了这种数据挖掘算法可以用于解决传统中医的"脏腑辨证"问题,具有良
语用模糊既是一种特殊的语言现象又是语言使用者为了达到某种交际目的而故意使用模糊语言的一种重要的交际策略。尽管在日常交谈会话中语用模糊的确例子俯拾即是,但它却正因
中俄互办&#39;国家年&#39;是两国领导人为确保中俄战略协作伙伴关系长期健康稳定发展做出的重大战略决策,是双方为两国人民世代友好而采取的重大举措。两国共同举办的&#39;国
由于汉语缺乏严格意义上的形态屈折变化,介词在汉语语法结构中扮演着重要的角色。现代汉语介词是一个相对封闭的类,介词在语法体系中也占据极其重要的位置,在绝大多数语言中,
继荷马史诗,但丁的《神曲》,莎士比亚和他的悲剧之后西方文学的第四里程碑:歌德和他的《浮士德》。歌德的伟大:永远努力着,既内向又外向,天生的悟性,很高的资质和诗性的修养
本文对英汉音节尤其对它们的差异性进行了系统的比较研究。 目前,国内英汉音节比较研究中存在的不足主要有以下几个方面:一、英汉音节比较,尤其是差异性研究比较零散,需要
随着当今科技的高速发展,语音识别技术被越来越多的人所关注。语音识别技术作为智能机器人研究领域的一个重要分支,其目的就是让机器能够听懂人类的语言,便于人机交流。因此,
传媒对司法的监督,既是传媒自身利益的追求,又是基于伸张和维护社会正义而作出的价值选择。传媒监督司法,一方面具有积极肯定和强化司法的作用;另一方面媒体囿于情感性判断而
改革开放以来,吉林省第三产业发展取得了长足进步,基本形成了行业门类齐全,多种经济形式并存,经济效益较好的行业群,在提高全省人民收入水平和生活质量方面起到了积极作用,同