基于特征项区分度的加权朴素贝叶斯邮件过滤方法

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:zelda999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何高效地特征提取和分类算法设计是衡量基于内容邮件过滤技术优缺点的关键。针对互信息MI(Mutual Information)特征提取算法和朴素贝叶斯分类算法,通过引入特征项区分度的概念,分析特征项在分类中区分能力之间的差异,进而提出一种兼顾特征项区分度和互信息的特征提取算法。通过进一步将区分度添加到分类算法设计中,最终提出一种加权朴素贝叶斯算法,高效地解决基于内容邮件过滤问题。实验结果证明,改进后的算法在召回率、精确率和正确率上均有明显提高,且分类性能更加稳定。
其他文献
近年来,在数据流中进行高效用项集挖掘成为一个重要的研究课题。已存在的算法在挖掘过程中产生大量的候选项集,使用户很难从大量候选模式中筛选出有用的信息。针对这种情况,提出一个数据流高效用项集挖掘算法HUIDE(High-Utility Itemsets Over Data Streams)。算法首先综合考虑数据的信息特征,提出一种有效的效用度量方法。然后采用基于时间的滑动窗口技术更加准确地描述数据分布
介绍了国外几种高性能树脂基复合材料,针对国内树脂基复合的应用与研究现状进行了分析与探讨。
分析了分子量,加工助剂和无机填料对UHMWPE熔点的影响,论述了UHMWPE制品在受热过程中尺寸变化规律,及热收缩率与制品热历史的关系和无机填料对收缩率的影响,提出了UHMWPE制品由形简单变为形状复杂制
特发性肺纤维化(IPF)以早期为肺泡炎和肺泡结构紊乱、晚期间质纤维化为特征的疾病,发病机制目前尚不清楚.国外学者新近研究证实IPF的发生、发展与血管相关因子过度分泌、血管过
周周。一个刚满一岁孩子的妈妈,一个名牌大学毕业的社区工作者。她朴实聪慧、严谨亲和,现任北京冷泉希望社区项目负责人,主要为来京务工的移民工家庭及其子女开展社区服务工作。
根据1998年国内公开发表的文献,报道了热塑性通用工程塑料,特种工程塑料,以及通用塑料改性制备工程塑料等的研究,开发进展。
笔者,今年六十余岁,练功已十六周年。承高人指点,曾不断感到“今是而昨非。”回顾步入功林之初,当时与病、药结缘,幸遇“真气运行法”,行功不到一年,竟然与病、与药基本上绝缘,受益良
“有事,找晓玲!”是大庆油田采油三厂二矿采油203工区职工们的一句口头禅。工区党支部书记兼工会主席刘晓玲,在女职工眼里,她是无话不谈的“闺蜜”;在男职工面前,她是敢担当的“女
由于对用户偏好信息的过分依赖,致使推荐系统易受到恶意攻击,从而影响系统的推荐质量。提出一个融合信息熵与信任机制的防攻击推荐算法。在考虑了托攻击与正常用户之间的评分变化幅度差异基础上,提出融合信息熵的相似性改进算法,同时引入信任更新机制,在推荐过程中将用户间信任度与相似度有机相结合,通过筛选推荐权重较高的邻居用户方法获得可靠推荐,从而降低恶意攻击对系统的影响。通过在真实数据集上实验表明该算法在提高推
日前,山西省制订出台了《山西省实施〈工伤保险条例〉办法》(以下简称《实施办法》),自2017年6月1日起施行。该办法是为了保障因工作遭受事故伤害或者患职业病的职工获得医疗