基于Bootstrap Averaging的贝叶斯分类算法

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:longsir8481
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题。在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计出的参数的平均值作为训练得到的最终参数对未知文本进行分类。公共文本实验数据集上的实验结果表明,提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单。
其他文献
以往,老师布置大家写天气寒冷的片段,不少同学笔杆都咬破了也写不出几个字来,而没咬笔杆的同学写的,不外乎'天气十分寒冷''非常寒冷''比往年都冷'&#
“以红卫兵取代共青团”的历史公案前不久有位来访者,提出了文化大革命中江青一伙,妄图以红卫兵取代共青团这桩历史公案,不禁引起了我的回忆和思考。现据我所闻所见和手边保存的
实施职业教育攻坚,推动职业教育跨越发展,是省政府立足省情,审时度势,为加快建设人力资源强省、促进中原崛起做出的重要战略决策。贯彻落实省政府决策部署.全面启动实施职业教育攻
Ad Hoc网络是由一组移动节点在没有任何现存网络基础设施或是集中管理的情况下形成的动态网络。论文利用NS2网络仿真软件,在不同的网络负载、移动性和网络规模等条件下,分析比较AdHoc网络的四种路由协议DSR、AODV、DSDV和洪泛协议的性能。仿真结果表明由于各协议适用范围不同,因此可根据具体情况自适应地进行协议选择。
XLL-2000型荔枝龙眼剥壳去核打浆机是广东省农业机械研究所研制开发的一种新型农产品加工设备。20005年7月21日通过了广东省科技厅组织的科技成果鉴定。
中国人民保险公司第七次计算机应用工作会议暨中保电子有限公司第二次会议在成都召开中国人民保险公司第七次计算机应用工作会议暨中保电子有限公司第二次会议于1994年4月21日至24日在
效率低下是当前课堂教学的一个顽症,提高教学效率是如今教育改革所要解决的首要问题。造成课堂教学低效率的因素很多。“讲——练——磨”几乎成为教师教学的“武功秘籍”,教师
一、习性及危险蛴螬一年发生代,以老熟幼虫在15~20cm深的土层内越冬,第二年4月下旬至5月初开始化蛹,6月上旬开始羽化,7月中旬至8月上旬为成虫高峰期,8月上、中旬为幼虫为害盛
推进“服务万村”的突破口李克强三年前,共青团中央根据党中央关于加强农村基层组织建设的决定精神和中央农村工作会议的部署要求,提出在全团实施“服务万村行动”。三年来,各级
为了进一步发挥科协大团结的优势,整合科协系统的资源,满足科技工作者参加学术交流的需求,为学术团结和科技工作者搭建一个多学科、综合性、开放式的学术交流平台,进一步扩大