基于代表样本动态生成的快速文本分类

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:tianlingfengice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
κ-近邻作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用,但是这种方法计算量较大。针对κ-近邻法的不足之处,提出了一种新的快速文本分类方法,通过对原始训练样本集的训练生成代表样本,再根据原始训练样本与已生成代表样本之间的分布状况,对已生成的代表样本进行多次调整,从而使代表样本更具有代表性。这种方法有效地压缩了原始训练样本集,提高了分类效率;同时,由于代表样本的分布更加合理,可以提高分类的准确性。实验结果显示,此方法具有很好的分类性能。
其他文献
2013年4月30日早上,刚刚运来的20万只中华绒螯蟹被哈密市水产工作人员放流到南湖水库,这是哈密市首次进行名优水产品增殖放流。据了解,本次投放的中华绒螯蟹苗是由山东水产科研
黑龙江林甸县借助资金配套政策,从扶持措施上.加快规模发展步伐。于府君说,在去年省政府专项补贴政策基础上,今年。继续利用好市里给予“三退三进”牧场建设补助扶持。同时,县里还
脑机接口的出现使得人与外设之间新型交互方式的实现成为可能,为了加强其实验平台的便携性和灵活性,文中着重探讨了基于先进精简指令微处理器(Advanced RISC Machines)的嵌入式脑机接口(brain-computer interface)系统的数据采集、数据传输、数据处理以及应用控制等方面的设计;采用基于TCP/IP协议的方法实现脑电采集和主模块之间的通信;并利用高性能处理器和多线程技术
崔金海教授是第二、三批全国老中医药专家学术经验继承工作指导老师,河北省首届名中医,多年来致力于胆汁淤积性肝病和重症肝病的临床与科研工作,治疗重度黄疸经验丰富,擅长抓
针对永磁直线同步电动机(PMLSM)直接驱动的伺服系统,提出了一种基于RBF神经网络辨识的单神经元PID模型参考自适应的优化跟踪控制策略,解决了系统快速精确地跟踪与抗扰性能之间的矛盾。利用RBF神经网络作为辨识器,实现对被控对象Jacobian信息精确辨识,以基于二次型性能指标学习算法的单神经元自适应PID作为控制器,从而保证系统具有较强的鲁棒性能。仿真结果表明,该方案在保证伺服系统快速跟踪性能的
基于有效竞争预约接入、无冲突轮询传输的思想,该文改进了支持节点移动性和多跳网络结构的依据用户妥善安排的多址接入(UPMA)协议,然后利用网络仿真工具OPNET构建了UPMA协议的仿真框架,并仿真了由自组织分群算法所获得群的群内无线传输情况。该仿真框架为UPMA协议详细配置了物理层和数据链路层模型,可以设置不同的信道特性以及应用场景。在此基础上,该文分析了UPMA协议的信道吞吐量、平均消息时延和平均
笔者走访过黑龙江的很多奶牛场,发现都有一个共同的问题,牧场的奶牛消化系统疾病都没有采取有效的治疗方案和方法,部分牧场只有复合维生素B和单方的维生素B1。笔者总结了几例
继2015年7月1日新西兰奶粉拍卖价下跌10.8%,7月15日新西兰奶粉拍卖价暴跌10.7%,8月5日新西兰奶粉拍卖价格再次下跌9.3%。
以近期的线上教学实践为例,探索如何进行高三化学线上复习课教学。本文针对线上复习课与传统线下复习课的变化,结合实践经验总结了线上高三化学复习课教学的优化策略,反思线
目前,有关中国传统教育的研究层出不穷,许多教育工作者以及对教育感兴趣的人纷纷从不同的角度,从各自的观点出发对中国传统教育的宝库进行挖掘和探索,提出了很多有价值的观点