基于领域知识的文本分类

来源 :东北大学学报 | 被引量 : 0次 | 上传用户:tyftyf123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能.
其他文献
薪酬激励是管理者的基本职能之一,薪酬激励机制的好坏直接影响到企业的成败。文章通过对国有企业、民营企业、外资企业的薪酬激励现状进行分析,探讨奖金、津贴、福利等薪酬的综
对白鹭(Egretta garzetta)和牛背鹭(Bubulcus ibis)雏鸟肠蛋白酶进行研究.两种鹭类的肠蛋白酶存在着许多共同的理化特性,包括分子量(39.4 kD)、等电点(5.4~7.5)、耐热性、抗冻
人事档案是社会公共信息管理中的重要一部分,对人事档案实行科学合理的管理是一个人力资源开发机构工作的重点。而档案行政管理部门在人事档案管理中又有着重要的作用。但就
商业汇票业务是传统的资金结算业务,从商业银行角度看,商业汇票业务的开展为其提高金融服务水平,持续提升票据业务收益发挥了作用。从企业角度看,使用商业汇票进行结算,解决
在果树大面积栽培中.为提高幼苗成活率.促进幼树的生长发育.民权县从2010年开始,在全县苹果、
2004年中阿合作论坛成立至今,中国对阿媒体交流稳步发展,在中阿合作论坛框架下建立了新闻合作机制。但中国对阿媒体交流也面临一定的困境,包括已有新闻合作机制缺乏有力落实,涉阿
模型预测控制具有鲁棒性强、跟踪快速性好等特点,能够解决复杂工业过程控制中的大时滞问题。该文提出了一种改进的模型预测控制器,基于事先设定的期望响应,实现参考轨迹在预测时
在曲轴生产制造过程中,中心孔作为主要的定位基准,其作用至关重要。中心孔深浅不一将影响曲轴在机床上的轴向定位,使加工余量分布不均。本文针对中心孔深度加工不一致问题,通
大多数已发表的LiMn2O4尖晶石晶胞参数未经校正,不能定量揭示晶体的结晶程度、更不能直接对比。论述了一种以天然石英作为内标标准物质、通过粉晶X射线衍射光谱法(XRD)精确测定
隧道衬砌背后空洞现象是隧道建设与运营中主要病害之一,这会改变隧道衬砌与围岩的相互作用关系,引起隧道结构应力集中而破坏。采用物理模型试验方法,模拟了隧道衬砌背后无空