hRIPPER:一种基于层次规则学习的文本分类算法

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:mars22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以规则学习算法RIPPER为基础,提出一个改进的规则学习算法hRIPPER,其中重要的一个部分就是层次特征选择算法HFS,它为每个层次上的每一个类获得一个相对较小的特征项集合,这些特征项集合之间同样也构成层次关系.
其他文献
3月1日,新华人寿前任董事长关国亮涉嫌侵占挪用巨资案在北京二中院落判,最终认定其挪用资金额为2亿元,法院判处关国亮有期徒刑6年。此时,关已被羁押4年半。
本文在已有的数据库强制访问控制模型的基础上提出了一种新的数据库强制访问控制模型CMAC,该模型的最低客体粒度为元素,只对敏感属性上的元素作安全标记,同时给出了完整性规
VC基金近二十年前开始在中国投资,行业的投资跨度很大,包括半导体、新能源、消费品、TMT、医疗都曾经是VC投资的一些热点,在每个特定时期,投资人都在寻找可能爆发性成长的行
期刊
CE:此次被双汇国际收购,可谓SFD在国际化方面的重大举措,你们什么时候开始走向国际化道路?rn拉里·波普:1998年我们进入欧洲,那年收购了一家法国公司,几乎同时进入加拿大,还
目前,中国经济处在一个关键的转折点上,要实现可持续增长,中国必须告别过去的增长方式.多年来,中国经济增长的原因与经济风险的恶化的原因相同,两者是同一个增长模式的两个方
面对全球最有吸引力的市场,即使是全球最成功的公司也不得不破例。一向高傲的苹果公司,终于还是低了头。4月1日晚,苹果公司的中文官网上贴出了首席执行官蒂姆·库克署名的道
本文针对纯粹采用网页内容的聚类方法,通过对搜索引擎查询日志的挖掘,将查询作为网页的附加特征向量,以迭代的方式逐步修正,极大地提高了网页聚类效果.
挖掘约束(约束最大)频繁项目集是多种数据挖掘应用中的关键问题,本文提出了一种快速的约束最大频繁项目集挖掘算法MCMFISA,并举例说明了算法的执行过程.至于约束(约束最大)频
前两天在无锡,我去参观红豆集团,才知道中国纺织面料行业中规模以上的公司(年营业额500万以上),有6 7万家.这说明这个行业是高度分散.因此这个行业进行整合,淘汰一部分企业是
期刊
为了挖掘大型事务数据库中数据间所有的关联规则,本文提出了一个新的算法BOM算法,并且与经典的挖掘关联规则算法Apriori算法做了对比.BOM算法具有良好的性能,它不需要多次扫