An Incremental Algorithm of Text Clustering Based on Semantic Sequences

来源 :武汉大学自然科学学报(英文版) | 被引量 : 0次 | 上传用户:lblb0628wto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
This paper proposed an incremental textclustering algorithm based on semantic sequence.Using similarity relation of semantic sequences and calculating the cover of similarity semantic sequences set, the candidate cluster with minimum entropy overlap value was selected as a result cluster every time in this algorithm.The comparison of experimental results shows that the precision of the algorithm is higher than other algorithms under same conditions and this is obvious especially on long documents set.
其他文献
2019年12月20日,中国石油石化氢能源发展论坛在京举办.论坛由中国石油和石化工程研究会、北京石油学会、中国石油大学(北京)共同主办.rn氢能被视为21世纪最具发展潜力的清洁
期刊
A workflow schema is an abstract description of the business processed by workflow model, and plays a critical role in analyzing, executing and reorganizing bus
期刊
期刊
人类社会进入信息时代。现代教育技术给教学带来前所未有的机遇和挑战,它以鲜明的色彩、动人的画面,变化无穷的音乐、强烈的感染力,深受广大教师的欢迎,运用电教媒体激发学生的学
期刊
期刊
The problem of document rewriting is a fundamental problem in active XML(AXML) data exchange and usually has a higher complexity.Prior work was focused on strin
期刊
19世纪初期,在西方殖民主义与宗教势力双重推动下,近代西医开始传入中国。由于种种原因,妇产科是率先在中国传播与本土化的西医专科之一。1899年创立的广东女子医学校被公认为近代中国最早建立的女子医学院校。广州柔济医院萌芽于广东女子医学校附设赠医所,经过一百多年的发展,它目前(今广州医科大学附属第三医院)已成为华南地区以至中国最著名的以妇产科为特色的三甲医院之一,为我国妇女、儿童健康水平的提高作出了巨
This paper proposes a new approach of feature selection based on the independent measure between features for text categorization.A fundamental hypothesis that
期刊
期刊