【摘 要】
:
基于不同的分类算法针对特性迥异的语料数据进行分类,其分类效果往往不同。通过研究分类算法针对专门语料库与自建语料库分类效果各不相同的根本原因,提出一种提高分类性能的
【机 构】
:
武汉大学信息管理学院,武汉大学信息资源研究中心,武汉大学图书馆
论文部分内容阅读
基于不同的分类算法针对特性迥异的语料数据进行分类,其分类效果往往不同。通过研究分类算法针对专门语料库与自建语料库分类效果各不相同的根本原因,提出一种提高分类性能的新途径。从不同语料库的自动分类对比入手,定义类别聚类密度、类别复杂度、类别清晰度三个指标对语料库信息进行度量,通过多因素方差分析考察三个指标与分类性能的关系,得出语料的各项指标对不同分类算法分类性能的影响关系,并提出一种基于类别清晰度的交叠类文本分类方法以验证指标的有效性。实验表明:该三个指标都在不同程度上影响着分类算法的分类性能。语料类别的聚类密度越高,复杂度越低,类别清晰度越高,其表现出的分类效果越好。
其他文献
目的探讨低张力疝修补术的优点和近期疗效.方法采用美国Bard公司生产的聚丙烯疝修补网片(BardPerfixMesh)、美国强生公司生产的Prolene疝修补网片补片及美国戈尔公司的聚四氟
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
近年来,我国高校毕业生的逐年增加,使得大学生就业形势更加严峻,对于医学院本科护理学生而言,同样严峻。目前,许多医学院校为提升人才培养的质量、促进大学生就业,已逐步实行大学生
采用一元线性回归方程和数据统计方法对博白县近30a(1981—2010年)来的日照、气压、相对湿度、蒸发量四个要素的长期变化趋势进行了分析,分析结果表明:近30a来博白县总体气候呈现
分析2009~2010年隆林秋冬春连旱的直接原因和深层次原因,并利用降水距平百分率和相对湿润度指数对气象干旱等级进行评估,为政府和有关部门抗旱救灾和灾害评估提供参考。
目的 比较传统开腹与腹腔镜微创手术治疗门脉高压症的临床效果,寻找安全性高的门脉高压症治疗方法。方法 选取76例门脉高压症患者作为研究对象,按照随机数字表将其分为传统开