一种基于名词短语的检索结果多层聚类方法

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户:zhangdeyu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对检索结果聚类可以方便用户快速浏览搜索引擎返回结果。为了提取主题表达能力和可读性强的类别标签,获取高质量的聚类结果,提出基于名词短语的检索结果多层聚类方法:提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与基于命名实体的方法、STC和Lingo算法的对比实验表明:提出方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。
其他文献
在我国互联网从无到有,由弱至强,实现快速发展的过程中,党的几代领导人在不同时期,根据所处时代党和国家工作重心及互联网发展的实际需要,适时提出了一系列关于互联网的观点
在市场经济条件下,企业竞争异常激烈,若要使企业立于不败之地,首先要解决的一个重要问题就是控制避免财务风险的发生。这就要求企业要有一个健全的资本运行机制和采取强有力
<正>随着家禽业饲养集约化程度的提高,对全价配合饲料的营养水平有了更高的要求,无论是肉用仔鸡、肉鸭或高温季节的产蛋期蛋鸡,均要求摄入高能高蛋白的全价料.目前较为普遍的
20世纪是中国辞典编纂史上最为辉煌的时期。本文将20世纪中国辞典学理论发展分成奠基期(1900-1948)、建设期(1949-1978)和形成期(1979-1999)三个阶段,对各个时期内辞典学理论
<正>二次函数y=ax2+bx+c(a≠0)的图像抛物线是一个轴对称图形,当我们面对抛物线的问题时如果能用好用足抛物线的对称性,则能化繁为简,迅速求解.本文以杭州、泰州、北京的三道
<正>在学习"轴对称图形"时,我们经常会遇到与最短路径有关的问题,同学们往往在处理这类问题时感到困难.这类问题通常会转化成"两点之间,线段最短"来解决,而轴对称的性质是实
招标阶段是选择工程施工与安装承包商的关键阶段,其招标文件确定了工程合同的核心条款,确定了工程施工阶段工程造价管理的基本框架和制度流程,对工程实施造价控制有关键性影
目的比较宫颈上皮内瘤样病变(CIN)行宫颈锥切术后或全子宫切除术后病理结果与术前阴道镜下宫颈多点活检病理结果及两种术式的治疗效果。方法对收治的72例CIN患者进行回顾性分
本文采用离心式喷雾干燥工艺制备固体聚羧酸减水剂。通过正交实验对进料液浓度、进料液温度、干燥室进/出口的风温、雾化器转速四个因素进行研究,得到了最佳的雾化干燥工艺:
18 6 0年之后 ,东北柳条边外地区内忧外患并发。为了摆脱危机 ,清政府于光绪初年设东边道及通化等县 ,管辖鸭绿江中游到长白山腹地的广大地区。随着人口日增和边疆危机的加深