共词聚类分析法中的主要问题与对策

来源 :情报学报 | 被引量 : 0次 | 上传用户:Johnnywang03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共词聚类分析法通过聚类运算的方式对学科主题词进行划分,从而实现对学科结构的分析研究。聚类运算的结果,通常能把共现频次高的词聚在一起,而学科内主题词的分布与词的共现关系并不完全正向相关,因此,聚类运算的原理不完全符合学科研究点主题词分布的方式,是共词聚类分析法中的主要问题,并由此造成共词聚类分析存在许多不足的地方,主要表现在:聚类不稳定、聚类不完整、成员划分不合理以及容易造成没有意义类团的出现。问题的对策是:改进聚类算法、改变聚类策略、类团的弹性划分以及对结果的创新分析能有效弥补聚类算法的不足。
其他文献
以往的术语抽取研究大多将语言学方法和统计方法分别进行单独的处理,并且只考虑候选术语本身的术语度,而没有考虑候选术语所在句子的术语度对术语抽取性能的影响。本文将语言学
基于2018年黑龙江哈尔滨、吉林榆树、辽宁锦州、新疆乌兰乌苏、甘肃西峰、河北固城6个农业气象试验站不同属性品种玉米的分期播种试验资料,以当地常年大田实际播种期为界,提
以菊花品种“红面”(Hongmian)为试材,进行(32±2)℃/(22±2)℃(昼/夜)高温下的光周期实验,每日光周期光照/黑暗时长分别设置为7h/17h(记为Ph7)、8h/16h(Ph8)、9h/15
推荐算法是个性化推荐系统中最为核心的一部分。文本通过给出产品流行性定义,提出了一种改进的用户兴趣点度量方法,进而将用户的兴趣点嵌入到基于物质扩散原理的推荐算法中。新
语义传递是信息科学领域多种研究的关键因素,但是由于缺乏语义传递判断的计算机模拟限制其在信息科学领域的应用。语义关系间的可传递性是语义传递判断的关键因素,其相对稳定的
情报是“信息酵”,是使一定对象知识结构发生变化的“活化剂”,情报必须具备“酵化”功能,必须具有"专一性"特征,情报只有依托、服务于一定对象才能发挥功能。把情报作用于一定
气候变化对草原生产力的影响显而易见,而对农牧业生产的影响却存在不确定性。依据2000年至2017年内蒙古103个旗县统计数据,以均值T检验、面板回归模型以及bootstrap系数检验
本文构建了一个中文情感常识知识库,包括规则库和实例库两部分。目前的文本情感分析,主要以句子为计算单位,仅仅得出一个句子的情感,忽视了对于情感的持有者的分析,而且认为
日前,前美联储主席本·伯南克在美国企业研究所的政策讨论会上称,美国经济增长面临着严峻的下滑挑战,2020年甚至会“掉落悬崖”。伯南克认为,特朗普政府推出的1.5万亿美元的减
猪是多胎动物,繁殖特别快,在本交情况下,1头公猪可负担20~30头母猪的配种任务,1年可繁殖500~600头仔猪。如果采用人工授精,1头公猪1年可繁殖上万头仔猪。可见,加强对公猪的饲养