一种基于知网的文档语义模型构建方法

来源 :中国科技资源导刊 | 被引量 : 0次 | 上传用户:yun0558
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章提出一种基于语义知识库知网和向量空间模型理论的文档语义模型构建方法,论述知网知识描述方式的特点,提出一种滑动窗口语义消歧算法,利用知网的义原层次体系对文档模型进行语义化处理,根据语境确定语义,将模型特征项转换为关键词的义项,较好地解决了由于自然语言中存在的同义、近义、上下位等语义关系而产生的模型偏差问题。通过计算义项相似度,加权得到文档相似度。实验证明,该方法较好地描述了文档特征,能够达到良好的聚类效果,是切实可行的。
其他文献
在总结越南遥感技术发展历程的基础上,探讨越南遥感应用的主要数据源以及限制因素,解析国际合作和数据共享在越南遥感发展过程中的重要作用。最后,通过对比中巴地球资源卫星CBERS和美国陆地卫星Landsat TM数据的技术指标,探讨CBERS数据在越南资源与环境研究中的应用潜力,为CBERS数据用于世界资源研究提供案例。