基于通配符模式与随机游走的关键词提取方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:jiward
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合通配符模式与引入先验信息的随机游走算法,提出一种改进的关键词提取方法。使用通配符约束捕获词语之间的语义关系,提取满足间隙约束和一次性条件的顺序模式以计算模式支持度,并在模式支持度大于等于最小支持度阈值时建立节点关联图。将维基百科知识库中词语间的相似度作为先验信息,利用基于先验信息的PageRank算法在关联图上进行随机游走直至其排名分数趋于稳定,选取排名前Top K个词语作为关键词。实验结果表明,与TextRank、GraphSum算法相比,该方法具有更高的提取准确率及稳定性。
其他文献
【正】 近年来,物资体制改革不断深化,物资工作取得了可喜的成绩,经营机制不断完善,服务质量不断提高,经济效益稳步增长,为我国生产建设的飞速发展做出了巨大的贡献。但是,由
2016年11月10日,在万众瞩目中,我国首颗X射线脉冲星试验卫星开始了太空探索之旅。作为中国航天在原始创新、技术革命道路上的一个重要里程碑事件,X射线脉冲星试验卫星的发射,
1月19日12时12分,中国在酒泉卫星发射中心利用长征十一号固体运载火箭成功实施"一箭六星"发射,将吉林一号视频07星、08星和四颗小卫星精确送入预定轨道。此次发射是长征十一号固体运载火箭继2015年"一箭四星"和2016年"一箭五星"连续发射成功后,又一次多星发射的突破,此次发射任务是长征十一号火箭首次"全商业发射",也是中国固体运载火箭首次向国际用户提供发射服务。那么,这款由中国运载火
针对当前社团划分算法存在划分方式单一和划分结果准确度低等问题,提出一种基于节点多属性相似性聚类的社团划分算法SM-CD。根据社会网络特性定义网络节点的结构属性与自身属
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文在已有对顾客感知价值、顾客满意的理论和实证基础上,提出药店关联销售的顾客感知价值要素、药店关联销售模型,以及药店关联销售数量与感知价值、顾客满意之间的关系。对样
第19届国际灌排大会今天就要闭幕了.在过去8天的时间里,来自世界56个国家和地区的代表,紧紧围绕"确保粮食安全和环境可持续发展的水土资源利用"这个大会主题,开展了丰富多彩
为在物理层中进行信息安全传输,提出一种基于星座模糊的物理层加密方案。将信道系数作为密钥,采用信道系数与已调符号矢量叠加的方式实现加密。考虑信道估计存在误差的实际情
进入夏季以来,我国很多省市都发生了不同程度的地质灾害和洪涝灾害,并造成大量的经济损失。我国作为世界上自然灾害最严重的国家之一,土地面积辽阔,地理气候条件复杂,自然灾
近日,天宫二号空间实验室完成大型试验后的总装并交付电测。与天宫一号目标飞行器相比,天宫二号空间实验室总装难度更大,天宫二号空间实验室的质量约为8.6吨,分为两个舱。前舱为实