基于粗糙数据推理的TextRank关键词提取算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:eidolonfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图模型的TextRank算法是一种有效的关键词提取算法,在提取关键词时可取得较高准确度。但该算法在构造图的关联边时,所采用的共现窗口规则仅考虑了局部词汇间的关联,并具有较大随意性与不确定性。针对这一问题,该文提出了一种基于粗糙数据推理理论的改进TextRank关键词提取算法,粗糙数据推理可扩大关联范围,增加关联数据,得到的结果更加全面。结合粗糙数据推理理论中的关联规则,该文提出的算法做了以下改进:依据词义对候选关键词进行划分;再通过粗糙数据推理对不同分类中候选词间的关联关系进行推理。实验结果表明,与传
其他文献
因地缘关系,中越两国在历史上往来密切。自汉武帝平南越始,越南正式处于中国管辖之下,即北属时代。五代末年越南独立,直到光绪十年(1884),中越之间处于宗藩关系。在此期间,越南派遣了众多精通汉学的儒士出使中国,在处理邦交事宜之外,他们还创作了大量的汉文诗,内容涉及途中的风土人情、名胜古迹、历史名人,以及与中国官员的交往等等。潘辉注出使清朝时亦是如此。他出身名门,有家学传承,又勤奋刻苦,才思敏捷,诗词
现金持有量的合理确定是完善企业财务管理的一个关键问题,本文以安徽省上市公司2015年的财务数据为样本,对财务风险和现金持有量的关系进行实证分析。研究结果表明:上市公司的
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
俞蘠将进行资产重组,让野风拥有更充裕的资金流,但总体不会有太大的变革,他更希望把野风做成常青树企业。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
重构技术是航空电子系统研究的一个热点,也是一个难点,重构技术的应用可以提高系统的容错能力和可靠性,延长系统的生命周期。以机载核心处理平台为基础,对可重构系统的架构、
刚历多事之秋,又经初冬之寒,经常静坐于九溪玫瑰园夜色之中的宋卫平在想些什么?
对于店口老板而言,从当初的“三十而立”到如今的“四十不惑”要达到“五十知天命”的境界,未来的十年是关键。
一、多姿多彩的职业——工商业界职业会计师每当提及职业会计师的职业工作范围是什么,人们通常会联想到税务代理人、独立审计师等几类。数目庞大、活跃于工商业界的职业会计师