语义相似度领域基于XGBOOST算法的关键词自动抽取方法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:conan_1126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词自动提取一直都是自然语言处理领域的一个基础问题与研究热点,随着文本数据的指数级增长与应用场景的不断扩展,如何高效且准确地自动提取关键词进一步得到了研究者的广泛关注。在语义相似度计算中,对两个文本进行关键词抽取的效果都对判断两个文本是否相似的结果有重大影响。论文提出了一种在语义相似度领域融合KL散度,TF-IDF,词性,词语长度等多种特征,基于XGBOOST算法的关键词自动抽取方法,实验结果表明,该方法与KL散度,TF-IDF以及基于传统机器学习算法的有监督方法相比,效果有显著提升。
其他文献
临危受命义无返顾2004年3月,邢喜初临危受命担任零阳镇七相坪村党支部书记。当时该村集体经济薄弱,负债累累,工作基础差,支部班子换了一茬又一茬,工作始终没有起色。正在大家犯难
2020年4月9日,中华粮网承建的国粮中心新版地储Saa S交易平台正式上线运行,并成功举办"湖北地储粮油定向交易专场"交易会。此次交易共投放湖北省地方储备粮1.5万吨,经过充分
白三叶草粉饲喂单胃动物的主要限制因素是粗纤维的含量高,量具针叶粉和茎杆分离,可使草粉中粗蛋上23.52%提高到29.69%;粗纤维由17.72%下降到12.12%;筛分下的细草粉对鸡表观代谢能力为8.430±0.059Mj/kg,比原草粉提高了
红军时期,毛泽东的妻子贺子珍是一位具有传奇色彩的女性。1925年,16岁的贺子珍就成为江西永新县第一个女共产党员、第一任妇女部长,17岁领导永新暴动。大革命失败后转战井冈山,成
当前,在建设生态农业和山川秀美工程中,要改变陕北脆弱的生态环境,是要抓好林草植被的恢复,要增加其植被.总结几十年来的经验教训,应本着种草起步、草灌先行、草灌乔结合的原
目的通过埘125例乳腺癌改良根治术患者中34例皮下积液的临床资料分析,探讨术后皮下积液的预防及处理。方法均采用纵梭形切口,将手术要求范围内的组织整块切除后,用1根硅胶管剪多
人脸表情识别已成为人工智能领域的重要研究课题,但传统的卷积神经网络需要庞大的计算资源使得其应用受限,而二值化卷积神经网络可通过快速与或运算代替原本的浮点乘法运算,大大降低了算法对计算资源的需求。论文提出了一种基于数据增强和二值化卷积神经网络的人脸表情识别算法,通过均值估计,在FER2013数据集上达到了66.15%的识别率,超越了部分基于浮点乘积运算的卷积网络,为表情识别算法移植到小型设备中提供了
中软国际有限公司近日发布2019年度业绩。2019年,公司业务实现持续增长,经营质量稳步提升。收入同比增长达到13.8 %,年度溢利同比增长5.7 %,集团拥有人应占溢利同比增长5.5 %。  在战斗的2019年,公司全体员工齐心聚力、苦练内功,以华为供应商发展计划(SD)牵引业务质量和能力的提升,同时把能力复制到其他关键客户,拉动业务增长。公司搭建全栈式云服务和云产品,以咨询驱动数字化转型服务,
目的探讨新型隐球菌脑膜脑炎(CNM)的临床诊断和治疗特点。方法对19例新型隐球菌脑膜脑炎临床诊断和治疗进行回顾性分析。结果19例患者中绝大多数(79%)亚急性起病,12例均无基础疾病,
近日,郑州市政府新闻办召开新闻发布会,发布《郑好办》APP第四批政务服务"一件事",本次上线事项涵盖医保、税务等方面的多个高频事项。今后,在郑州参保的居民到异地就医,登录