基于TextRank的网评产品特征提取方法

来源 :青岛大学学报:自然科学版 | 被引量 : 0次 | 上传用户:zybp821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对经典TF-IDF算法在在文档特征词提取中因忽略了词之间连接关系而导致提取准确率较低的问题,提出一种基于word2vec加权的TextRank词图构建方法。首先通过爬虫获取网络产品评论语料,并进行分词、词性标注以及名词提取等预处理;其次利用word2vec形成词元与词元之间的相似度矩阵;最后将word2vec中获取到的词元之间的相似度作为词语影响力权值,对经典TextRank产品特征提取方法进行改进。实验数据表明,与传统的TextRank产品特征提取方法相比,改进后的方法查准率提高了5%,查全率提高了2
其他文献
阐述美术品数字化文档建设的意义及相关的版权、统一公开体制、合作、人才培养、资金等问题。
为克服传统的海洋赤潮监测算法滞后性问题,提出了一种改进粒子群SVM的海洋赤潮监测算法。首先,给出基于改进粒子群SVM的海洋赤潮监测算法的基本原理,采用改进粒子群算法来对SVM
绿潮遥感监测手段受时间分辨率、空间分辨率和天气等因素的限制,难以实现大规模、连续且高精度的绿潮检测,为了弥补遥感影像时间分辨率和空间分辨率低的问题,基于多源多分辨率的遥感影像,结合归一化植被指数法(NDVI)对GF-1PMS、Landsat 8和MODIS的同步影像进行绿潮监测能力分析,并在此基础上利用多源多分辨率影像对2017年绿潮爆发过程进行高时间序列的绿潮监测。结果表明,Landsat 8数
手风琴练习有成效与掌握科学的练琴方法有着重要关系.方法得当事半功倍,效率就高;方法不当,则事倍功半,效率就低.
鉴于我国地形地貌的多种多样,地质变化情况复杂性,由此也为岩土工程勘察作业工作带来了巨大的难度挑战。岩土工程勘察工作是在工程项目实施过程当中的核心环节之一,其最终所能够达到的水平程度将直接影响着工程项目的质量与水平。本文将具体以福建沿海地区为例,在独特的自然条件下、地理环境和人类活动影响等条件下,对岩土工程勘察的实践工作来展开具体的分析与探讨,以期能够为有关同行提供一些有价值的参考信息。
本文从馆员文化素质、领导素质、科技发展等几个方面论述了图书馆改革的着眼点,说明只有改革才是图书馆发展的必由之路,才能顺应时代潮流,与社会融为一体.
美能达RP509阅读复印机经多年使用出现许多故障,主要表现为还原出的图纸部分清晰,整张图纸深浅不均……
用上、下解方法研究了n阶非线性微分方程k点边值问题{y(n)=f(t,y(n-2),y(n-1)) (1)y(i)(di)=ai(i=0,1,…,n-3),g(y(n-2)(t1),y(n-1)(t1))=0,h(y(n-2)(tk),y(n-1)(tk))=0 解的
多媒体教学多年的实践证明,它具有传统教学所无法比拟的优势.但其自身也存在着不足,即在发挥学生学习主动性方面还没有进行认真地开发.其优势还没得以充分发挥.结点网络式多