比较句识别及观点要素抽取方法研究

来源 :山西大学 | 被引量 : 9次 | 上传用户:xiao2168644
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的兴起,论坛、微博、贴吧等为人们提供了发表意见和观点的平台。大量评论出现在网络中,而比较句作为一种很有说服力的表达方式,在评论中常常被用来比较两个事物或更多事物,以表达人们对不同事物的偏爱程度。利用自然语言处理技术,从评论中识别比较句、抽取比较关系和挖掘比较观点的研究越来越受到大量学者的青睐。其研究成果可为商家对投放市场的同类产品进行比较分析提供数据资源,同时为普通消费者进行购买商品时提供决策支撑。本文分别对比较句识别、比较关系抽取和比较观点挖掘做了系统的研究,主要内容如下:(1)基于序列模式的汉语比较句识别利用序列模式挖掘算法可获取比较模式,为了提高挖掘算法的性能,本文根据汉语比较句特点对MS-PS算法进行改进,对比较句识别贡献较大的一些项名词和比较特征词设置较低的最小支持度,其余项的最小支持度取项支持度的倍数和1/N(N为序列集大小)中较大值。最后,将获取的序列模式直接匹配待识别的句子,在两个数据集上进行实验,结果表明本文所给出SeqPattMine方法是可行的。(2)基于汉语框架语义角色的比较句关系提取利用领域产品名表和属性表等资源,并结合比较句在语料中的现象,对比较特征词及比较结果词、比较实体和比较属性进行汉语框架语义角色标注,以便提取出比较关系。最后,在第四届中文倾向性分析评测(COAE2012)关于比较句任务2.2的测试集上进行了两个不同的实验,实验结果证明,本文提出的方法是有效的。(3)比较观点挖掘本文按照等比句、异比句、级比句、极比句四种类型的比较句,构造了四种不同的比较观点挖掘方法。在构造过程中,借鉴了直接表达观点句常采用的情感词和领域属性搭配的观点挖掘方法。在基于语义角色标注的比较实体和比较属性抽取实验中,选择与COAE2012任务2.2中的标准答案相互覆盖匹配的“比较实体和比较属性对”对应的句子集进行实验,结果表明了本文提出的方法是可取的,F值可达到70%以上。
其他文献
曲线拟合是计算机图形学与计算机辅助几何设计的一项重要内容,合理、光滑、Gn连续及局部可调的插值拟合曲线在工程领域与美学设计环境中是非常有用的构造。使用圆弧插值技术
人脸识别技术作为生物特征识别中的一个重要的热点课题和研究领域,其应用前景广泛,具有较高的研究价值。人脸识别就是将人的面部特征作为鉴别身份的标签,使用人工智能方法,提取人
在内积空间中,正交性起着非常重要的作用。为了更深入研究空间的几何性质,正交性的概念及其相关性质被引入到一般的赋范线性空间。虽然许多学者在这个领域上做了工作,但是迄今为
3D打印作为一种增材制造技术,用于方便且快速地制造几乎任何形状的三维物体。3D打印技术的本质在于分层制造,通过对二维多边形进行扫描来实现逐层的材料累加,从而得到完整的三维
随着计算机的普及,计算机辅助系统被应用到各个领域,给人们带来极大便利。得益于计算资源的丰富以及各种数据的积累,深度学习展现出优越的性能,在很多领域取得突出成果。计算
在工程实践和科学研究中,经常会出现各种各样的多目标优化问题。求解多目标优化的方法有很多种,其中遗传算法是一种比较典型和有效的方法,但是用它来解决多目标优化问题时,算法容
  随着网络化技术和计算机应用技术的快速发展,促进了电脑信息、通信网络、系统控制等高端技术的快速发展,从而一种新型的控制系统——网络化控制系统应运而生。网络化控制系