汉语情感问题分析和比较类型情感问答方法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:loogog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统问答系统的研究主要是针对事实问题,目前国内外对于情感问题的研究还很少见。所谓情感问题就是指询问他人、群体或者组织对某个话题或者事件的意见、情感、态度和评论等。情感问题能够更加直接地表达用户的想法和情感倾向,因而在日常生活中普遍存在。情感问答方法的研究不仅需要传统问答系统的技术,还将涉及到意见挖掘、比较关系分析等技术。在本文,我们对汉语情感问题分析和汉语比较类型情感问答做了研究和探索。首先,从用户提交的问题中识别出情感问题,本文以支持向量机和朴素贝叶斯算法为分类器,对情感问题和事实问题进行分类,取得了较好的效果。然后,我们从语法和语义的角度对汉语情感问题进行分析,并抽取问题的其它关键信息。在语法层面,本文采用C4.5决策树算法将问题分类为是非问句、正反问句、特选问句和特指问句四种类型;在语义层面,本文结合意见的定义,给出了一个汉语情感问题的语义分类体系,包括Holder、Topic、Sentiment、Time、Location和Reason六个大类,每个大类又细分为若干个小类。同时,我们以《知网》义原以及疑问词相关的属性为特征,对汉语情感问题在语义上的大类进行分类,在缩小特征维度的情况下,取得了较好的分类效果。在情感问题中,有一类问题询问的是人们对于不同事物对象之间的情感对比,我们把这类情感问题称为比较类型的情感问题。由于这类情感问题本身以及问题的答案往往都是比较句,因此本文对汉语比较句做了深入的研究,包括汉语比较句识别和比较关系抽取。我们利用条件随机场模型抽取领域实体对象,并将其应用于比较句识别和比较关系抽取中,取得了良好的实验效果。最后本文结合汉语比较句的研究工作,分析了汉语比较类型情感问答系统的一般流程。
其他文献
目标的检测、跟踪与行为识别作为视频监控的主要研究内容,是当前计算机视觉领域的研究热点,其不但具有重要的实际意义,而且对计算机视觉的其他研究领域有着重要的推动作用。
随着无线射频识别(Radio Frequency Identification, RFID)、传感器等电子数据采集设备(Electronic Data Gathering Equipment, EDGE)的不断发展,产生了空前的海量数据。由于
不管是在现实生活中还是在科研领域内,人体运动识别都起着至关重要的作用。其研究成果可以应用于多个领域,如:安保系统、智能家居、体感交互等等。随着技术的发展与革新,用于
实体检索是目前学者研究的重要领域。实体检索系统的性能好坏主要由实体的排序顺序决定的。实体排序的研究成为实体检索领域中重要的任务之一。在过去的大部分工作中,排序算
近年来云计算不断发展,生态圈趋于成熟,云计算被越来越多的企业所接受。容器技术很早就已经出现,但是未受到足够的重视,近几年随着以Docker, LXC, Warden为代表的容器技术在
运动目标检测跟踪在智能视频监控等诸多领域起到十分重要的作用。在过去的几年中,尽管大量的检测跟踪相关算法被提出,但在算法的实际应用过程中会由于场景情况多样、算法计算
随着当代信息技术的发展,人们对数字视频通信越来越重视。20世纪80年代后期以来,MPEG系列和H.26X系列标准在视频压缩中得到了广泛的应用,MPEG-4作为第二代视频压缩编码标准,
本文提出了一种滑动窗口内基于密度网格的数据流聚类算法SD-Stream。提出“隶度”的概念,通过对数据元进行“隶度”的计算,重新定义了数据元所属的网格,改进了基于密度网格算
大量的丢失数据是数据挖掘、机器学习等实际应用中普遍存在并亟待解决的问题。丢失数据有很多原因造成,其中包括测量的失误,存储失败,数据丢失,数据装载等等。在之前的政治调查中
时空数据库是以有效支持时空数据管理为目标的数据库管理系统,在交通管理、城市区划、森林火灾监测等领域有着广阔的应用需求。随着此类复杂应用的不断出现,时空数据管理的问题