基于非完备信息系统的评价对象情感聚类

来源 :山西大学 | 被引量 : 0次 | 上传用户:dzxxdzc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、通信技术和网络技术的迅猛发展,人们现今主要通过网络发表自己对产品的价格、性能和售后等方面发表主观性看法、建议以及意见。这些主观性观点表达了消费者对产品喜爱或是厌恶等情感倾向。消费者在购买产品之前,通常都会在网上查询该产品的相关评论以作参考,但受时间和精力的限制,从海量的评论信息中获取相关信息就变得不甚可行。另外,在实际产品评论中,一种产品可能涉及多篇文档。而目前大多研究者只针对某类产品评论判断一篇文档(句子)所表达产品的整体倾向。如果仅从文档级或句子级进行情感倾向判别,均不能获得人们对产品的多个不同品牌在其性能方面的综合评价。因此,如何有效地,并且最好能自动地对带有情感色彩的主观性多文本进行分析、处理、并对其进行归纳和推理,进而发现和概括相关产品的观点,这就变得非常的重要。本文研究主要细分为以下几方面的工作:(1)基于本体的观点特征的抽取及句子整合。本文利用已建立的领域本体,按照产品性能抽取观点特征以及其评价词。本文不进行分词,直接按照字符的匹配进行抽取。实验表明,该方法比传统的分词后再抽取的结果要好,其F值比之高出55.83%。通过对评价同一对象的句子进行汇总,将评价同一对象的句子看做一个整体来处理,从而将问题转化为传统的文档层面的情感分析问题。对于本体中存在概念之间的关系的观点特征进行整合,将整合后的特征采用一个“核心词”来表示。由于各个性能相关的数据丰富程度不同,整合后的结果之间有较大的差异。“经济性”所包含的特征整合掉的较少,“舒适性”经过整合后,新特征集的规模只有原始特征集的40.87%。(2)按照产品的性能建立非完备的情感信息系统,并以此为基础对特征进行约简。由于本文的数据是一个存在缺失数据的系统,因此最终抽取到的特征构成的是一个非完备的系统。对于信息系统中的特征的特征值,本文主要依据特征其本身的情感倾向值和特征所在句子的情感倾向值这两方面来综合计算。本文获取的观点特征冗余度高,区分度差以及存在缺失数据,必须进行约简优化。本文采用基于差别矩阵的特征约简算法,去掉那些区分能力差且特征值稀疏度高的特征。对于关注度较高的“舒适性”,其约简率为55.32%,约简掉的特征较多,很大程度上提高了评价对象的相似性,降低了冗余度。(3)对各性能方面的非完备信息系统的评价对象进行情感聚类。通过对Web评论文档的聚类,本文可以得到用户对产品评价的整体预览以及产品特性的实际评价状况。本文采用K-means聚类算法,来对各性能方面的非完备信息系统的评价对象进行情感聚类,而聚类结果和普通用户的认知是基本一致的。为了说明本文特征降维的有效性,采用浅层语义分析LSA作为与其比较实验。LSA特征降维可使特征空间发生变化,导致其特征无法解释。在这一部分,本文还从数据结果方面阐述了建立非完备信息系统的必要性。
其他文献
自然图像蕴含丰富的小尺度模式,它们反映了图像形成的过程并在视觉感知中起着非常重要的作用。本文提出了一个新框架用以刻画小尺度模式。其中心思想是将小尺度信息的建模问题
风能、太阳能等绿色能源于人类而言,可谓用之不尽、永不枯竭。随着科技的不断发展创新进步,这些清洁能源必将成为化石能源的绝好替代。我国“十一五规划”中对新能源的规划,以及
冷轧硅钢片是电力、国防、无线电、电讯仪表等工业不可缺少的重要软磁合金。在硅钢生产过程中表面缺陷是影响其质量的重要因素,对硅钢表面缺陷在线检测是提高带钢质量的有效方
随着计算机技术、信息处理技术和无线通信技术的进步而出现的无线传感器网络是一种全新的信息采集与处理技术。无线传感器网络在国防军事、环境监测和医疗健康等方面获得了极
电法仪是用来测量电场的地球物理勘探仪器。目前,电法仪已经广泛应用于地下水勘探、地热能勘探、工程勘探和选址、环境勘探、堤坝病害诊断等众多工程勘察领域。随着人类对地下
视频监控技术一直是人们关注的应用技术热点之一,它以直观、方便、信息内容丰富的特点被广泛的应用于许多场合.目前视频监控系统已经进入了一个高速发展的时期,综合了数字图像处
开放式数控系统采用模块化设计,具有灵活易变的优点,适合现代制造技术发展的需要。插补是数控加工的核心技术,数控系统是否具备复杂曲线插补功能,是评价CNC系统性能的重要指标。
现代工业过程逐渐倾向于生产小批量、多品种、高附加值产品的间歇过程。与连续过程相比,间歇过程生产特性更加复杂,数据具有多阶段,非线性,动态,多批次等特性,对其进行过程监
测试技术是实验科学的一部分,通过测试可以揭示事物的内在联系和发展规律,从而推动科学技术的发展。自动测试设备(Automatic Test Equipment,ATE)在现代飞行器、先进的武器装备及
随着即时通讯系统的大众化,手机等移动设备硬件功能发展,以及通信世界3G时代的来临,移动即时通讯已经成为新时代通信的必然趋势,而作为NGN(下一代网络)核心的协议之一的SIP协议,体现