基于非完备信息系统的评价对象情感聚类

来源 :山西大学 | 被引量 : 0次 | 上传用户：dzxxdzc2

【摘要】

：

随着计算机技术、通信技术和网络技术的迅猛发展,人们现今主要通过网络发表自己对产品的价格、性能和售后等方面发表主观性看法、建议以及意见。这些主观性观点表达了消费者

【作者】

：

尹学倩

【机构】

：

山西大学

【出处】

：

山西大学

【发表日期】

：

2012年01期

【关键词】

：

非完备信息系统评价对象本体特征降维聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术、通信技术和网络技术的迅猛发展,人们现今主要通过网络发表自己对产品的价格、性能和售后等方面发表主观性看法、建议以及意见。这些主观性观点表达了消费者对产品喜爱或是厌恶等情感倾向。消费者在购买产品之前,通常都会在网上查询该产品的相关评论以作参考,但受时间和精力的限制,从海量的评论信息中获取相关信息就变得不甚可行。另外,在实际产品评论中,一种产品可能涉及多篇文档。而目前大多研究者只针对某类产品评论判断一篇文档(句子)所表达产品的整体倾向。如果仅从文档级或句子级进行情感倾向判别,均不能获得人们对产品的多个不同品牌在其性能方面的综合评价。因此,如何有效地,并且最好能自动地对带有情感色彩的主观性多文本进行分析、处理、并对其进行归纳和推理,进而发现和概括相关产品的观点,这就变得非常的重要。本文研究主要细分为以下几方面的工作：(1)基于本体的观点特征的抽取及句子整合。本文利用已建立的领域本体,按照产品性能抽取观点特征以及其评价词。本文不进行分词,直接按照字符的匹配进行抽取。实验表明,该方法比传统的分词后再抽取的结果要好,其F值比之高出55.83%。通过对评价同一对象的句子进行汇总,将评价同一对象的句子看做一个整体来处理,从而将问题转化为传统的文档层面的情感分析问题。对于本体中存在概念之间的关系的观点特征进行整合,将整合后的特征采用一个“核心词”来表示。由于各个性能相关的数据丰富程度不同,整合后的结果之间有较大的差异。“经济性”所包含的特征整合掉的较少,“舒适性”经过整合后,新特征集的规模只有原始特征集的40.87%。(2)按照产品的性能建立非完备的情感信息系统,并以此为基础对特征进行约简。由于本文的数据是一个存在缺失数据的系统,因此最终抽取到的特征构成的是一个非完备的系统。对于信息系统中的特征的特征值,本文主要依据特征其本身的情感倾向值和特征所在句子的情感倾向值这两方面来综合计算。本文获取的观点特征冗余度高,区分度差以及存在缺失数据,必须进行约简优化。本文采用基于差别矩阵的特征约简算法,去掉那些区分能力差且特征值稀疏度高的特征。对于关注度较高的“舒适性”,其约简率为55.32%,约简掉的特征较多,很大程度上提高了评价对象的相似性,降低了冗余度。(3)对各性能方面的非完备信息系统的评价对象进行情感聚类。通过对Web评论文档的聚类,本文可以得到用户对产品评价的整体预览以及产品特性的实际评价状况。本文采用K-means聚类算法,来对各性能方面的非完备信息系统的评价对象进行情感聚类,而聚类结果和普通用户的认知是基本一致的。为了说明本文特征降维的有效性,采用浅层语义分析LSA作为与其比较实验。LSA特征降维可使特征空间发生变化,导致其特征无法解释。在这一部分,本文还从数据结果方面阐述了建立非完备信息系统的必要性。

其他文献

基于电能质量评估的风力—太阳能发电系统的控制策略研究

风能、太阳能等绿色能源于人类而言，可谓用之不尽、永不枯竭。随着科技的不断发展创新进步，这些清洁能源必将成为化石能源的绝好替代。我国“十一五规划”中对新能源的规划，以及

学位

风力-太阳能发电系统风力-太阳能发电系统混合发电系统混合发电系统电能质量电能质量控制策略控制策略优化调度优化调度

无线传感器网络无需测距定位算法的比较与改进

随着计算机技术、信息处理技术和无线通信技术的进步而出现的无线传感器网络是一种全新的信息采集与处理技术。无线传感器网络在国防军事、环境监测和医疗健康等方面获得了极

学位

无线传感器网络无线传感器网络无需测距无需测距节点定位算法节点定位算法

基于MPEG4的嵌入式网络视频监控系统的设计与实现

视频监控技术一直是人们关注的应用技术热点之一，它以直观、方便、信息内容丰富的特点被广泛的应用于许多场合．目前视频监控系统已经进入了一个高速发展的时期，综合了数字图像处

学位

MPEG4标准MPEG4标准嵌入式技术嵌入式技术网络视频监控网络视频监控动态检测动态检测视频编解码视频编解码

开放式数控系统复杂曲线插补算法的研究与设计

开放式数控系统采用模块化设计，具有灵活易变的优点，适合现代制造技术发展的需要。插补是数控加工的核心技术，数控系统是否具备复杂曲线插补功能，是评价CNC系统性能的重要指标。

学位

数控系统数控系统插补算法插补算法S曲线加减速S曲线加减速曲线插补算法曲线插补算法模块化设计模块化设计制造技术制造技术数控加工数控加工

基于FVS-BDKPCA的不等长间歇过程监测方法

现代工业过程逐渐倾向于生产小批量、多品种、高附加值产品的间歇过程。与连续过程相比,间歇过程生产特性更加复杂,数据具有多阶段,非线性,动态,多批次等特性,对其进行过程监

学位

间歇过程不等长BDKPCAFVS

空管应答机自动测试系统的研究与设计

测试技术是实验科学的一部分，通过测试可以揭示事物的内在联系和发展规律，从而推动科学技术的发展。自动测试设备（Automatic Test Equipment，ATE）在现代飞行器、先进的武器装备及

学位

空管应答机空管应答机自动测试系统自动测试系统虚拟仪器虚拟仪器VXI总线VXI总线GPIB程控仪GPIB程控仪

基于SIP的移动即时通讯系统建模和管理

随着即时通讯系统的大众化，手机等移动设备硬件功能发展，以及通信世界3G时代的来临，移动即时通讯已经成为新时代通信的必然趋势，而作为NGN（下一代网络）核心的协议之一的SIP协议，体现

学位

移动通信系统移动通信系统即时通讯系统模型即时通讯系统模型SIP协议SIP协议管理机制管理机制

基于非完备信息系统的评价对象情感聚类

其他学术论文