基于特征提取技术的域依赖名词极性分析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lailinyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社交网络中,对于巨大数量的产品和服务,每天都会产生越来越多非结构化的在线评论。在线用户不仅表达对产品和服务的整体意见,还会针对感兴趣的某一个特定产品特征表达他们的情感。在特征层面上,自动识别用户们的主观意见能够给生产者和消费者在决策制定方面提供很大的支持。虽然特征层面的情感分析和意见挖掘的方法有很多,但是对于这些本身是客观、没有情感的而在特定的知识域中却表达了积极或者消极情感的名词特征,却只有很少的研究。在本文中,我们对这种特征层面的域依赖名词极性进行分析处理。对于名词特征的处理,我们使用基于语言学框架的提取算法。对于文本中的每句话,我们进行分词处理,同时为每一个词标注上相应的词性。接下来,也是比较重要的部分,就是确定句子中每个词语与其他词语之间的依赖关系,以及确定出每个词语的作用域。这样,我们就可以准确地提取出句子中的名词特征。同时,为了后续的情感得分计算,我们还需要提取出副词-形容词-名词短语结构。在意见挖掘领域中,挖掘域依赖的意见词是一个很重要的问题,这个工作有助于文本的情感分析和意见挖掘。然而,现有的情感分析和意见挖掘工作主要分析形容词和动词,只有很少的工作把分析重点放在名词和名词短语。在我们的研究中,我们使用基于语言学分析的意见挖掘方法,来识别和提取在特定知识领域中表达着积极或消极意见的客观名词特征。首先,我们提出一种自动提取名词特征的方法。这种提取方法利用语言学框架来提取副词-形容词-名词结构的短语。随后,对于提取出的副词-形容词-名词结构的短语,我们提出了一种通用加法模型来计算副词-形容词-名词结构中名词特征的情感得分。然后,通过使用统计算法和删除掉在特定领域中不表达情感的名词特征,我们能够确定在特定领域中表达意见的客观名词特征。最后,我们进行了多次实验,以体现我提出方法的优点。基于现实生活中的数据集,提出的方法在精确度和鲁棒性上展现了很好的优势。另外,我们做的实验体现出了预计的召回率和准确率。
其他文献
随着网络信息技术的发展,在科学计算、商业数据存储等众多行业领域中产生了海量的数据。这些大规模的数据给存储系统的可用性和可靠性提出了严峻的挑战。分布式存储系统通过
仿人机器人学是结合了多门学科的一个综合性研究方向,是机器人学中对更智能机器人的探索。人工智能领域里的多智能体系统(Multi Agent System)一直是学者们的研究焦点。作为
智能家居(Smart Home)(或者广泛称为智慧家居Intelligent Home)是一个很大的新领域,包含人机交互,人工智能和网络交互等,目的是通过网路互联起家居并且使设备自动化从而实现交互
优化网络的拓扑结构可使互连网络具有良好的对称性、通用性、可扩展性、递归性及容错性等特性,而网络的通用性一般由网络的可嵌入性进行衡量。局部扭立方体网络是超立方体网
在机器学习的问题中,我们常常假设我们感兴趣的对象两两之间的具有某种关系。而这些对象的集合与其所包含的两两之间的关系很自然的能够用一个图来表示。其中,对象由图的顶点
在图像信号处理的各个环节,如采集、编码和传输,图像都会在一定程度上被污染,进而降低图像质量,对图像的后续处理产生影响。所以,作为图像处理中一个不可或缺的环节,图像去噪
股骨头坏死是目前世界上一个很普遍的疾病。在股骨头坏死疾病中晚期,股骨头发生严重变形和塌陷,患者只能采用人工股骨头假体对坏死的股骨头进行置换。股骨头是人体的承重关节
伴随着云计算的深入发展和研究,在云计算环境中开发的科学工作流,商务工作流以及协同应用流程越来越多,他们功能强大且通常都需要大量的资源。同时在云环境中应用服务流程变
无线传感器网络由大量部署在监测区域内的微型传感器节点通过自组织、自适应的方式构成,这些传感器节点具有一定的感知能力、数据处理能力和通信能力。近年来无线传感器网络
拓扑结构是网络中最重要的设计问题。现有的网络拓扑结构如线性,环形,星形,二叉树等。近年来,超立方体型网络已经受到多方关注,由于超立方体很多优秀特性吸引着大规模并行超