论文部分内容阅读
万维网的出现改变了人与人之间交流的方式,尤其是社交网络(social media)的发展,使人们可以自由地发布和传播信息。在这些信息中,除了事实性的客观信息以外,观点和情感等主观性信息更是快速增长。越来越多的用户在网络上分享他们对事物的评价与感受。不断增多的用户数量和情感信息,引起了学者和相关行业的关注。然而,目前该领域普遍面临情感分析资源匮乏的问题,同时,各资源相互独立,共享性差。更糟糕的是,情感表达形式和模型的异质性,使得无法连接和重用不同的资源。因此,本论文采用关联数据等语义网相关技术描述文本中的情感语义,通过构建情感元数据本体,发布情感关联数据,实现情感资源的共享和语义查询。本文研究内容如下:第一章主要对情感关联数据的意义、研究背景进行了介绍,分析了该领域的国内外研究现状。第二章主要介绍语义网的技术概况、资源描述框架RDF、本体和本体的描述语言OWL及关联数据的相关概念,为情感关联数据的构建做技术准备。第三章通过OWL本体描述语言对情感元数据进行了描述,本研究主要复用现今使用较为广泛的元数据本体SKOS、PROV、语义资源本体(Frame Net Ontology)和一个情感本体WordNet Affect,对本体进行相互映射,实现不同本体间的关联。第四章以第三章所构建的本体为基础,采集和标注情感语义资源数据,将数据以RDF格式进行转换,完成数据集之间的关联,实现情感关联数据的发布。第五章在构建关联数据的基础上对关联数据进行了发布、浏览和查询,采用Jena Fuseki完成对在线评论情感关联数据的构建和查询,实现资源之间的交互操作。第六章是对论文所作的研究工作和创新之处的总结,并提出进一步努力的方向。本论文的研究结果为情感分析和语义挖掘提供了机器可读可理解的语义资源,为情感语义的推理和智能化应用提供了有效的知识结构和数据基础。