名词—名词型复合结构的语义解释

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ZWH815117176
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今信息时代,网络成为人们获取信息的主要手段,信息检索一般通过搜索引擎进行。用户查询中词语复合结构占了相当一部分,但是目前的搜索引擎处理大多基于关键字,用户的查询被视作离散的字符串集,因此原本完整的复合结构被打碎成孤立的单词,用户的需求也被割裂,从而导致准确率的下降。这是本文的应用背景及研究起始点。另一方面,在自然语言处理中复合结构也普遍出现,因此寻找适合对复合结构进行语义解释的理论和方法具有重要的理论研究意义和广阔的应用价值。问题的瓶颈首先不在于提高算法的效率上,关注点在于如何完整地分析复合结构所表征的概念。因此重要的起始是探索如何用概念分析的方法标引复合结构。本文研究汉语名词-名词型复合结构的概念分析及其概念图标引。复合结构是由两个或两个以上的名词性概念直接组合而成,语义分析的要旨在于刻画其子成分间的关联语义关系。本文的研究从实例分析出发,尝试在内涵逻辑模型下用概念图标引复合结构子成分之间的关联语义关系,探索复合结构中概念耦合的内在特点。本文研究利用网络和语料库作为资源,从中抽取上下文构建模板,使用基于模板的聚类分析方法对复合结构进行语义解释。本文的贡献主要如下:1.复合结构语义解释的基础在于对复合结构本身的研究与分析,本文分析了复合结构的实例,并对复合结构的子成分——基本词汇与复合结构进行概念分析,总结了概念分析一些原则性的要点,探讨了求解关联语义关系的方法。2.尝试了从网络和语料库中抽取上下文和构建模板的方法。通过该方法能自动化地对复合结构抽取表示其关联语义关系的模板,以这些模板构建向量空间模型,可以对复合结构的关联语义关系进行表示。3.尝试了对复合结构关联语义关系的相似度进行计算,由此探索了按照关联语义关系对复合结构进行聚类分析的方法。当复合结构按关联语义关系分簇之后,复合结构的分析可以按簇进行,而不用对复合结构逐个标引,这将大大降低人力的消耗。本文的研究朝着对复合结构进行有效的概念分析的目标作了有益的探索和尝试,旨在为中文信息处理及其检索应用提供一点新的思路。
其他文献
信息检索技术是当前最热门的研究课题之一,它主要研究如何从海量信息中快速准确的查找到用户需要的信息。但在实际应用中,由于用户查询描述方法的局限性,系统返回的检索结果
随着互联网规模的不断扩大,其中蕴含的信息和数据也在持续增长。信息抽取技术的目标是从互联网中的海量无结构化数据中挖掘出结构化的数据。实体关系抽取是信息抽取的子任务,
射频识别(Radio Frequency Identification,RFID)技术是从上世纪80年代走向成熟的一项自动识别技术,近年来发展十分迅速。 本论文首先充分分析了RFID技术的特点,在其基础之上
旅行商问题(TSP)是来源于实际应用的一个非常重要的组合优化问题。该问题的研究对于实际运用和科学研究都有着重大的意义。本文主要通过研究局部搜索算法和演化计算方法来更
无线传感器网络是由部署在监测区域内大量的廉价微型传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统,其目的是协作地感知、采集和处理网络覆盖区域中感知
中国高速列车的研究起步较晚,但其发展却十分迅速。在高速列车设计过程中,无疑需要对高速列车进行三维列车实体和自然场景模拟的虚拟现实仿真,直观的得到高速列车运行反馈,以
计算机辅助优化排样是计算机辅助设计与制造(CAD/CAM)技术的重要分支之一,解决的问题就是在给定的原材料上放置所需求的各种毛坯零件,使毛坯的布局最优,目的是在满足毛坯需求
信息化技术的不断深入应用,特别是网络技术的迅速发展,导致了数据的规模急剧增长。因此,如何保证海量数据的有效存储和管理,提高针对海量数据的处理效率成为人们日益关注的焦点。
语音是实现人们之间沟通交流的最直接和方便的手段,语音识别也就成为了实现这一梦想的关键性技术,声纹识别就是语音识别中的一个关键技术。声纹特征是从语音波形当中提取出来
将人工免疫系统原理应用于入侵检测,形成了基于人工免疫的入侵检测系统。设计了一种基于遗传算法的动态克隆选择算法,该算法对r-连续位匹配规则进行改进,并应用遗传算法原理