论文部分内容阅读
对于句子进行分析,通常要满足句子分析的功能和意义两个标准。满足这两条标准通常要求对句子进行浅层的分析,同时也要对句子进行深层的分析。汉语作为世界上使用人数最多的语言,对于汉语句子的分析也就显得尤为重要。本论文对汉语句子分析的一些关键技术进行了研究。对于句子采用依存语法体系进行句法分析,然后在构建的语义依存模式树库基础上,通过基于DEF树形态相似度的词语相似度计算方法计算模糊匹配度,使用一种改进的有序模糊匹配的方法进行语义的分析,从而最终得到汉语句子全面的分析结果。
本文的核心工作可以概括为以下几个方面:
第一,对于汉语句子分词技术的研究。提出了一种融合神经网络和匹分词技术。神经网络具有良好的容错性、自组织和自学习的能力,本文使用反向传播神经网络以及匹配融合的分词方法,既利用了神经网络的容错性特点,又利用了传统匹配方法的优势,对二者的融合进行了探索。
第二,对于汉语词语的相似度计算的研究。提出了一种基于DEF树形态相似度的词语相似度计算方法,并且结合基于马科夫的相似度计算方法。本方法充分利用了树的形态相似性,能够深层次挖掘词语的语义相似性,并通过对比实验和同义词林的近义词相似性计算实验表明了方法的有效性和优势。
第三,对于语义表示的形式化研究。利用《知网》和《信息结构库》构建语义依存模式树库,将简单的文本描述的语义知识形式化并且成为便于计算机处理的形式。同时还对于构建的语义依存模式树库进行补充和完善。
第四,对于语义分析方法的研究。在依存句法分析的基础上使用一种改进的有序模糊匹配方法,在语义确定过程中使用到词语相似度进行模糊匹配度的计算。结果表明,这是一种有效的语义分析方法。
第五,对于分析结果的整合的研究。将汉语句子分析结果向RelEx靠拢,以期用于机器人系统中去。