论文部分内容阅读
本文设计并实现了领域汉语理解中的智能分词及聚类模型,并将其应用于机械产品的设计过程,依托整个领域汉语理解系统实现了自然语言形式描述的用户设计要求到计算机能够识别的概念设计要求或设计参数的转化。首先,分析了现有的分词系统设计的优点及其存在的不足,提出了基于系统论的机械分词和基于语义理解的分词相结合的智能分词模型。将智能分词模块嵌入到整个领域汉语理解系统中,在机械分词阶段提供所有可能的分词结果,并进行词法分析级别的歧义排除,在后续的汉语理解系统的语义分析模块中排除存在语义歧义的分词结果,最后利用体现其智能性的反馈模块将理解结果反馈回分词词库,实现分词系统和整个自然语言理解系统的自我完善及良性互动。其次,将聚类分析应用于领域汉语理解系统的领域划分模块中,完成对分词结果的领域定位。同时将词汇聚类系统运用于领域汉语理解系统的反馈模块中,用理解完毕后,自动建模之前的准分词结果对词汇聚类系统进行训练,使其逐步完善,最终完成对分词词库的词汇聚类,提高分词及领域汉语理解的准确性和效率。最后,结合实际将领域汉语理解及其智能分词和聚类分析系统应用在机械产品设计的用户需求分析领域,通过系统测试,结果比较令人满意。