论文部分内容阅读
创新设计是企业能够不断发展不断进步的动力。创新原理和创新知识可以启发设计人员产生全新式的设计思路。效应表达的是科学原理,利用本体对科学效应进行表达更加规范且实现了对知识的推理,可以拓宽解决问题的途径,帮助设计人员进行产品的创新。但Protégé等本体编辑工具对本体的编辑和扩充需要大量的人为参与,人工录入和填充本体库耗时耗力,效率低。原有效应知识存储于关系数据库中,其表达内容不能满足效应本体库丰富的关系要求。本文提出了一种基于浅层语义分析和机器学习的方法,对已有效应信息进行进一步分析和抽取,并与本体库结构自动匹配,最终完成效应领域本体库的自动填充。本文主要研究内容如下:1对效应领域本体库的结构进行分析,获得自动填充效应本体库的标准格式和组成效应本体的关键概念,包括操作、输入流、输出流、输入流属性和输出流属性。2本文从原效应关系库抽取名称和说明字段进行浅层语义分析,依次经过切分单词、构建句法结构树、语义角色分析、语义角色分类特征抽取等过程。3本文提出B-M-Onto模型,该模型以最大熵模型为基础,以原效应关系库的语义分析结果为特征并引入自训练的机制,自训练的引入使该模型在小规模语料库下可以获得较好的语义角色分类效果,并对语义角色分类的结果与效应关键概念类别进行转化和匹配,最后调用Protégé-OWLAPI完成对效应原理的自动填充。4对整个自动填充过程进行实验分析,B-M-Onto模型完成了效应知识从关系数据库到本体库的自动填充,与传统最大熵分类在样本规模相同的情况下整体性能提高4%。本课题已成功应用于现有的本实验室开发的创新软件产品中,完成了效应知识从之前软件版本的关系数据库向当前版本的效应本体库的自动转化与填充功能。