论文部分内容阅读
本文介绍了一种基于规则的识别未登录化学物质名词的方法。通过对大量的化学物质名称进行观察后,发现化学领域中的物质命名有一定的规律可循。本文通过化学物质命名的常用词及规律进行总结,将化学特定词分为3类:化学介词、化学词头和化学符号,制定六项规则,提出了对化学物质名称基于规则的识别方法。在系统实现方面,应用正则表达式将规则结合模板表示出来,从文本信息中提取特定的化学物质专用特征词,同时进行了可行性实验,经过对比,验证了规则的可行性。