基于模板匹配的交通领域标准信息抽取技术

来源 :长安大学 | 被引量 : 3次 | 上传用户:ltsomeday
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通信息化标准一致性检测是对标准与标准之间不一致的地方进行检测,已有的研究以段落为单位进行对比,所以处理过程的粒度较为粗糙,本文提出一种基于模板匹配的信息抽取方法,对抽取单位进行细化,从而提高一致性检测精度及效率。具体研究工作包括如下:首先对交通领域标准模板库的构建进行了研究。其方法是在对标准表述方式深入分析的基础上,从大量交通领域标准中提炼出标准中对事项进行规定的常用句子结果,形成通用表述形式的模板;再进一步对模板进行同义扩充,满足普遍适用的匹配需求;接着对模板逐一命名并按照所处位置和词义进行分类,最终形成包含12类,共142条的模板库。其次以句子为单位利用模板匹配操作实现标准的信息抽取。其方法是先将模板库加载入自定义词典;然后依照词典内容来对待匹配句子进行分词和词性标注;接着把语句中各词词性按顺序存储,从而形成词性标注集;最后利用正则表达式对词性标注集进行匹配,筛选出含有模板的语句,这些语句的模板槽中,填充了标准中规定的实体词及具体规范。论文对以上方法进行了设计、实现和试验。利用本文算法,使标准一致性检测工作中原有的逐段相似度计算,改进为实体词与实体词之间的计算,具体规范与具体规范之间的计算,大幅度提高了语句相似度检测的精度和效率。
其他文献
目的观察根治术后同步放化疗与放疗序贯化疗对老年宫颈癌患者生存情况的影响。方法选择行宫颈癌根治术后需放化疗治疗的老年早期宫颈癌患者98例,按照患者术后治疗方式分为同
利用数学分析的思想推导出偏增量法的数学模型,应用偏增量法对锅炉效率和供电煤耗率进行诊断分析,对影响锅炉性能的因素进行定量分析从而找到提高锅炉经济性的方法。将该方法
施工进度与工程质量、成本等方面有着密切的联系,施工进度管理是工程管理中的重要组成部分,它是依据合同规定中的内容,对施工过程中的工序进行合理安排的过程,保证在规定的时
工程机械是当前装备工业中的重要组成部分,随着不同行业中机械化的发展,人们在日常的生产和工作中,对于机械设备的依赖性也在逐渐增长,包括土方施工中常用的一些机械,平地机、挖掘
目的了解护理实习生疲劳现状,为临床护理教学提供参考。方法采用自觉疲劳症状调查表对160名实习护生进行问卷调查。结果实习护生疲劳总分为(4.32±0.76)分,有疲劳者占90.79%,
目的研究疼痛护理干预对肛肠科患者术后舒适度和疼痛的影响。方法选择2014年5月-2015年5月本院治疗的122例肛肠科患者。严格按照随机的分配方式将122例患者平均分为对照组和
随着现代诊疗技术的应用和发展,大剂量广谱抗生素、免疫抑制剂和激素的广泛应用导致人体免疫力下降,因化学因素诱导免疫抑制的患者数量迅速增多,近年来真菌感染上升很快,其中以呼
我军必将更多地定期或不定期举行新闻发布会。只有做好会前准备、会中实施和会后评估等工作,才能成功举办军事新闻发布会。
目的探讨严重创伤失血性休克患者的常见并发症的预防措施、有效的急诊护理措施及护理效果。方法选用2014年12月至2015年12月我院急诊科收治的168例严重创伤失血性休克患者进
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技