问答系统中文输入纠错技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:caocao0121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在迅速发展的Web时代,问答系统在互联网上扮演了越来越重要的角色,而日益增多并且成熟的互联网用户对问答系统的要求也越来越高,其功能也在不断丰富和完善当中,除了推理功能等,输入自动检查纠错功能也是一项非常重要的附加技术。对于中文问答系统来说,输入自动检查纠错功能是指,用户在输入关键词进行搜索之后,如果问答系统没有计算出与用户问句相同的句子,而经过对用户句子进行纠错之后,能够得到与用户问句相似的句子,则用户将会在问答系统页面看到系统提供的推测到的相似问句。针对以上问题,根据中文语言的特点,对中文语料库建立了N-gram统计语言模型,并且对其进行了详细的分析,确定了语言模型所必需的参数,以及对其进行了优化处理,使其更加接近真实情况下的语言。研究中引入了拼音纠错和映射表相结合的纠错方法,并首次提出使用语言模型解码算法对纠错检查结果再次计算比较,最终得出优化的纠错结果。以上所提出的理论模型,本文进行了实验验证,在统计语言模型的基础上,采用三种不同的纠错方法进行实验对比,一是只有拼音纠错,二是拼音纠错与映射表结合,三是拼音纠错与映射表结合并利用语言模型解码算法优化。最后对实验结果进行了分析,验证得出利用最后一种方法即第三种方法能够取得较好的效果,并且上下文语境信息越多,纠错的召回率和准确率也就越高。最后,对本论文所做的工作进行总结,指出了下一步的研究方向。
其他文献
我国的铁路机车车辆工业正在经历一个从技术依附型向自主创新型发展的过程,国内的技术人员通过引进并学习国外的先进技术,逐步实现了我国轨道交通终端设备自主研发生产的目标
汽车尾气余热热电转换是对汽车发动机排出高温尾气的一种合理利用。当热电转换模块的两端存在温差时,会有电能产生。通过热电转换模块把高温尾气的热能转换成电能,对模块发电效
我国是一个天然气资源丰富的大国,天然气远景储量达56万亿立方米。天然气作为一种高效、清洁燃料,由于其燃烧充分、无污染、使用方便的特性得到了广泛的应用。随着社会各项经济指数的增加和科学技术的发展,我国天然气产量呈明显的逐年稳定增长趋势。近年来,随着国家“能源高速公路”—天然气输送管道的大量建设,国家能源高速公路“收款机”—贸易用气体流量计算机需求量大增。目前中国国内天然气行业用于贸易级别的流量计算机
机器人世界杯足球赛(Robot World Cup, Robocup),它涉及人工智能、机器人学、传感、通讯等诸多领域的前沿研究和技术集成。RoboCup2D仿真比赛系统作为一个仿真平台,在此基础
水质预警信息发布系统是水质预警系统的核心,在发生水质警情之前便能够将水质警戒信息通过多渠道准确实时地发布到用户终端,对保障饮用水安全,提高快速应急能力具有重大意义
人脸识别作为现有生物特征识别的方式之一,因其具有友好性、非接触性、不易察觉等优点,在公安、交通、银行等行业有着广泛的应用前景。随着计算机、多媒体技术的成熟,基于视
随着各国经济发展重点向海洋的转移,海洋的地位日益提高,而潜艇作为海上作战的主要武器之一,一直受到各国海军高度重视。现代水下作战空间的不断扩大和反潜探测手段的日益提
随着近些年具有感知、采集、存储及处理数据,以及无线通信功能的微型、低成本、低功耗、可编程传感器设计及制造技术的发展,无线传感器网络在更多的领域内获得了更为广泛的应
基于云计算的智能煤矿管理系统,是信息时代的产物,融计算机技术、网络技术、现代控制技术、图形显示技术、通信技术、云计算技术于一体,是智慧矿山极其重要的组成部分。  
地图匹配算法使用GPS信息和高分辨率的数字地图提供增强的定位数据输出,目的是为了确定用户(或车辆)所在的路段与在该路段上的准确位置,为智能交通许多服务如路径引导、车队管理