论文部分内容阅读
网络信息爆炸性增长直接导致“网络信息过载”。如何在海量的信息资源中准确快速查找问题答案,已成为当今信息传递的障碍和优质资源普及的瓶颈。为解决信息过载带来的问题,90年代提出了网络信息推荐。今天信息推荐在教育领域的普及才刚刚起步。智能问答系统成为了信息推荐在教育领域的主要表现形式。传统问答系统,大都是基于管理员的在线值守形式,往往出现时效性差、答案过于片面。传统问答系统也多是以关键字为搜索元数据。对于计算机水平有限的初高中学生来讲,他们更擅长以自然语言方式提问。为提高信息服务的质量,论文提出了基于自然语言的在线问答系统。本方案不但能解决中小学生在加工和提取关键字方面的不足,而且能更好的发挥网络知识库在教学与学习过程中的指导作用。为改进传统信息推荐的处理方式,本文提出了以下改进步骤。引入了完整的问句预处理机制。首先对问句中的非汉语字符进行前期标注和剥离。然后调用改进型最大匹配分词算法对专业术语和问句客气词进行处理。为提高分词的精确度和降低分词歧义出现概率,引入了正向扩词分词算法以改进分词算法的精度。在分词过程中,不可避免会出现分词歧义现象。为排除分词中的歧义现象,文中引入了最大匹配分词算法的改进型—逆向去尾分词算法。逆向去尾分词算法引入,大大降低了分词歧义的出现率。针对传统搜索引擎的信息大量罗列,本文选择并实现了信息的准确推荐。在信息推荐过程中选用新型的信息可信度评估算法和评估标准。不但按照算法的精度进行排序而且为终端用户提供信息咨询评价,为用户快速查阅信息提供了方便。本文改进算法集合的应用不但能充分的发挥网络技术在信息流通快捷、方便、经济等特点,还能够做到准确推荐问题答案。论文实施过程中分为以下技术难点:问句预处理、中文分词、分词去歧义、答案搜索、结果评估等。系统根据用户需求对整个系统做全面的功能和技术分析,并最终进行系统实现。