论文部分内容阅读
无线网络技术的迅猛发展以及无线设备终端的日益普及,使得无线应用的需求迅猛增长,特别是无线搜索,成为了研究的热点。自动问答是搜索的一种重要形式,而且相对于传统的搜索方式,问答系统能更好地改善搜索质量。本文提出了一个基于本体的文本主题分类模型和一个改进的句子相似度计算模型,并将这两个模型运用到一个受限领域的移动问答系统中,进行了若干个实验进行验证,取得了良好的效果。该系统采用信息检索的技术,在常问问题语料库中查找与用户最相似的问题与答案作为结果,其功能模块主要分为三大部分,一是本体的构建,管理与存储;二是对常问问题集语料库的预处理,即按主题进行分类;三是自动问答模块,即对用户通过手机发送的提问进行处理,最终反馈结果。 本文首先介绍了本体和基于本体的信息检索的国内外研究现状,并介绍了本研究中构建本体的一般步骤。 然后介绍了基于本体的移动问答系统的关键技术: (1)利用反向有限状态自动机进行分词: (2)结合向量空间模型和本体,利用层次分类方法实现文本的主题分类; (3)按照本体概念间的关系进行扩展查询; (4)对基于几何距离的概念相似度计算进行分析和改进,提出了基于本体和知网的问句间相似度计算模型。 接着,分析、设计、实现了一个移动问答原型系统。该系统采用C/S架构,首先利用Jena API将OWL(Web Ontology Language)本体文件映射到数据库中。然后在手机上运行J2ME应用程序,访问Web服务器,与运行在Web服务器上的Servlet进行交互。Servlet通过问句分析、扩展查询、问句匹配、结果排序等步骤将最终结果返回给用户。 最后,设计了几个实验,对主题分类的精度和召回率,问答系统的精度,新的概念相似度计算方法,以及系统的运行效率等进行考察,实验结果证明了模型及系统的有效性。