论文部分内容阅读
移动互联网的市场热潮将如10年前的互联网一样扑面而来。手机作为这个时代浪潮的关键承载之物,起到了信息存储、分享和传递的重要作用。较之过去,在硬件技术不断提高的情况下,手机不再是单纯的通讯工具,而是多媒体信息处理平台,多数据存储平台。然而,面对手机数据量日益增大,数据类型日益增多的情况下,我们也面临一些亟待解决的关键问题。其中之一是手机中如何快速、有效、准确地定位目标数据。手机搭载的系统各异,其数据存取风格也有所区别,大部分手机上的文件系统对用户来说是不透明的,或者部分透明。手机用户不能像PC一样方便快速地定位和管理手机上某些文件,正因如此,出现了手机本地资源搜索的需求。本文从手机的一些共性特点着手,设计了本地资源搜索引擎。此引擎的设计具有如下特色:第一、采用单字倒排索引的方式对信息含量较少的文档进行索引处理;第二、针对信息量少的中文文档,采用了拼音首字母索引的设计;第三、在结果排序模块中,本文结合了关键字个数和用户点击频率两个因素,对结果排序的算法进行了设计和实现。首先,结合手机结构和特点,对用户提出的各项功能和性能需求做了详细的分析。其次,深入了解了搜索引擎的基本原理,对其基本数据类型、索引方式、索引过程进行了讨论。然后,对开源的全文检索引擎Lucene进行了分析,参考了它的整体框架的设计思想和软件构架思路。在对手机本地资源搜索的理解基础上,提出了本引擎的流程。针对流程中的各个部分,进行了算法比较分析,总结出适合运用于本搜索引擎的算法。在系统的详细设计中,根据搜索引擎的整个流程本文提出了本引擎的设计框架,根据索引策略并结合SQLite3数据库设计出了索引文件表;在结果排序上,运用了关键字个数和用户点击频率相结合的方式。最后,对系统进行了功能和性能上的验证,从验证的数据来看,本地资源搜索引擎的设计是可行的,准确地实现了用户提出的要求。