论文部分内容阅读
随着互联网技术的发展和计算机的普及,人们越来越多的产生了大量的个人信息,包括短信息,照片,视频,email,联系人,blog,文档等。人们迫切的需要有一个方便易用的系统来管理和检索这些个人数据。我们的日常生活中能产生这些数据信息大多是依赖于生活中的事件,超级照片链接系统就是一个基于生活中的事件为检索单元的个人数据管理和检索系统,其检索系统是以clucene为基础架构。他能够让用户以一张照片为切入点获得照片所在事件的其他个人数据。论文首先分析人们日常数据的产生与事件的关系,论证系统以事件作为检索单元的可行性;然后给出了系统的需求分析,并介绍了相应的软硬件环境;接着从功能的角度描述系统总体设计,包括照片时空聚类和存储,个人数据获取,个人数据检索支撑子系统,界面显示,其中重点描述了个人数据检索子系统各个模块的设计;最后着重描述了基于clucene的个人数据检索支撑系统各个模块的实现,包括clucene的架构,clucene的索引与检索,同义词索引的构建,clucene中的同义词扩展和相似度计算的改进,检索结果的高亮显示,同义词索引的在线升级。基于clucene的个人数据检索支撑系统描述中首先介绍了信息检索系统的基本概念,包括查询扩展方法,相似度计算方法,clucene模块及架构,wordnet同义词典介绍;然后描述了clucene的索引与检索;接着描述了同义词索引构建模块的设计与实现;然后描述了clucene的检索模块的实现以及相似度算法及在clucene中添加同义词扩展的设计与实现;然后描述了高亮显示模块的设计与实现,最后描述了同义词索引的在线升级模块的设计与实现。系统测试部分首先展示了同义词索引的测试结果,然后展示了同义词扩展后的文本检索和排序结果,然后展示了同义词索引升级的测试结果;最后展示了在超级照片链接系统中的测试结果。论文最后对全文做出了总结,并描述了系统存在的不足和进一步工作,总结了本人在硕士研究生期间的工作和成果。