论文部分内容阅读
当今随着Web服务的发展,关系数据库中的数据量成几何级数的增长。但其传统的检索方式soL语句并不适用普通用户使用,而适合普通用户使用的数据库关键词检索的查询效率切一直不能尽如人意,特别是基于多数据库的关键词检索,查询效率更低。人们已经意识到为数据库提供高效的关键词检索的必要性。
首先,本文介绍了关系数据库基础知识和定义。在此基础上阐述了基于数据库数据图和模式图的系统模型,并分析它们的优缺点。
其次,针对关系数据库关键词查询系统存在的查询效率不高的问题,提出了建立多表联合索引的思想和一种新的候选元组集连接树的产生算法。通过建立多表联合索引,用户可以快速的过滤掉没有查询结果的候选元组集连接树,从而很大幅度的提高了数据库的查询效率;而通过使用这种新的候选元组集连接树的产生方法,使查询时不必再动态的访问关系数据库模式图。所以当数据库模式很复杂时,可以为查询系统节省大量的查询时间。
然后,针对关系数据库关键词查询系统查询效果不令人满意的问题。提出一种新型的分类的top-k排序算法。以分类的方式将查询结果展现给用户,这样用户不但可以查看到不同类别的查询结果,而且可以根据自己的需要做进一步检测。有助于用户快速的得到自己想要的查询结果。
最后,以多数据库的关键词查询系统为背景,对上述方法进行了验证,证明了其方法的有效性和优越性。