论文部分内容阅读
在流行的数据库应用体系中,数据权限所有者把可合法拥有的数据委托数据库服务提供商(Database Service Provider, DBSP)管理,数据库作为服务器,为应用提供数据支持,即DBAAS模型[1],也称为DBAAS模型。DBSP负责对用户数据进行存取、管理和查询,这意味着被委托代管的数据库服务提供商可在无数据合法权限的情况下获取用户数据,因此,数据库的安全威胁已经不仅来自与网络连接的攻击,而更多来源于因委托权限变化而带来的安全问题。为解决这个问题,通常使用的是对数据库进行加密,以保障数据安全。但采用这种方法,在对数据进行检索时,要先对密文逐一解密,然后进行明文检索,这样就会导致了检索性能的急剧下降。特别是对于结构化的关系型数据,在对数据进行加密操作,会破坏原数据的一些固有特征,比如数据的前后位置序列、数值大小变换等,这样,沿用明文检索方法对密文进行检索会变得更加困难。针对上述问题,本文从分析结构化数据库的结构特征和加密方法入手,在DBAAS模型环境下,考察常见的关系型数据数值型和字符型CHAR/VARCHAR和CLOB数据加密及密文检索策略,在保留特征值提取的基础上,提出基于字典分词和邻位字符分组的改进算法。对CHAR/VARCHA提出两种过滤算法,对CLOB型数据提出两步过滤算法。这种检索策略,能够迅速缩小密文检索的数据范围,提高匹配的精确度,对字符型数据检索效率的提高有较大改善。因为在算法中进行位置特征提取的数据集是密文字符,在客户端没有密钥就无法进行解密操作,所以,算法具有和数据加密策略一样的安全级别。最后,本文通过对字符型数据CHAR/VARCHAR类型和CLOB类型的密文检索实际实验,验证了论文提出的基于字典分词和邻位字符分组的改进算法在检索时间效率和检索准确率上具有良好的性能。