基于模式发现的数据语义压缩方法

来源 :东南大学 | 被引量 : 0次 | 上传用户:vvchan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,科学实验、企业运作等诸多领域正不断地产生越来越多的数据,如何经济地存储、高效地处理这些海量数据已成为一个数据库应用中迫切需要解决的问题,具有重大的研究价值和实践意义。 传统的基于句法的压缩技术将数据集作为连续字节处理,未能利用数据表中隐藏的复杂依赖关系等语义信息,因此对海量、结构化数据表的压缩效果不佳。另一方面,对于探索性数据分析,并不一定需要准确的结果,能够保证误差范围,快速、近似的答案常常更为理想。本文提出了一种基于模式发现的语义压缩方法,将数据表中的冗余归结于其中存在许多可以被转化为压缩模型的模式,发现了这些模式也意味着得到了实现压缩的方法。 数据中的模式与其反映的概念有紧密联系,一个数据表通常代表了一个实际概念。然而现实中的概念是层次化的,因此还可以继续将数据表划分为多个包含更为具体的概念的数据子表。本文通过对数据表进行概念聚类,强化了区域内的模式特征,以便于模式定位方法的有效实施。特征驱动的方案分派机制保证了不同类型的模式对应的数据区都能交付给合适的压缩策略处理。 本文还在发现模式的同时实现了压缩表的语义索引,能提高压缩表的访问效率并为后续数据挖掘工作带来帮助。
其他文献
几何约束求解是计算机辅助设计技术的核心内容。基于图论的求解方法作为求解几何约束问题的最重要的方法之一,其优点为求解速度快,有较低的时间复杂度,因此应用最为广泛。分解分
WebJet业务流程装配平台具有异构、自治、分布式特性和可随企业应用需求而变化的软件环境,实现“半自动软件在线动态装配”机制,使用户能够灵活、简单地基于其需求来组织业务流
为旅客提供安全、方便、快捷的点对点运输服务是民航运输业追求的目标。民航电子客票的迅速普及以及移动电子商务环境的日趋成熟推动了移动电子客票的发展,而安全性是移动电子
数字水印是网络与信息安全方向的一个重要分支,在数字化媒体的信息安全与版权保护方面有着极为重要的应用。目前的研究重点是构造有强鲁棒性的稳健的数字水印算法,这是本文的研
在人们日常的办公过程中,常常需要使用文本编辑器进行文本搜索工作,例如在一篇文档中找出所有来自某一公司Email地址,或者找出所有特定范围内的电话号码等。显然要完成上述功
随着虚拟现实以及三维交互应用技术的不断发展,大型模型的实时显示逐渐成为计算机图形学研究的热点。作为虚拟场景交互式漫游的主要加速方法,遮挡剔除技术日益被众多科学家所
随着三维计算机动画电影成为一种现代的娱乐方式。对于动画电影中人物表情的要求也随之提高,如何做到逼真生动,符合人们日常的认知审美要求,是动画导演所要解决的一个重要问
IT系统在企业、部门的信息管理中得到了越来越广泛的应用,随着IT应用的扩展,IT网管系统对告警管理的智能化要求越来越迫切。在IT系统中,如果某个节点或节点中的某个网元发生故障
M矩阵是一类具有非正非对角元和非负对角元的矩阵,逆M矩阵是一类逆为M矩阵的非负矩阵。逆M矩阵在许多领域中都具有广泛的应用。本文利用图论理论研究逆M矩阵的完备问题,根据
OFDM技术以其有效对抗多径衰落、频谱利用率较高的优点,成为未来宽带无线通信系统的关键技术。OFDM系统中的自适应调制技术,通过为各个子信道选择合适的调制方式和信号功率,能够