多环境下Skyline计算问题研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:suzhixie66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Skyline计算,也称轮廓查询,本质是一个多目标优化问题,目的旨在发现给定数据集中所有用户可能感兴趣的信息。作为一种基础的数据操作方法,Skyline计算在多目标决策支持系统、导航系统、环境监控、数据挖掘等领域有着广泛的应用。因此,自2001年被提出以来,Skyline计算研究一直是数据库和数据挖掘领域许多研究者关注的焦点。Skyline查询算法的设计主要受三个因素影响:数据特征、运行环境和设计目标。数据特征包含数据的生成方式、存储结构、空间维度及规模等信息。运行环境指执行查询操作的计算和网络环境,分集中式和分布式两种。设计目标则包括执行效率、渐进性、公平性、友好性等指标。三种因素的交织造成了Skyline计算环境的复杂多样性。目前,已有多种Skyline算法被相继提出,涵盖了静态和动态数据、固定和移动对象、集中和分布式系统、低维和高维数据空间等不同环境。不过,随着近年来云计算、传感网、大数据、移动互联等技术的飞速发展,新的应用环境和需求不断涌现,同时也对以往相对成熟的环境带来了影响。面对这种情况,现有算法已难以适应发展的需要。本文针对多种环境下的Skyline计算问题进行了研究与探索,主要研究点包括:集中式静态数据集下算法效率的提升问题;移动环境中基于位置依赖的连续查询问题;分布式架构下的Skyline计算问题和集中式静态数据集上的反Skyline查询问题。主要贡献如下:(1)在集中式静态数据集环境下,为提升大规模、高维数据集的Skyline计算效率,从算法自身和计算平台等方面考虑,提出了两种基于多核并行技术的Skyline算法。第一种算法采用预排序策略,将数据集按照任意指定维度排序,然后划分为多个子集进行并行化处理。第二种算法在第一种算法的基础上,首先改进了预排序策略,然后通过选择枢轴点,将数据空间划分为若干区域,利用区域支配关系,减少数据对象之间的支配测试次数,进一步提高了效率。两种算法处理过程简洁,具有较好的渐进性、用户友好型和可扩展性。实验结果表明,对于规模较大、维数较高的数据集,计算效率有较大提升。(2)在移动环境下,针对查询点快速移动时连续、高效输出指定搜索区域Skyline集合的问题,结合数据流技术,提出一种基于位置依赖的连续查询算法。首先使用R-树快速更新查询数据,然后利用两次连续计算时搜索区域的重叠性构造被动数据流,并对新增和失效数据分别进行处理,最终连续输出Skyline集合。由于充分利用了已有计算结果,算法计算量有大幅下降。实验结果表明,该算法特别适合计算频度要求较高的场合,与基于网格索引的算法相比,时间效率随着数据集规模的增大提升明显。(3)在分布式环境下,针对层次化拓扑结构对等网,研究了分布式数据流环境下的Skyline计算问题,提出了一种由下往上分层汇聚结果的算法。对下层网络,通过构造路由树重建了的路由结构,保证在每一跳均能对传输的数据进行有效过滤,降低了计算和通信开销;对上层网络,采用保序映射的方式将多维数据转换到一维空间并排序,然后依据上层网络节点标识符的大小顺序计算,保证了算法的渐进性和效率。实验结果表明,算法具有较好的可扩展性和较小的通信代价。(4)针对应用需求的变化,研究了集中式静态数据集下的反Skyline计算问题,以经典算法BBRS为基础,提出一种改进算法。预先为数据集建立R-树索引,然后以查询点为中心将数据空间分割为若干独立区域,使用一种简单的窗口查询方法并利用多核并行技术加速算法运行。实验结果表明,相对于传统的算法,算法性能有一定提升。
其他文献
随着人工智能的发展,我国己经步入了机器人时代。在未来的一段时间内,大量的职业会被机器人所取代,因此高职院校财务管理专业的学生就业也会受到较大影响。如何在机器人时代
[病例]男,71岁。因头晕、乏力2天入院。有高血压病、冠心病、心绞痛病史20年,前列腺肥大病史1年。查体:体温36.5℃,脉搏90/min,呼吸17/min,血压210/110mmHg。双肺呼吸音清,心率90/min,律齐
近年来,光场成像技术以其先拍摄后聚焦、可变景深、可变视点等新颖的成像特性受到了学界的广泛关注。目前,光场成像理论已成为数字成像领域和计算机视觉领域重要的理论增长点,并
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>教学实践中,我们常常发现这样的奇怪现象:写作训练时,学生常常感到无话可写或者难以表达,可是,每周上交的周记或者日记却灵气十足、文采飞扬。这说明学生一旦冲破思维的
语文课堂"高耗低效"行为十分普遍。教学目标模糊不清,教学内容随意散漫,教学组织无序、错乱以及对教学效果缺少基于目标的反馈与检测等在我们的语文课堂上屡见不鲜。语文教学
人民陪审员制度作为有中国特色社会主义司法制度的组成部分也是司法改革中不能忽略的内容。本文梳理了目前人民陪审员制度相关立法分析存在的问题,并在此基础上提出改善建议
市场竞争日益激烈,中国卷烟商业企业面临着严峻的挑战。以核心竞争力和价值链管理理论为基础,基于卷烟商业企业的价值管理平台,提出了价值链模式下的卷烟商业企业提升其核心竞争
自主访问控制(DAC)、强制访问控制(MAC)和基于角色访问控制(RBAC)等传统访问控制模型使用严格的安全策略管理用户权限。为了满足移动环境安全需要,人们使用位置、时态约束扩