分辨率自适应抽样的大数据可视化系统设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:linxi054
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,数据可视化技术在人工智能和数据科学领域中被广泛使用,研究者利用图形特征易于观察的特点,来发现原始数据中不易察觉到的数据联系。然而在当前实际的人工智能数据分析应用中,数据往往具有大数据量、高维度等特点,由于客观的屏幕的分辨率的有限性,将高维大数据完整地渲染在屏幕上几乎是做不到的,因而在低配置的通用硬件系统上实施可视化具有一定的难度。本文通过自适应当前屏幕的分辨率,依据在当前分辨率下能够实现可视化的数据规模对大数据量、高维度的原始数据进行抽样,并将抽样结果渲染在屏幕上。基于上述思想本文设计了大数据可视化系统,用户可以在训练人工智能模型前,通过使用经该系统处理之后的可视化结果,能够观察出原始数据的内部规律和数据特征,从而来预测训练数据的可用性。本文旨在设计并实现了一种大数据可视化系统,探讨其中诸多关键技术问题。主要工作内容包括:(1)通过一种保持相对子空间抽样算法将原始数据降低到当前分辨率可接受的数量范围。针对当前分辨率,对可视化图形中任意一个子空间,保持其相对的数据比例,从而使空间中的数据疏密程度能与原始数据保持一致。(2)通过一种粘滞邻域极值降维算法将高维数据降低到当前分辨率下可接受的维度范围。针对当前分辨率,对可视化图形中任意一个采样点的邻域,粘滞其图形边界极值,从而使可视化的视觉效果在变化趋势上能与原始数据保持一致。(3)通过本文设计开发的大数据可视化系统的预处理及渲染模块,使得分辨率自适应抽样的大数据可视化能够在低配置的通用硬件系统上能够有效实施。对于多个不同规模的数据集(包括大小为2.5TB的人类基因组纳米孔测序数据集),观察其在以雷达图为显示载体的大数据可视化系统下运行后的效果图,可以清楚地发现相同类别的共性与不同类别之间的差异。因此用户在进行人工智能模型训练前,使用本系统可以有效地预测训练数据的可用性,为后续工作获得更为准确的结论提供依据。
其他文献
随着计算机视觉技术的发展,基于监控系统的智能人群行为分析方法被广泛地用于各种人群场景的安防管控。人群场景中的行人由于行为交互以及周围环境限制会形成多个小规模群组
通过对通信信号的识别和分析处理,能够对接下来的信息处理与应用提供更多的信息,在军事侦察、电子对抗、无线网络安全、机器人工智能等方面具有非常重要的意义。通信信号的调
20世纪以来,半导体量子点显示器相比有机发光二极管(OLED)具有更独特的优势而倍受青睐,包括窄的半峰宽,尺寸可调的发射波长,非常高的荧光量子产率(PLQY),不错的光稳定性和热稳定
学位
非线性算子理论是非线性泛函分析的主要内容之一,其中非线性算子不动点和重合点的研究尤为重要,应用也十分广泛.随着不动点理论的深入学习,学者们开始尝试在各类空间中引入不同条件的压缩映射,进而研究这些映射中是否存在唯一的不动点.本文主要对G-度量空间,b-度量空间,Gb-度量空间,以及偏序度量空间中的若干问题进行了研究,并分别讨论这四类空间中的重合点、不动点、公共不动点以及耦合公共不动点问题.全文共分为
随着互联网的发展以及多媒体技术的广泛应用,图像和视频等多媒体数据呈现快速增长趋势,其也为多媒体检索技术提出了严峻挑战。哈希算法将高维的浮点型图像特征映射为紧凑的二
为改善城市结构、提高土地利用率,城市更新项目在我国大中城市迅速崛起。而由于工程总承包模式在城市更新项目中具有良好的适配性,未来将有越来越多的城市更新项目采用总承包模式。工程总承包模式下城市更新项目不仅具有总承包模式下建设项目的特点,还兼具PPP模式的特点,而城市更新项目本身也与普通建设项目情况不同。这意味着总承包模式下城市更新项目的建设周期更长、规模更大、情况更复杂、不确定性因素更多,工期索赔管理
湖南皮影艺术不仅是中国皮影艺术不可分割的一个流派,也是中国非物质文化遗产重要组成部分。随着社会的发展,传统皮影受到现代技术娱乐方式的影响,在皮影的传播和传承方面都
企业生命周期理论指出,企业与其他有机生命体一样会经历由“出生”到“死亡”这一过程。财务战略矩阵模型是以企业创造价值的能力和资金需求量两个评价标准出发,对公司的价值
近期的弱监督图像语义分割算法主要是基于通用分类网络的弱定位能力生成初始定位图,然后基于擦除或区域生长等方法扩展初始定位图中的物体语义区域以获得较完整的物体定位图,