论文部分内容阅读
随着位置感知技术的发展和广泛应用,海量的空间数据变得越来越容易获取。空间相互作用(Spatial Interaction)数据,也被称为起点终点流(Origin-Destination Flow)数据,作为一种特殊的空间数据,描述两个地点之间的关联,或者两个地点之间的物体移动。该数据在日常生活中非常普遍。例如:人的移民,车辆的行径,动物的迁徙,还有疾病的传播等等。大量空间相互作用数据的研究有助于理解不同领域的复杂动态,包括城市规划,智能交通,人口学,应急管理等等。例如,研究人类移动带来的位置到位置的关联程度,可以发现伴随而来的病毒传播的规律。目前的分析方法很难从大量的空间相互作用数据中发现有用的信息,也很难完全可视化大规模的数据,这是数据本身的复杂性所决定的。数据本身的复杂性主要包括:(1)大的数据量:一个中型规模的数据集通常包含几百到几千个位置,很容易有几千或者几百万位置与位置之间的关联。(2)多种数据维度:这些数据集一般镶嵌在多种维度内,比如空间维度,时间维度,网络维度,多属性维度。(3)可更改区域单元问题(Modifiable Area Unit Problem,MAUP):数据的起始位置的形状和大小差异非常大,导致数据集的分析产生偏差。(4)多尺度问题:数据在不同的地理或时间尺度上展示不同的规律。对于这样复杂的数据集,单一的方法不可能完全的解决这些问题。本文提出了一组方法来分析和可视化大规模的空间相互作用数据,并有效地处理了上述的问题。这些方法主要包括:基于共享邻居数的(Shared Nearest Neighbors)空间点聚类方法[1],该方法按照数据点分布的规律,将数据点归纳成含有相似数据量的聚类。在点分布密集的区域,形成小的地理空间的上的聚类,在点分布稀疏的区域,形成大的地理空间上的聚类。同时,这是一种数据驱动的聚类方法,能够在数据之间找到自然分割。在聚类的结果的基础上可视化统计量度,从而发现时空模式。该方法有效地处理了上述问题中数据量和可更改区域单元问题。基于共享邻居数的空间相互作用数据层次聚类方法[2],该方法将传统的层次聚类方法扩展运用到空间相互作用数据。该方法的主要思想是,将空间相互作用数据的起点间的相似度和终点间的相似度统一为一个相似性量度,然后运用聚合式的层次聚类方法将空间相互作用数据进行聚类。本文创新地使用共享邻居数作为相似性量度,来应对数据在空间上分布不均匀的问题。文章在对空间相互作用数据聚类的基础上,进一步研究了数据类群的时间特征。该方法能有效地处理上述问题中的前三个问题。空间相互作用数据核密度估计模型[3],这个方法的主要思想是将空间点的核密度估计方法扩展运用到空间相互作用数据,对相互作用数据集进行密度的估计,然后从密度分布中提取特征。该方法将数据进行了高度的抽象,能够很大程度上减少数据量。同时,核密度估计模型使用自适应的带宽(Adaptive Bandwidth),可以很好的处理数据分布不均的问题(可更改区域单元问题)。基于空间相互作用数据核密度估计模型的多尺度可视化,该方法主要将空间相互作用数据核密度估计模型进一步扩展。使用不同的参数进行空间相互作用数据密度估计和代表性数据选择,创新地实现了多辨率多尺度的流向地图。该方法能够非常有效的处理多尺度的问题。这些方法看似独立,但是它们从不同的角度分析了空间相互作用数据,用不同的方法增强了对复杂数据的理解。本文将多种不同但是互相补充的方法综合到一起,将计算方法、可视化方法、可视化分析方法等结合在一起分析空间相互作用数据,试图将不同方法的不同角度综合,形成一个全局整体的理解。