基于变分自编码器的城市交通数据缺失值填充算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:WTB2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市现代化发展和传感器设备的普及,城市居民和交通工具的活动轨迹都被传感器检测并记录下来。收集高质量的交通数据并建模其中的隐含信息对建设智能交通应用具有重大的现实意义,比如居民出行计划制定、交通拥塞控制等。然而,由于GPS信号干扰或者人为损坏等原因,传感器采集到的交通数据往往都包含缺失值,这限制了交通应用的决策准确性。因此,合理地处理缺失值是交通数据挖掘的首要任务。现有的基于统计机器学习和深度学习的填充算法能取得较好的补全效果,但也存在明显不足。主要表现在只专注于交通数据时间依赖性或者空间相关性的建模,却缺乏对时空特性的整体考虑和深层次挖掘。另外,之前的方法并没有对不同时间跨度的交通数据进行分类分析。针对上述问题,主要完成了以下几个方面的研究。针对长期交通缺失值填充场景,将每日按照固定频率采集的交通栅格数据视为一段包含多个通道的视频流。在此基础上,设计了一种无监督生成式缺失值填充算法。该算法主要基于变分自编码器的架构,进而运用赛尔维斯特标准化流技术用以提升原始模型的表达能力。同时,多注意力机制和门限机制被拓展用于挖掘缺失交通数据中的长时间动态性和远距离空间关联性。针对每一个不完整样本,该算法通过学习观测样本的随机隐变量分布从而实现对缺失数据的推断。在Taxi BJ等三个开源交通数据集上的实验结果表明,在将长期交通数据视为视频处理的基础上运用所提出的填充算法在填充效果上优于其他交通数据填充算法。针对短时交通缺失值填充场景,提出了一种时空特征解耦的填充方法。该方法利用了轻量级的可学习双向注意力图和跳级连接的变分自编码器结构来达到掩膜更新和不同尺度的空间特征融合的目的。在此基础上,充分考虑了多尺度的交通历史时间数据对提升模型补全性能的影响,并引入了外部因素来补充极端情况下的缺失值填充所需的信息。同时,改进了模型的目标函数。真实数据集下的实验显示,该算法能够逐帧地对短时间段内的交通栅格数据进行精细化填充。
其他文献
区块链是一个去中心化的分布式账本,具有去中心化、数据不可篡改、数据透明可追溯等特性,与传统的中心化数据库相比,其具有不可比拟的优势。研究者利用区块链的特性,将区块链应用到其它领域。在研究者利用区块链解决其它领域问题时,忽视了区块链存在的问题。区块链本身查询能力不足,目前仅仅支持查询少数键值的查询,难以支撑区块链作为数据库的高效性。同时,由于区块链上数据是透明的,每个节点都可以访问区块链上的数据,因
学位
行人检测旨在从图片或者视频中自动定位行人。在研究领域,行人检测是行人分析任务如行人跟踪、行人重识别等的前置环节。在应用领域,行人检测是自动驾驶、智能安防等系统的重要组成部分。相比人类发达的视觉能力,行人检测算法的错误率还需要进一步降低。行人检测存在两个问题,一是夜间场景下行人置信度低而背景置信度高。二是大规模场景下行人的外观差异性巨大。现有的行人检测算法简单地一对一学习正负样本,缺乏对前景背景的深
学位
近年来,随着疫情形势的愈发严峻和各类疾病的爆发,对于药物的需求愈发突出和显著。目前,新型药物的研制过程成本高、耗时长,所以药物再利用逐渐成为一种研发新型药物分子的可替代方案。该方案的关键在于如何在海量的药物-靶标相互作用关系中快速筛选出具有实际意义的关系对。因此,本文聚焦药物与靶标相互作用(Drug-Target Interaction,DTI)预测这一问题,具有重要的理论研究意义和实际应用价值。
学位
目的:肝内胆管结石是一种常见的胆道系统良性疾病。由于其复杂和易复发性,如何提高该疾病的临床疗效,改善患者的远期预后一直是肝胆外科医师面对的难题。尽管随着内镜器械及影像技术的发展,内窥镜也成为治疗胆道系统疾病的一种方式。但肝切除术依靠其切除病肝,降低复发的优势,仍在肝内胆管结石的治疗中占据不可替代的地位。近年来,随着外科医生腹腔镜手术经验的不断积累,腹腔镜下肝切除的范围不再局限于单个肝叶或肝段。本研
学位
目的:趋化因子配体11(Chemokine ligand 11,CCL11)可以将嗜酸性细胞募集到肿瘤微环境(Tumor microenvironment,TME)中。此前的研究表明,嗜酸性粒细胞在癌症中发挥免疫调节作用。因此,本文旨在研究CCL11在乳腺癌中的表达和对免疫浸润的影响,及其能否作为预后标志物。方法:首先下载TCGA数据库中的m RNA测序数据分析CCL11在各种癌症类型中的表达情况
学位
宏基因组学研究生物环境中所有物种的基因。目前,大量宏基因组对药物的反应、对人体健康的影响的规律仍未被掌握,亟待深化探究。此外,上万的微生物种类,对研究者的研究工作造成了障碍,而简单的根据门类分类进而分析的功能过少,无法挖掘微生物种群与种群间互相作用的深层机理。社区发现算法对大规模菌群物种进行模块划分得到若干个种群,可较好解决此种问题。近年来,随着高通量测序技术的大规模应用及数据量的飞速增长,进行模
学位
目的结直肠癌是结肠和直肠粘膜上皮和腺体发生的恶性肿瘤,发病率和死亡率均较高,累计肝转移超过15%,为很多国家带来了沉重的健康压力。目前,结直肠癌的主要治疗方法为手术治疗+放化疗,但是继续寻找新的治疗方法却从未停止过脚步。本课题主要研究萝卜硫素对结直肠癌细胞系中eIF4F翻译起始复合物的影响,深入研究相关机制,为萝卜硫素在结直肠癌的治疗提供理论依据。方法(1)收集安医大二附院2015-2017年度结
学位
目的:目前临床上对于卵巢囊肿的诊断主要依靠妇科彩超检查,对于肥胖患者而言,由于腹部脂肪较厚,普通妇科彩超对卵巢囊肿的检出率不如经阴道超声,但后者又存在诸多局限性,如患者不配合等。因此我们拟寻找更加便捷可靠的指标对肥胖合并卵巢囊肿患者进行筛,并评估这些指标在肥胖合并卵巢囊肿患者中的筛查价值。方法:回顾性分析2020年1月-2021年3月入住安徽医科大学第二附属医院医院胃肠外科的单纯性肥胖及肥胖合并卵
学位
随着科技的发展进步和人们生活水平的提高,图像作为信息的重要载体,已经成为现实应用中重要的组成部分,互联网上时刻都会产生海量的图像数据。清晰完整的图像既可以提升人的主观视觉感受,也可以为自动驾驶、公共场所监拍等实际应用完成社会职能提供帮助。遭受恶劣天气(如雨、雾)干扰影响所拍摄的图像会出现细节丢失、颜色失真等质量退化问题。这些退化现象也会破坏图像的原始语义信息,进而对后续的一些如图像分类、目标检测等
学位
背景:踝关节骨折主要是以旋转暴力为主的低能性损伤,根据Lauge-Hansen分型,踝关节骨折可分为旋后外旋、旋前外旋、旋前外展、旋后内收四个大类。旋后内收型(SAD)踝关节骨折是一种特殊类型的踝关节骨折,这种类型的骨折会导致胫骨远端的关节面发生塌陷,从而导致此类骨折手术的失败。因此,骨科医生需要对这种类型的骨折有更多的认识。这种类型损伤的严重程度介于普通踝关节骨折和Pilon骨折之间,基于踝关节
学位