时空数据表征学习与预测建模

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:sheng198208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家智能化建设战略的不断升级,以及实时定位、智能移动终端和便携式传感等多项技术的快速普及与发展,时空数据在当下正变得越发容易获取并展现出极大的应用价值。对时空数据进行充分挖掘并获取有价值的知识,可为诸多领域中实际问题的有效解决提供重要帮助。因而,如何更好的学习时空数据所特有的模式表征,并针对不同问题建立精准的预测模型,进而实现高价值知识的自动发现是一个非常重要的研究问题。本文以时空数据为研究对象,围绕时空数据表征学习与预测建模的关键研究问题,针对时间序列预测中的样本重要性采样、时空需求预测中的异构时空表征学习、跨域类别型数据阶依赖嵌入表征中的序列化建模以及基于知识图谱的动态兴趣序列学习等重要研究内容,取得了如下的研究成果:(1)针对传统长短时记忆(Long Short Term Memory,LSTM)模型在时序预测建模时未考虑对输入样本进行重要性采样的问题,提出一种基于进化注意力机制的长短期记忆网络模型(Evolutionary Attention-based Long Short Term Memory,EA-LSTM)。进一步,为避免基于梯度方法求解网络参数时易陷入局部最优,提出一种竞争性随机搜索的进化策略对EA-LSTM模型中的注意力层参数进行求解。多个时序预测任务上的实验结果表明,相比于其他基线方法,该模型能够得到更准确的预测结果。(2)针对共享单车时空需求预测任务,基于用户,骑行与站点三者的时空关系建立动态异构图,提出一种时空图向量化模型(Spatial Temporal Graph to Vector,STG2Vec)学习动态异构图的嵌入表征。进一步,结合地理位置、天气、时间、历史需求模式等多源信息,学习到的动态异构图的嵌入表征可用于实现站点级的共享单车需求量预测。Citi-Bike数据集上的实验表明,该模型能够实现更准确的时空需求预测。(3)针对电子病历中的广泛存在的类别型结构化数据,提出一种跨域类别型属性嵌入模型(Cross-field Categorical Attributes Embedding,CCAE),通过逐阶特征交互,挖掘变量间的语义耦合关系,以学习属性级多阶向量化表征。进一步,巧妙地将建模多阶表征间阶依赖关系转化为一个广义的序列学习问题,并通过循环神经网络捕捉多阶表征间的语义相关性。SEER电子健康记录数据集上的实验结果表明,CCAE能够实现更精准的临床终点预测。(4)针对基于知识图谱的点击率预测任务中,既有基于路径与基于知识图谱实体嵌入的方法难以学习用户动态兴趣序列间的语义模式表征的问题,提出一种基于知识图谱的动态兴趣表征学习方法(Dynamic Interest Sequence Learning,DISL)。具体地,一种由知识强化的路径挖掘和动态兴趣信号发现联合构成的多粒度动态兴趣序列学习方法被提出,并用于准确地建模用户历史行为序列中所反映出的兴趣偏好特征。在多个数据集上的实验结果表明,相比于其他基线,DISL具有更好的推荐性能。
其他文献
光电化学(PEC)水分解体系利用太阳能将水分解产生氢能,是提供新型可再生能源的重要手段。由于光阳极的水氧化反应为四电子转移过程,制约着水分解性能的整体效率,所以提高光阳极
本报告是基于笔者在石家庄举行的2019年中国自由搏击职业联赛中的陪同口译实践经历,选取部分口译内容为案例分析对象,以释意理论为指导,分析了笔者在实际口译过程中遇到的问题和口译策略。本报告分为四章。第一章是对此次口译任务的描述,介绍了此次口译任务的背景、任务性质以及任务委托方的要求。第二章介绍任务过程,叙述了笔者在此次口译任务中的译前准备、口译过程以及译后评估等。第三章为案例分析,笔者以释意理论为指
政府监管是推进国家治理体系和治理能力现代化的重要工具。传统社会性监管重视政府和监管对象之间的互动,而忽视了公众诉求对政府监管的有效作用。运用北京市政务热线大数据,
目的:体外研究外源性硫化氢(GYY4137)对绝经后骨质疏松症患者骨髓间充质干细胞(BMMSC)增殖和成骨分化的生物学影响及探讨其可能机制。方法:取绝经后骨质疏松性骨折行全髋置换治疗的患者20名,术中自股骨近端做骨髓取样用于细胞培养。采用全骨髓贴壁法行原代细胞培养获得h-BMMSC,利用流式细胞技术鉴定。以有限稀释法纯化获得纯度较高的原代h-BMMSC。MTT法检测外源性H_2S供体GYY4137
自2008年中国首家社区基金会成立以来,社区基金会参与基层治理已经成为社区公益慈善事业发展的新现象。国内政府主导型社区基金会成为主要研究对象。在理论层面,本研究基于回
本实验报告研究的是知识图式对交替传译流利度的影响。知识图式指与文本内容相关的背景知识,在口译中体现为译者对口译主题的熟悉程度。目前,国内外已有研究表明,知识图式与
意见挖掘是对具有主观情感的语言文本进行意见信息提取的过程,是自然语言处理领域的核心任务之一。其中细粒度的意见挖掘可以对指定目标进行精准化意见抽取,具有非常重要的理论研究意义和商业应用价值。随着深度学习的发展,利用神经网络进行细粒度意见挖掘成为一种主流方式。然而分析粒度的细化导致神经网络对关键信息捕获的难度急剧增加,在分析含有多个不同情感属性的评论文本时尤为突出,该类复杂文本中各类无关信息对目标属性
在快节奏的生活之下,人们对于艺术作品的审美和创造也愈加“快餐化”,追求视觉上的对比冲击感和随心所欲的肤浅表达日嚣尘上,在这样盲目、表面的追求艺术的风潮之下,乃至存在大批青年艺术家们也极力追捧抽象、夸张和扭曲等富含视觉表现力的艺术表现方式,而忽略了对生活本真和美好生命的发现,乃至出现了对表现现实题材的真实不屑一顾的情况,认为对现实事物的表现不能把画家内心的情感尽情展现出来,在吸引观者的眼球的要求上面
精液保存是人工授精技术的关键环节,对于提高优良品种的利用率,推进家畜的遗传改良工作有重要意义。目前,绵羊精液低温保存仍存在保存时间短、受胎率低等问题。为了减少绵羊
背景系统性红斑狼疮(systemic lupus erythematosus,SLE)可被定义为慢性自身性免疫性疾病,同时也是一种炎症性疾病,在疾病发展过程中,多种器官如肾脏、皮肤、关节等均可受累。自身抗体和免疫复合物在SLE疾病病理过程中发挥额至关重要的作用。目前认为,遗传因素、环境因素、性激素和免疫调节因素均参与了SLE的发病过程,但其发病的确切机制尚不完全清楚。E-cadherin是一种主要