工业物联网时间序列相似性检索技术研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:stoudemire21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业物联网、大数据和人工智能技术的不断发展,传统工业开始向数字化转型和智能化升级,产生了大量数据。基于数据分析完成的智能决策在故障诊断、设备预测性维护等场景中发挥着重要作用。时间序列数据是工业物联网中非常重要的数据类型,时间序列相似性检索是众多分析任务的基础。然而,不同相似性检索场景中的可用信息(如领域知识和语义标注数据)存在较大差别。如何在不同场景下,利用给定的可用信息完成时间序列相似性检索任务,成为工业实践中面临的挑战。本文围绕工业物联网时间序列相似性检索展开研究,针对不同相似性检索场景中面临的挑战给出解决方案。本文主要创新点如下:·在拥有领域知识的场景中,针对传统单一阈值检索模式无法精确描述多阶段工况的问题,围绕子序列检索问题展开研究。总结了具有多分段、多阈值的复合模式描述方法,并提出了等长数据块特征以及相应的子序列索引。在保证对复合模式精确检索的前提下,显著降低了检索过程的计算复杂度;·在没有领域知识、但拥有语义标注数据的场景中,针对传统的数据无关距离度量无法有效刻画工况数据相似性的问题,围绕全序列检索问题展开研究。提出了基于最大间隔的汉明哈希索引。通过引入少量工况相似度标签辅助训练,提升了模型对工况数据间语义相似性的刻画能力。通过引入最大间隔概念和半批次优化方法,提升了模型对工业数据相似度标签不平衡、质量低等情况的容忍性,对工业时序数据语义相似性的刻画显著优于传统距离方法;·在领域知识与语义标注数据均不足的场景中,需要依靠领域专家的经验展开探索式分析。针对传统相似性检索技术无法兼顾响应时间约束与高查全率需求的问题,围绕全序列检索问题展开研究。以树形索引为研究对象,提出了基于神经网络和基于量化的两种优化方法。通过优化数据访问策略,显著提升了树形索引在响应时间约束下的查全率;·针对面向相似性检索的索引技术在时序数据库管理系统中集成不足的问题,依托工业物联网数据库管理系统Apache Io TDB,设计实现了可拓展的相似性索引机制,为Io TDB添加了子序列和全序列相似性检索功能,也为更多相似性索引技术与时序数据库管理系统的集成提供了平台。
其他文献
目的:皮肤T细胞淋巴瘤在临床表现与病理特征上,与许多炎症性皮肤病相似,因此较难早期诊断。现今对皮肤T细胞淋巴瘤的预后仍缺乏可靠的分子标记物。方法:本研究共纳入2005年至2013年我院皮肤科科淋巴瘤门诊诊治的皮肤淋巴瘤患者158例和炎症性皮肤病70例,应用Affeymetrix和Agilent测序平台分析了两种疾病中不同表达的miRNA。并在训练集患者中用rt-PCR测量各个候选miRNA的表达量
目的探讨新型钙磷涂层镁锌钆合金(Ca-P-Mg)以及circ RNA-vgll3基因修饰的脂肪间充质干细胞(ADSCs)复合磷酸钙骨水泥(CPCs)构建的组织工程支架修复眼眶骨/骨缺损的作用及机制,为其在眼眶外科领域的应用提供理论基础。方法1.通过Tunel染色、q PCR等评估Ca-P-Mg对骨髓间充质干细胞(BMSCs)的细胞相容性和成骨诱导性。Ca-P-Mg用于犬眼眶标准骨缺损的修复,术后行
光栅投影三维测量技术因其具有非接触、无损、高效率、高分辨率、全场测量等特点,在产品设计与制造、产品检测与质量控制、医学工程、虚拟现实、智能安防等行业都有很大的应用发展潜力,已成为三维测量领域近年来的一个研究热点。典型的基于数字光栅投影的结构光三维测量系统由一个数字摄像机(相机)和一个数字投影仪组成。目前,现有研究工作主要围绕数字光栅投影三维测量系统实现中的相位-三维坐标映射关系建立、绝对相位获取、
背景:环状RNA(circular RNA,circRNA)是一类具有闭合环状结构的非编码RNA(non-codingRNA,ncRNA),在真核生物中有着丰富的表达,其生成机制、生物学作用以及与疾病的关系成为近几年研究的热点。circRNA主要产生于外显子的反向剪接,并且会与线性RNA的形成起到相互竞争的关系。目前研究显示,circRNA在调控miRNA表达、基因转录以及蛋白质翻译等多个生物学过
目的:在肺癌分子靶向治疗中,通过抑制癌基因诱导肺癌细胞死亡信号通路的激活是影响治疗效果的关键因素,在以往的研究中细胞凋亡被认为是最主要的程序性细胞死亡方式。但是,对于那些细胞凋亡的诱导或执行存在缺陷的肿瘤细胞,靶向治疗就会失效,然而其它由靶向药物诱导的程序性死亡方式还没有被系统地研究。本项目聚焦靶向药物诱导肺癌细胞焦亡,研究其作用机制,探索细胞焦亡和细胞凋亡之间的相互作用以及二者的共存性,揭示细胞
研究背景和目的:急性髓系细胞白血病(AML)是一种能发生在各个年龄段具有高异质性和高死亡率的造血干细胞恶性克隆性疾病,AML的发生发展和特定基因与染色体表达异常相关。EVI-1基因位于人类染色体3q26.2,编码的EVI-1蛋白为核转录因子蛋白。EVI-1蛋白作为人类血液系统肿瘤和部分实体瘤的重要调控因子也参与哺乳动物的胚胎发育过程。多项研究表明在大约8%AML患者体内存在EVI-1基因过表达,且
第一部分原发性胆汁性胆管炎患者的肠道菌群改变目的:明确原发性胆汁性胆管炎(PBC)患者肠道菌群结构和功能的改变,研究熊去氧胆酸(UDCA)治疗对PBC患者肠道菌群的影响。方法:收集PBC患者和健康对照的粪便标本,提取细菌DNA,通过16s r RNA测序分析肠道菌群组成。在横断面研究中,共纳入79例未接受过UDCA标准治疗的PBC患者(称之为治疗前PBC患者)和114例健康对照,并按照入组时间将其
随着电力行业的稳步发展,直流电缆运行的电压等级也随之上升。然而由于直流电缆在制作、运输、安装、运行过程中容易发生碰撞等,从而在电缆中形成缺陷,任何微小缺陷经过在较高的直流运行电压下的发展,会损害直流电缆的绝缘情况,甚至造成停电事故,因此微小缺陷对于直流电缆系统的安全稳定运行是非常大的威胁。局部放电可以很大程度反映出电缆设备的绝缘状态,因此研究局放信号的特征提取和缺陷识别的方法具有十分重要的意义。通
计算机技术迅速发展的今天,机器学习在许多领域已经取得了非常优秀的性能表现。虽然新的机器学习算法层出不穷,性能也逐步提升,但是机器学习的成功更多地是依赖大量的高质量标注数据。可是在许多专业的领域,数据或标注样本数据稀少,而数据标注不仅枯燥乏味、消耗时间,还需要大量具有专业领域知识的人力资源,如何在少样本场景下进行深度学习通常不是一项容易的任务。元学习的出现为上述问题的解决寻找新的突破口。元学习希望训
研究目的釉丛蛋白1(Tuftelin1,Tuft1)是一种酸性蛋白,可能参与间充质干细胞及神经细胞的分化,其对乳腺癌及胰腺癌的生长具有促进作用。然而在甲状腺癌中的作用尚未见报。本实验将利用体内外环境探讨Tuft1在甲状腺癌发生发展中的作用机制。研究方法1、分析Tuft1在人甲状腺癌组织标本中的表达水平及与患者预后关系。(1)Western blot及Real-time PCR检测Tuft1在人甲状