树形结构数据的向量化表示方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zixialang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断推进和发展,网络数据规模日益扩大。数据的组织形式依据不同的应用场景具有多样性。而树形结构作为一种有效的数据组织方式,能够体现数据的层次关系,有利于层次间信息的相互补充及异构信息的融合。以传统的文本处理为例,对于一本书的处理,传统的解决方案多依据“词袋”模型,但这种方式忽略了由书自身的逻辑特征所决定的层次结构信息,而树形结构能够有效的表示数据的层次结构关系。因此,对于树形结构数据向量化表示的研究具有重要的意义。对于树形结构数据的向量化表示方法,尚未有针对性的研究。在已有的较为相关的工作中,主要是进行树形结构底层信息的低维度映射,从而实现信息的融合,但并未考虑树形结构数据的层次结构特征。因此,针对于树形结构数据,本研究考虑到树形结构数据的结构特征,逐层提取树形结构数据的各层次信息,并自底向上进行逐层的信息融合,最终获得统一结构的向量表示,进一步将形成的向量应用于分类或聚类。本研究提出一种有效的树形结构数据向量化表示框架,该框架可分为两个阶段,即树形结构的表示及层次信息的融合。而层次信息的融合作为树形结构数据向量化表示的主要阶段,根据该阶段所处理的数据差异可分为两类,即对于由同构数据形成的树形结构的向量化表示,及对于由异构数据形成的树形结构的向量化表示。对于由同构数据组织形成的树形结构,即树中子节点的信息完全继承于其父节点,本研究基于稀疏编码的原理设计了两种局部重构模型,使用孩子节点的信息对其父节点信息进行重构,从而获取隐藏在树形结构中的层次信息,增强数据的向量表示。而对于由异构数据组织形成的树形结构,即不同层次的节点所表达的信息来源于不同的域,本研究通过聚类算法对各层次节点进行聚类,即对来自于同一个域的数据进行聚类,获取各层次节点的全局信息,实现层次节点信息的位置映射。且上述层次信息融合过程自底向上,从而获得统一的向量表示。进一步地,将本研究所提出的方法应用于电子书推荐、作者推荐及图像检索中,并分别与多种算法进行了对比实验,验证了该框架的有效性。
其他文献
无线传感器网络作为一门由多学科融合的新兴技术,近年来被广泛应用在医疗监护、目标跟踪、环境监测及军事侦察等领域。在大规模无线传感器网络应用中,通常由飞机随机向监测区
随着移动通信的迅速发展,多媒体需求日益增多,为了高效传输多媒体业务,3GPP在R6中引入了多媒体广播多播业务(MBMS)。为了满足人们对多媒体应用多样化的需求,3GPP在R8中定义了
近年来,太阳能已成为全球重要的新能源之一。随着分布式电源并网规模的增加,让电网调度变得困难,电力系统的稳定性下降,预测准确性及分布式光伏电源的准确选址定容是解决光伏发电并网问题、保证电力系统稳定性的前提。由于光伏发电功率受季节变换、昼夜交替以及各种天气因素影响,给电力部门制定调度计划带来困难。所以,文中对短期光伏功率预测和分布式光伏电源并网问题深入研究,具体研究如下:(1)为了降低短期光伏功率预测
异构网络是5G移动通信系统的主要组网形态,其灵活的网络部署特性、良好的覆盖能力、以及高效的能量和频谱利用率,是实现5G系统“信息随之,触手可及”美好愿景的重要支撑。然
作为一种高效的数据处理技术,压缩感知已经成为图像处理、机器学习及模式识别等领域的热门研究方向。其关键问题之一是信号的重构。然而,传统基于单字典的压缩感知重构算法,
城市供水系统作为城市的重要基础设施,是保障人民生活和发展经济建设的物质基础。供水管网系统作为城市供水系统的重要组成部分,在随着城市规模的扩大和人们生活水平的提升的过程中,也面临着极大的挑战。本文以某市供水系统为依托,通过对某市供水现状进行分析,得出某市供水管网系统压力过高时会促使供水管网的漏损现象更为严重,导致了水资源的浪费,供水压力不足会造成用水端用水量较小,居民的工业生产的用水需求受到影响。鉴
随着泰国近十年发生很多情况,无论是国内的政治冲突问题,还是国外全球经济衰退的影响和自然灾害,都可以看到泰国近十年的各方面的变化,但是它有怎么变化,哪些方面有发展哪些
现有研究发现,社会情感财富(SEW)即家族的非经济目标是影响家族企业行为决策的重要因素,并常与金融财富(FW)即经济目标间存在此消彼长的关系。如家族企业IPO过程中,尽管因家
1994年的分税制改革增加了地方政府的财政支出,地方政府债务开始对地方经济发展产生深远影响。现阶段国外关于政府债务对经济增长的影响形成了丰富的研究成果。但各国在政治
近年来,随着无线通信技术的快速发展以及移动通信设备(智能手机、PDA等)的大量普及,人们利用蓝牙、WiFi等短距离无线通信接口通过自组织的方式完成彼此之间数据的传输和信息