链接数据中对象的类型预测

来源 :东南大学 | 被引量 : 1次 | 上传用户:kms2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在链接数据中,对象的类型信息对于链接数据的挖掘与利用具有非常重要的价值。然而对象类型缺失问题在链接数据中普遍存在。如何确定对象缺失的类型成为数据科学领域亟待解决的问题。传统的类型推理的研究能够通过逻辑推理找到缺失类型对象的类型信息,但链接数据概念层和实例层中的噪音会在类型推断过程中引发错误的传播,从而使得类型推断失效。基于机器学习的类型预测方法目前正在得到研究者的关注。由于链接数据中存在大量的文本信息和链接关系,本文提出了基于文本的类型预测方法和基于链接关系的类型预测方法。在基于文本的类型预测方法中,本文提出了对象图和类型虚拟文档这两个概念。对象图模型将多模式的RDF图简化为单模式图,对预测过程中的信息抽取和分类算法更为友好。类型虚拟文档由对象图中进行文本抽取所得,包含了对对象类型具有指示性的文本信息。一个对象的类型虚拟文档由多个子文档构成。按照每个子文档对类型的指示性,本文提出了四种不同的子文档权重分配策略。在基于链接关系的类型预测方法中,本文以协同分类方法中经典的ICA算法为基础,提出了面向数据属性和面向对象属性的类型预测方法,并比较了数据属性和对象属性对于类型预测的指示性。最终,在多个数据集上开展的实验验证了本文方法的有效性。基于文本和基于链接的类型预测方法在精度、召回率和F值上均取得了较好的结果。实验结果显示本文提出的类型预测方法在大规模链接数据中能够有效地找出对象缺失的类型。
其他文献
种质资源专家系统知识库建设已经提升到国家农业战略地位,研究、开发和应用专家系统知识库无疑是领域知识库重要的发展方向。高寒、干旱地区蚕豆种质资源选择是农民最为困难的事,以此问题为导向,参与了农科院豆类作物研究所优质蚕豆种质资源实地种植试验,按国际标准指标采集了各类蚕豆种质资源的生长数据,完成了规范化描述、标准化整理和数字化表达,建立了统一规范的蚕豆种质资源数据库。按照蚕豆种质资源数据质量控制规范,聚
随着无线通信技术和移动互联网的高速发展,用户对于高速率、高质量的无线通信业务的需求以惊人的速度猛增。但现有蜂窝移动通信系统已经无法满足用户的要求。因此,为用户的语
随着微电子科技的不断发展,无线传感器网络(WSN)在军事、医疗、农业和工业等各个方面都得到了广泛的应用。WSN中的传感器节点利用能源有限的电池进行供电,这大大限制了 WSN的
学位
关键词拍卖作为近十几年发展起来的一种重要的广告服务形式,是Google、Bing、百度等互联网企业主要的盈利模式。学者们大多从关键词拍卖的均衡分析、关键词拍卖的机制设计、
随着网络技术的飞速发展,互联网成为人们获取新闻信息的重要渠道。然而,互联网中新闻信息杂乱无序、关联不足、碎片化特征明显,导致人们无法深入地了解新闻事件,对事件的认识
我国的产业地产在最近的二十多年里经历了巨大的发展。其相对传统地产而言,最大的挑战是开发回报周期较长,开发前期和中期需要大量的资金投入。因此,寻找合理的融资模式对于
目前,Internet所提供的服务从最初的通信到现在流行的信息载体,涉及的业务范围越来越广,无论是浏览新闻还是商品交易,大都是通过互联网来完成,网络承载了十分庞大的用户信息
人脸检测属于目标检测算法,是指在图像中检测出人脸位置并给出其坐标,人脸矫正属于关键点检测算法,是指在人脸图像上标定出人脸局部关键点坐标。通过人脸检测与矫正技术,可以
入侵检测技术是网络安全的一个重要环节,无论是哪种网络安全的需求,发现当前网络中出现的入侵行为是十分重要的,这些是制定实施安全策略的前提,因此高效的入侵检测技术是必不