基于约束的图核方法的研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:jialifish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的机器学习、数据挖掘算法是基于向量型数据提出的。由于结构化数据在现实应用中广泛存在,图形数据的表示和分析正得到越来越广泛的关注。由于图数据结构的复杂性,不能仅用向量对其进行表达,这使得多数传统的学习算法不能应用于图形数据的分析。通过降维或向量空间嵌入的方式,对复杂的图形数据进行低维向量表示,在保留图的原有结构特征的同时,也扩大了传统算法对图形数据的适用性。另一方面,以往的研究主要集中在定义图数据间相似性度量(图核或图编辑距离)上,且利用了图中节点和边的标签信息。但作为标识图数据属于哪一类的类别信息较少被使用。成对约束,即标识两图是否属于同一类,作为一种半监督信息,由于其较类别标签更容易获取的特性,已经在机器学习的很多领域得到了成功的应用。因此,本文对成对约束信息在图形数据中的应用进行研究,提出基于图数据分析的新的算法,并进一步对约束集的选取进行改进,提高算法性能。主要的创新和研究工作总结如下:(1)对图核诱导的高维特征空间中的数据进行降维,使得传统算法能够对图数据对应的低维向量进行分析。进一步将成对约束信息加入到降维过程,得到基于图核的半监督降维算法(GK-SSDR),使低维向量表达更有助于图的分类。在标准图数据集上验证了上述算法的有效性。(2)利用负约束对标识两图不属于同一类的特性,提出了将图形数据改写成向量形式的图约束嵌入算法(GCE)。GCE既保留了图的判别信息,使向量表达更利于分类,又使传统学习算法能应用于图数据分析。通过与传统核方法、相关嵌入算法、及GK-SSDR算法的比较显示了GCE算法的性能。(3)针对GK-SSDR和GCE的性能易受约束集具体组成影响的缺点,将集成的思想应用到约束集的选取上,形成约束集成算法(CE)。通过在标准图数据集上的比较,对GK-SSDR和GCE在约束集的选取上使用CE算法,有效提高了其算法性能。
其他文献
近年来,在多维关联规则中,主要是研究关联规则的正规则问题。对于多维负关联规则的研究相对较少。这种情况存在下,多维负关联规则的挖掘算法就显得尤为重要。虽然已经奠定了
公钥密码的出现促使了数字签名技术的产生,数字签名技术在现代盛行的网络电子交易中发挥着不可替代的重要作用。以RSA公钥密码为基础的数字签名技术在网络身份认证中扮演着重
随着互联网的高速发展,网络技术得到不断提高,攻击手段和攻击方法变得更为复杂,各种类型的攻击事件层出不穷。现有的安全措施无法保障网络系统的安全、可靠与正常的运行。为
碰撞检测问题在计算机图形学、机器人路径规划、虚拟装配、计算机动画等领域有很长的研究历史。目前,已经成为虚拟现实技术研究的一个热点。虚拟环境的真实性和沉浸性,不仅需
移动传感器网络是由小微型、低功耗传感器节点组成的,能够感知和处理被监测范围的数据信息,通过节点的无线通信功能上传采集到的数据信息。其网络中的传感节点都具有移动性,能够
基于CT图像的CAD(计算机辅助诊断)技术是目前世界上一种先进的医学影像诊断检查的临床应用技术,该技术通过对计算机图像处理技术来高效识别CT图像中的可疑病灶。CAD技术能够提高
随着人民生活水平的提高,“健康”和“疾病”成为人民关注的焦点,运用计算机技术进行疾病分析预测也成为健康医疗领域的研究热点之一。呼吸系统疾病是一类常见疾病,而且和气
随着多媒体技术、计算机技术的迅速发展,多媒体数据已经成为重要的信息资源,人们每天都可以通过互联网接触到大量的多媒体信息,如视频、图像、各类新闻等。网络新闻作为一种
海量科学数据的到来使领域科学家面临前所未有的科学数据管理困境。一方面,传统以表为数据模型的关系型数据库管理系统已经不能满足科学领域大规模科学数据的管理需求;另一方
随着通信技术的飞速发展,当今网络正在向着可以提供包括海量数据传输、音视频等各种高带宽服务的下一代网络发展。这种发展趋势对整体网络设施的网络包的处理能力与处理速度