基于数据空间的多维动态关联和事件发现研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ck198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在结构化、半结构化和非结构化的数据集合中发现数据之间的关联是数据空间的一个重要研究方向。已有的关联发现研究主要有两种方法:一种是使用Apriori算法发现符合某一关联规则的关联集合,它主要是在数据库这种结构化数据中挖掘不同项和属性之间的关系;另一种是基于语义,给定一组预先定义的关联,通过在非结构化的纯文本中分析描述这组关联的句子结构来获得统一的表达模式,再根据这些表达模式发现其他新的关联。因此,已有的关联发现研究不能发现预先无法定义的关联,而且仅仅基于一种数据结构,没有对不同数据结构的数据提供一种统一的关联发现方法。已有的动态事件发现方法大多是基于话题发现和跟踪技术提出的。话题发现就是用聚类的方法把讲述相同主题的新闻放在一起,然后将每一类看成一个话题。随着社交网络的兴起,有人提出了基于微博的事件发现方法,该方法以微博博文这种短文本为数据源,同样使用聚类的方式归类文本并形成事件。本文基于对传统的关联和事件发现方法详细的研究和总结,提出了一种基于数据空间的动态关联和事件发现方法。该方法以用户查询日志和新闻文档为数据源,使用用户日志发现基于时间窗口候选的关联实体,再为非结构化的新闻文档构建多维倒排索引,根据实体的索引项信息计算候选实体间的关联度,确定最终具有动态关联的实体,完成关联发现。在关联实体集合构成的EDR图基础上构建子图,每一个子图对应一个事件。本文提出了两个构建子图的算法分别为LTC和GTC。本文提出的动态关联的发现方法可以挖掘出预先无法定义和预测的关联,并且可以随着事件的演变实现关联的更新,然后在已经发现的关联实体的基础上构建事件。实验表明,该方法能够更加高效准确的发现关联实体和事件,并具有良好的性能。
其他文献
随着计算机技术,特别是网络技术的迅速发展和普及,人们越来越迫切地希望用自然语言与计算机交流。因此自然语言信息处理得到了前所未有的重视,受到了国内外许多研究者的关注
随着移动互联网的日新月异,智能手机也渗入人们工作与生活的方方面面。由于用户对智能手机依赖性的日益增强,越来越多的用户隐私数据存放在手机当中。因为用户的隐私信息关系
随着信息技术的迅猛发展和信息资源的不断膨胀,电子商务也随之蓬勃发展,推荐系统被越来越广泛地应用于电子商务的网站中。推荐系统是电子商务个性化服务的重要组成部分,它打
无线射频识别技术(Radio Frequency Identification,RFID)是八十年代兴起的一项技术,是通过无线电的方式对目标进行识别,具有无接触、抗干扰能力强、可同时识别多个目标和可
近几年DDoS攻击的危害越来越明显,DDoS攻击直接对经济、军事、国土安全等方面造成巨大影响。作为现代互联网中重要的防护屏障,防火墙在保护网络的安全性方面起着不可估量的作
本论文的主要工作是研究复杂背景下弱小目标的先跟踪后检测算法。主要研究对象是视觉场景中的运动小目标。首先,针对复杂多变的背景,提出了基于帧间差分和背景建模的背景处理
计算机网络系统中的各个设备都会产生日志来记录自身行为或相关的网络事件,对于维护系统状况、监视系统活动及维护系统安全至关重要,是反映网络安全状况的重要数据源之一。如
近年来,移动Adhoc网络(MANET)已有广泛的应用。移动自组网是在没有中心基础设施情况下由一些移动用户自组织形成的临时性多跳无线移动网络。由于自组织网络中的节点依赖于电池
目前,由于Internet技术的迅速发展,Web应用的范围越来越广泛。但是,在现有的Web应用系统中,普遍存在着程序可重用程度低、维护工作繁琐、应变能力薄弱等不足。随着Web应用的
作为复杂网络的一种,社会网络的应用变得越来越普及。社会网络中的链接预测是最近几年社会网络分析的一个引人注目的研究热点。链接预测的目的旨在寻找那些实际存在,但是由于