Deep Web模式匹配技术研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhiyin1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web上的大量信息只能通过查询接口获得,这些资源被认为是Deep Web资源。对于不同兴趣领域,不同的查询接口有着各自迥异的查询能力和内容覆盖率。因此,用户需要频繁的访问不同的资源接口以获得想要的信息,这是非常耗时的。为了处理这个问题,一种有效的解决方法是在这些查询接口之上建立一个集成的全局接口,提供给用户一个统一的访问途径。模式匹配是集成的前提条件。本文首先对Deep Web模式匹配技术进行深入地分析和研究,借鉴已有技术提出了一种新的模式匹配方法,然后依据匹配结果实现Deep Web接口集成。最后提出了一个面向Deep Web对象的查询接口集成原型系统的设计。本文主要研究的工作包括:(1)首先介绍Deep Web相关知识和国内外研究状况,然后阐述模式匹配的概念和原理,对传统模式匹配技术和当前主要的模式匹配技术进行比较分析。(2)进行Deep Web模式匹配的研究,本文提出了一种基于数据挖掘技术的整体性模式匹配方法(Correlated-clustering),该方法主要利用正相关关联挖掘发现潜在属性组,并利用聚类思想对同义属性进行挖掘。(3)利用模式匹配的结果,同时结合数据域类型和值域范围,构造并生成Deep Web主题领域全局模式,提供给用户集成统一的查询接口。(4)根据上述研究,最后设计了一个面向Deep Web对象的查询接口集成系统。本文还对文中提出的方法和技术进行了实验验证,通过对实验结果的分析进一步说明了本文提出的技术方法是行之有效的。
其他文献
数据挖掘是当前国际学术界一项前沿的研究课题,它融合了数据库、人工智能、机器学习、统计学、智能计算、认知科学等多个领域的知识,是数据库研究中很有应用价值的一个新方向
2012年12月13日,我国的月球探测器嫦娥二号在距地球约700万公里的深空,以10.73km/s的速度770m的最近距离成功飞掠4179小行星Toutatis,获得了最高分辨率优于3m的系列可见光图
碎片复原技术是计算机视觉、图像分析和模式识别等领域中的重要研究课题,它开辟了模式识别新的应用领域,具有广泛的实用价值,一直为国内外学者所关注。本文在研究传统角点提
字符串相似性搜索在众多的领域具有广泛的应用,例如:数据清洗、数据集成、拼写检查、抄袭检测、生物序列分析等。到目前为止,有很多度量标准用来衡量字符串之间的相似程度,然
中间件是一种独立的系统软件或服务程序,能够屏蔽网络硬件平台的差异性和操作系统与网络协议的异构性,使得分布式应用软件得以在不同的技术之间共享资源。当前,面向对象分布
随着用户越来越倾向于输入自然语言作为查询,问句理解成为了问答系统等领域中的研究重点之一。然而现有问答系统技术对复合事实型问句的处理效果并不完美,不能很好地理解用户
随着信息时代的发展,单一形式的媒体传播不再满足受众的需求,跨媒体信息传播这种新兴的传播形式随之应运而生,那么,跨媒体热点信息如何获取,该类信息在传播过程中存在哪些特
随着信息技术的发展,作为传统实验教学的一种有效补充,虚拟实验教学已成为加强实践教学、提高教学质量的重要手段。在计算机学科硬件课程的虚拟实验系统中,随着实验规模的扩
在临床诊断治疗中,往往要求对病人的病变部位进行多次成像,以获取互补、有效、全面的信息,提高医生的诊断治疗效果,这就需要进行医学图像的信息融合,把多幅图像的信息融合在
随着互联网的迅速普及和广泛应用,Web上产生的信息也随之飞速增长,如何从浩瀚的资料中挖掘出有价值的信息,受到各方面的关注。Web网站无论是在访问量、规模上还是在网站设计