基于增量学习的网络多媒体资源发现技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ok8000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Internet应用的普及和飞速增长,网络提供的服务呈现多样化的趋势。很多用户要求可以在线欣赏音视频文件,使得提供音视频文件的网站迅速崛起。特别是近两年来,一些以Web2.0形式出现的由用户上传音视频的站点迅速发展壮大,如国外的Myspace、YouTube等,国内的六房网、土豆网、56网等。伴随着这类网站的成长,如何有效的发现这些网站提供的音视频文件成为迫切需要解决的问题。  本文从分析Web多媒体资源的特点入手,结合已经比较成熟的主题爬虫的思想,从多媒体资源相关度的角度来发现Web上散布的多媒体资源。本文主要围绕增量学习模型、多媒体资源发现知识库以及多媒体资源页面相关度算法三个方面进行了深入细致的探讨和研究,主要内容和成果可归纳为以下几点:  1.本文针对Web上多媒体资源的多种特征,提出了一种Web多媒体资源发现知识库。该知识库中包含了静态多媒体资源知识以及动态的多媒体资源知识,普通的多媒体资源发现系统采用的就是静态多媒体资源知识,而动态的知识是随着爬行的不断深入而不断变化的,实验表明了具有动态多媒体资源知识的系统具有更好的性能和效率。  2.本文在研究了现有主题爬虫的基础上,结合多媒体资源的具体特征,提出了一种基于增量学习的多媒体资源发现模型。该模型较好的将增量学习引入到多媒体资源发现的过程中,通过一个正反例生成器来对Web资源进行判断,进而生成的正反例提供给多媒体资源评价器和超链接评价器进行学习。提高了整个系统对多媒体资源的敏感性,使得系统可以更快更准的发现多媒体资源。  3.本文提出了一种多媒体资源页面评价算法,该算法综合考虑了页面内容信息以及超链接结构信息,将两者结合起来,避免了传统页面评价算法的缺点。  4.在上述研究的基础上,设计并实现了一个基于增量学习的多媒体资源发现系统,系统具有一定的可扩展性,在监控系统、Web多媒体资源统计中具有良好的应用前景。
其他文献
无线传感器网络是由具有感知、数据处理和短距离通信功能的传感器节点组成,在军事、民用和科学研究领域具有广阔的应用前景。数据发布(Data Dissemination)是传感器网络的一
人员定位技术由于其在生产生活中广泛的应用需求,且具有重大的社会意义和经济意义,其研究得到了学术界和工业界的大量关注。人员定位技术在医疗、采矿、物流等多个行业,公共安全
随着经济全球化和知识经济时代的到来,以及全球制造的出现,供应链在制造业管理中得到普遍的应用,相应的,供应链管理也越来越受到人们重视。为了更好的实施供应链管理技术,研
随着GPS全球定位系统的民用化和GPRS无线通信网络的发展,以及嵌入式技术的迅猛发展,使得利用这些技术开发汽车报警系统成为可能,而且这也是一种发展趋势。这类报警系统具有定位
本文通过对8051体系结构、系统时序、指令集的仔细分析与研究,提出了一个优化的并且完全兼容8051指令集的新体系结构的设计方法,在这个体系中,大部分指令的工作周期都被缩短,基本
卫星的设计寿命必须要大于卫星在轨工作寿命。但是,如果两者相差很多的话,就会造成资源上极大的浪费,所以如何尽可能的使设计寿命接近在轨工作寿命就成为一个重要的课题,而其
在我国,肺癌的发病率在城市已居肿瘤死亡率首位。在肿瘤的早期阶段就进行检测与治疗是提高肺癌病人生存率的主要的也是关键的方法。随着计算机软、硬件技术的发展,借助计算机进
随着数字化校园建设的逐步完善和发展,各种基于校园网的应用系统风起云涌。它们独立认证的弊端使得校园网络集中管理难以实现,因此,建立一个统一身份认证系统,对网络用户实行统一
冲击地压灾害是煤矿安全生产领域最严重的动力灾害之一,冲击地压监测预警技术则是目前国际采矿工程和岩石力学界迫切需要研究解决的科学难题。本文结合国家科技支撑计划课题“
用于感兴趣区域图像编码的人脸特征检测和分析是感兴趣区域图像编码的重要前提,只有准确地定位和检测人脸感兴趣区域特征,才能为感兴趣区域图像编码提供有效的编码区域。目前