网络资源搜索及获取关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lanbingxingshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的高速发展及互联网的快速普及,网络上的信息成指数级增长。因而也带来了迫切需要解决的问题:如何才能快速准确的搜索和获取到网络资源。在这种背景下搜索引擎技术和P2P技术得到迅速的发展,并成为如今最热门的技术之一。随着近几年来Google和百度等搜索引擎的巨大成功,以及P2P等下载技术的日益成熟,各式各样的网站及企业,都意识到需要加入自己独特的检索功能,以满足用户的不同需求,并提供一种快速的下载方式,在有限的带宽下,使用户能够快速的获取到所需要的资源。所以本文提出了一种搜索引擎及P2P技术的实现,以满足网站及企业定制符合自己特色的网络资源搜索和获取的需求。  网络搜索引擎的关键技术是网络爬虫的实现。网络爬虫又被称为网页蜘蛛或网络机器人,是一种可以按照一定的规则,进而自动搜索网页中所需要的信息的一种程序或者脚本。本论文设计了一种网络爬虫用于从网络上搜索Mp3文件。其主要分为页面分析,页面提取,链接存储,资源下载模块。页面分析模块负责解析并分析页面的DOM树文档结构;页面提取模块负责提取需要的链接;链接存储模块用于保存搜索到的链接,供爬虫下次搜索使用或用于下载模块;下载模块利用HTTP协议将需要的网络资源下载下来。  P2P技术是为了实现端对端的直接通信所提出的技术,被广泛用于资源分享中,可以显著提高资源分享速度。由于网络中存在的网络地址转换设备和防火墙的影响,需要利用P2P技术解决在NAT和防火墙设备里的机器之间的通信问题。本论文使用JXTA开源项目,设计了一个P2P的解决方案,用于穿越防火墙从而将通过搜索引擎搜索到的资源快速的分享给P2P网络中的其他节点。从而实现两个端点间通信和获取资源的问题。  本论文提出了一种个性化的搜索引擎的实现方案,以用于解决网络资源获取的难题。又分析了P2P技术的难点和关键技术,同时提出了一种基于JXTA的跨平台的P2P技术的实现方法,用于将搜索的资源分享给P2P网络上的其他节点。
其他文献
空天信息网络是一种包含了卫星通信系统、高空平台、各种飞行器以及地面固定网络、地面蜂窝网络等不同种类、不同特性通信系统的综合网络。  本文根据现有卫星通信系统所面
随着电子技术的不断发展,高速信号在各类电子产品中所占比例越来越高,对这些高速信号的测量在产品开发调试过程中经常是必需的,因而对测量工具提出了更高要求,高速数字存储示
随着多媒体技术和Internet的发展,数字水印技术作为保护多媒体数字信息安全的一种有效手段而成为研究的热点。图像数字水印是将作者信息或者其他版权信息,以图片、文字或数字
随着通信业务量的迅猛增大,未来通信对传输速率有着越来越高的要求。而MIMO-OFDM恰好满足传输速率高这一要求。正交频分复用(Orthogonal-Frequency-Division-Multiplexing, O
随着互联网不断发展、用户数量不断攀升和网络应用不断演化,网络研究机构需要开发新算法、新协议、新系统等,在开发过程综合评估是关键步骤。因此能够生成规模可变的、可调的
学位
近年来研究人员提出运用一种新型的时域混合调制(Time Domain Hybrid Modulation,TDHM)技术以达到光通道在调制效率和光传输距离间的最大灵活度。TDHM技术的高效性在端至端光
认知无线电作为一种新的无线电通信方式,被认为是解决频谱利用率低问题比较有力的方法。认知无线电本身具备感知和利用频谱空闲资源的无线通信技术。能够认知空闲频谱的使用
MIMO技术被认为是现代通信技术的重大突破,成为了无线通信的研究热点。最近,随着LTE对上下行速率的更高要求,MIMO技术讨论和MIMO信道仿真越来越受到关注。对MIMO信道建模及仿