互联网络信息挖掘算法的研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:wangbadanwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会进步和互联网络的快速发展,Internet已经达到大约有80亿个网页和560亿个超链接的规模,并且随着时间推移,其网页的数量和超链接的规模将来会变得更加庞大。如何让这个庞大的互联网络更好地为人类服务,已成为世界关注的热点问题。一方面是人们希望能快速、准确而全面获取信息,另一方面却是互联网络上信息的纷繁芜杂,难于取舍。从早期的国内外对互联网络的使用情况来看,大多数仍停留于很初级的互联网络信息搜集的层次上,需要耗费大量的人力,手工进行网页分类,采用机械的关键词匹配等方法,缺乏知识处理能力和理解能力,缺少对网络信息的挖掘和利用,智能化程度很低。因此,为了提高互联网络的利用程度,对互联网络信息进行挖掘无疑成为当前的一个研究热点。 本文首先介绍了在互联网络信息挖掘研究领域的3大研究方向:互联网络结构挖掘、互联网络日志挖掘、互联网络內容挖掘,并选择本文研究的重点是互联网络结构挖掘。然后,着重回顾了互联网络结构挖掘领域的当前发展现状,详细阐述了该领域中最著名的两种挖掘算法:PageRank算法和HITS算法。并在此基础上,针对PageRank算法的一些不足,提出相应的改进算法: (1) 针对PageRank算法偏重旧网页,本文将网页的发布日期引
其他文献
  本文调研了一种图的数据挖掘的方法——Subdue系统使用的方法,该方法与我们的方法的目的都是挖掘子图结构,但是两者的思想是截然不同的。并且还对相关的数据挖掘知识做了详
  本文通过国际电子商务标准研究现状与趋势的分析,结合电子商务应用模式的发展,以构建第三方B2B电子商务平台为目标,研究和开发基于XML语言的电子商务技术标准集合——cnXML
近年来,随着计算机通信和网络技术的迅速发展,在交通管理、网络监控与安全、股票行情分析、电信数据管理、传感器网络查询等诸多领域产生了许多基于数据流的应用。因为这些应用
网格是近年来比较热门的一项技术,出现了如信息网格、资源网格、计算网格等诸多概念。网格建立在传统网络基础之上,但网格具有更开放、更可控的机制、因此可以对计算资源、存储
基于计算机的过程控制系统已经被广泛地应用,随着互联网技术的发展,互联网在控制领域表现出巨大的应用潜力。作为下一代控制系统的基础,基于互联网的过程控制系统的设计是控
主动激光视觉系统具有直接三维成像的特点,将其用于飞行器、汽车等移动装置完成避障、导航信息的获取,实现自动驾驶或辅助人工驾驶已引起人们的重视。论文中主要是针对主动激光
WWW 是一个开放性的全球分布式网络,网上的资源没有统一的结构和管理,导致了信息查找和使用的困难。网页的自动分类可以在较大程度上消除网上信息杂乱的现象,并方便用户准确
虽然在单机时代已经提出了并发性的概念,但在分布式系统日益广泛应用的今天,并发性的重要性无疑是更大了。然而,可靠而高效的并发软件比顺序程序更难以开发。并发软件的设计
当前,Web服务研究已经成为一个热点,相关的技术不断涌现,如:SOAP、WSDL、UDDI、XLANG、WSFL等。这些技术大大推动了web服务的发展,也不断提出新的挑战。目前用于开发web服务
随着纸张生产量的飞速提高,传统的靠人眼来对纸张质量进行逐一检测已经不能满足市场的需要,一种基于机器视觉的印钞质量在线检测系统就因应而生。在现代印钞造纸企业,要力争实现产品质量的提高和生产效率的提高。而实现这些目标的三大重要基础就是生产自动化、检测智能化与管理信息化。印钞质量在线检测系统将这三方面相结合,相比传统的人眼检测而言显示了机器视觉图像处理技术的优势。该系统能够对产品质量进行智能自动化检测和