GIS可视化互联网新闻搜索引擎的研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hfxwh6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet/Intranet的迅速发展,基于WWW的网上信息的收集、发布和相关的信息处理日益成为人们关注的焦点。面对着网络上信息数量和种类的高速增长,人们在运用网络获取信息时遇到了一些无法避免的困难。其中最大的问题之一就是由于网上信息的多样性和多变性而导致了一方面信息过度膨胀而另一方面用户却找不到所需要的信息。如何在Internet环境下对各种信息进行收集、分析及评价并提供高效的检索服务,并提供直观的可视化效果成为目前计算机研究领域的一个热点。本文提出了一种结合空间信息的互联网新闻挖掘原理和方法,并将它运用到一种创新用户体验的“GIS可视化的互联网新闻搜索引擎”的设计和实现中,取得了良好的效果。在分析互联网新闻信息的特点的基础上建立了一种互联网新闻信息空间位置的关联属性模型;然后本文在上述原理的基础上建立了一种结合地理信息的Web信息挖掘方法,并详细叙述了数据源的选取、信息模型的建立以及地理信息关联属性的挖掘分析方法。然后选取真实数据进行测试,通过将模型和算法计算的结果与人工分析所得的结果进行比较,本文所建立的方法的正确率为91.9% ,证实了所提出的理论的有效性和可行性。随后本文详细描述了如何将上述模型和方法应用到“GIS可视化的互联网新闻搜索引擎”的设计和实现中,着重介绍了该搜索引擎的体系结构,各个组成部分的设计和实现方法,包括:自定义的互联网蜘蛛程序以及适应本搜索引擎的Spider搜索下载策略,蜘蛛程序的初始站点的模型和选择策略,基于正则表达式建立的抽取模式的信息抽取方法和实现;地理关键词表的数据来源和建立方法;属性地理分析算法的实现,并提出了优化改进方案,使算法的时间复杂度由三次方提高到接近线性;介绍了Virtual Earth平台的Web GIS可视化引擎,基于该平台的新闻搜索引擎服务器端与客户端的构架和实现。最后本文总结了文章中提出的方法和技术的创新点,指出其中的不足以及下一步需要做的工作,最后对其应用前景和领域做了分析和展望。
其他文献
随着风能在电网中的渗透率的提高,各国电网运营商纷纷制定了风电并网导则,以提高电力系统的稳定性。其中,最为严苛的当属低电压穿越(Low-voltage ride through,LVRT)要求,即:当电网
互联电力系统规模不断扩大,电网关联强度不断提升,带来利益的同时,也带来复杂性。其中,短路电流水平的提升,使抵御电网故障时的设备性能面临考验,也制约电网的发展,因此,对电网运行如何权衡正常运行方式与故障方式间的折中就显得尤为重要。电网限流措施无非是靠运行方式改变或更新设备(包括限流设备)两种方式来进行,既然电力系统是人造的,合理的网架设计、合理运行方式确定以避免设备升级应该是前提。然而,短路电流大小
目前的混合动力系统中,最成熟的是基于行星齿轮的电控无级变速系统。然而该系统的核心部件行星齿轮是纯机械式结构,不可避免地存在振动、噪声、磨损等问题。为解决上述问题,
Grid GIS 是地理信息系统发展必由之路,随着Grid GIS 技术发展成熟,最终将纳入SIG 的统一框架之下。Grid GIS 采用网格技术的OGSA 框架,为空间信息服务提供了新的实现模式。