JAVA技术与人工智能在搜索引擎上的应用

来源 :五邑大学 | 被引量 : 0次 | 上传用户:xiawei0018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1990年12月25日Web上线,1993年3月15日图形浏览器诞生,人们由此开始彻底改变了网上查阅信息、获取资料的习惯,Web已经成为人们获取信息的一条重要途径。由于Web页面的日益增加,获取特定信息就成为一个难题,搜索引擎应运而生,并改变了人们获取网络信息的方式。 Java是由美国Sun公司(Sun Microsystems,Inc.)研发的计算机编程语言,其最大的特点是可移植性,它的出现引发了开源的浪潮,因此,Java世界有许多优秀的开源项目。本文在对Web搜索引擎工作原理和体系结构详细阐述的基础上,重点分析了Nutch这一优秀的Java开源分布式搜索引擎,并在此引擎上用BP神经网络改进了中文分词算法,使得该引擎在中文分词上有一定的人工智能。根据测试分析、比较,该分词算法在处理有语义歧义的句子上,分词效果要优于传统的机械分词算法。
其他文献
随着网络规模的不断扩大和网络应用的不断普及,当前的网络协议IPv4暴露出越来越多的在地址空间、网络安全等方面的缺点,威胁网络安全的方式和攻击网络的手段也越来越复杂,安
世界各国的高速公路运行管理经验表明,在所有不利气候条件中,大雾对高速公路运行所产生的危害最大。目前,在世界范围内降低或预防因大雾引发高速公路交通事故的方法主要有关
大规模、跨领域数据仓库的出现,使数据仓库中的数据量日益增多,数据模式日趋复杂,清洗过程设计更加繁琐。这些变化使数据清洗软件的开发出现了很多新的需求,如动态构建、频繁的修
条码技术是以计算机技术、光电传感技术和通信技术为基础而发展起来的一项自动识别技术。现在已经成为信息数据自动输入、识别的重要方法和手段。现代高新技术的发展,迫切要求
“报文”是互联网用IP协议进行传输的基本单位,也是被动测量“感知”网络的基本单位,因此被动测量所获得的原始信息是报文流,通常称为“IPTRACE”。早期相关的研究工作直接面向T
我国高校的信息化过程一般经历两个阶段,第一阶段:各业务部门独立地开发应用系统,这些应用系统在一定程度上提高了校园信息化程度。但是这些系统由于技术平台、开发环境的差异,彼
随着医学影像诊断技术的发展,大量的医学图像数据随之产生。通常意义上的胸部影像学的主要研究对象就是肺部,它一般通过建立肺窗来观察相应肺部影像,而计算机断层图像(CT)则
工作流管理技术是实现企业业务过程重组、过程管理与过程自动化的核心技术。作为工作流技术的软件载体,工作流管理系统WfMS(Workflow ManagementSystem)的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序执行,从而达到业务过程自动化的目的。目前的工作流管理系统在可适应性和灵活性方面还有很大的不足,本文针对Synchroflow工作流管理系统提
随着PDA等智能终端的不断普及和互联网的飞速发展,利用手机或PDA等智能终端浏览网页、上网购物越来越成为引领现代人生活的时代潮流,人们在充分享受着互联网所带来的方便和高
近年来,随着科学技术日新月异的发展,计算机向着高性能、微型化方向发展的速度也越来越快。半导体技术的提高和嵌入式技术的应用,使得传统意义上的计算机已缩小至板级、芯片