中英文WWW搜索引擎的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:sycloverock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文结合了系统论观点论述了一个中英文搜索引擎原型的实现.重点是进行中文信息小型化处理,其中包含中文的自动分词、词频统计、关键词提取等算法的研究.算法采用基于自动建立词库的最佳匹配方法来进行中文自动分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词出现的歧义问题,继而进行词频统计,实现关键词提取.该文首先介绍中文搜索引擎工作原理,然后详细地讨论系统的实现思想,最后对系统功能进行评价.
其他文献
每个孩子的妈妈都希望自己的孩子能健康成长,我的妈妈也不例外.rn一次,我在学校参加了拔河比赛,在争夺冠军的时候,一不小心我的腿受伤了,妈妈看见了心痛地说:“看把你摔成了
该文全面概述了常见的各种晶体生长方法,其中对浮区区熔法的理论、方法与应用作了详细介绍.在分析目前常规方法生长某些氧化物晶体时碰到的困难和问题的基础上,提出金属片加
该论文从几个方面对光纤孤子传输进行了理论和实验研究.第一章简要介绍了光纤孤子通信研究的意义,并回顾了光孤子通信研究的简单历史.第二章较详细地论述了光纤孤子传输的基
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
宇宙加速膨胀被证实以来,暗能量一直是宇宙学的研究热点之一。与此同时,随着宇宙学观测项目相继实施,观测数据大量积累,今天的宇宙学研究已经进入了“精确宇宙学时代”。作为最简
该文采用物理、化学方法制备了多种粉体纳米材料.创造出部分还原-共沉淀方法, 首次FeCl为初始材料制备了粒径极为均匀的3—15nm的球形FeO纳米颗粒,确定了制备纯相FeO的条件参
粒子物理的标准模型虽然取得了很大的成功,但是它也面临着一些问题.从实验观测的角度上来讲,标准模型中不包括暗物质,纯粹的标准模型中的中微子无法获得质量.从模型本身的角度来
该论文在充分调研国际、国内有关生物超微弱发光研究、光(声)动力学术研究的历史和进展的前提下,在动物组织超微弱发光的图象探测方面做了一部分开创性的工作,取得了一些非常
2012年7月欧洲大型强子对撞机LHC的两个实验组ATLAS和CMS同时宣布发现了一个新粒子。后来的分析表明,这非常可能是标准模型(SM)预言的Higgs boson。如果它确实是SM Higgs boso
该论文采用射频反应溅射的方法制备了不同Fe含量的几个系列的Fe-Al-O颗粒薄膜,每个系列的江膜样品由于制备时的氧分压不同而导致其微结构的差别,所以其TMR效应也有所不同.通