中文专业搜索引擎优化策略研究

被引量 : 0次 | 上传用户:edgesoft_h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web信息的急剧增长,使用户获得自己想要的信息资源变得越来越困难。用户所获得的信息往往不准确、不及时。这需要我们对搜索引擎做进一步研究。中文专业搜索引擎是搜索引擎发展的重要分支,它具有通用搜索引擎所不具有的优势。本文对中文专业搜索引擎做了大量研究,主要包含下面几个方面。(1)对主题网络蜘蛛的搜索策略进行了研究主题网络蜘蛛的搜索策略是中文专业搜索引擎的核心技术,其搜索策略的好坏严重制约着整个搜索引擎的性能。研究发现在众多搜索算法中Best-First算法非常适合针对某一领域信息进行搜索,并且它的性能也是以往搜索算法中最优的。但是它本身也存在着缺陷,具有很大的“贪婪性”,只能搜索到局部范围内的最优解,无法得到全局范围内的最优解。故以Best-First算法为基础,提出了BF-BF算法,该算法能够解决Best-First算法的不足,在全局范围内找到最优解。(2)对网页文档的分类与索引问题进行了研究网页文档的分类通常采用VSM模型。也就是将文档的内容表示成特征向量的形式。但是文档初始特征向量的特征项之间很难保持独立性,并且所形成的向量往往维数过高,增大了计算量,又没有实际意义。针对这种情况,提出了将文档的初始特征向量进行概念归一化处理,处理以后所得到的文档概念特征向量既降低了向量的维数,又保持了特征项之间的独立性。(3)针对检索模块的优化问题做了研究检索模块是搜索引擎和用户直接交互的部分,它的优化问题直接关系到搜索引擎的受欢迎程度。为了提高检索模块的性能提出了将系统知识库和用户信息库引入检索模块中,对检索过程加以指导,这样可以大大增加用户检索的准确度。
其他文献
本文主要研究了中国机动车辆保险费率的有关问题。对车辆保险费率的厘定原理、厘定制度、费率因子选取等问题进行了分析,得到了相应得研究结论,基于这些结论,作者提出了一些
目的分析探讨盐酸氨溴索辅助治疗新生儿肺炎的临床疗效。方法对2009年7月至2011年6月在我院治疗的76例新生儿肺炎患儿随机分为治疗组与对照组各38例,对照组采用氧气吸入、控
近日,为加强针对“不合理低价游”进行专项整治,国家旅游局做出了特别提示,希望游客防范欺诈陷阱,坚决抵制“不合理低价游”。游客若与经营者签订虚假合同,一方面需要承担法律责任
报纸
独立审计是资本市场发展的基础性制度之一。审计质量不仅决定着会计师事务所的生存和长远发展,对社会经济秩序也有着重大影响。审计质量取决于会计师事务所的独立性和专业胜
随着我国汽车工业的快速发展和机动车拥有量的快速增长,汽车尾气污染给城市环境带来巨大的影响,由此引起的氮氧化物型污染有可能代替煤烟型污染成为城市主要大气污染源.目前国内
药用辅料包括多种赋形剂与添加剂,是药物制剂的基础材料和重要的组成部分,在制剂成型的发展和生产中起着很重要的作用,它不仅赋予药物一定剂型用于临床,并且与提高药物的疗效,降低
中国电信业发展至今,不仅形成了各大运营商同台竞技的市场格局,而且从卖方市场转向买方市场,这决定了客户关系的大一统必然向细分化和个性化转变。因此,客户细分是电信企业营销的
个性化服务是一种能够满足用户个体需求的服务方式,通过研究用户的行为和习惯,对用户采取不同的服务策略。本体表示用户模型能够提供结构化的模型存储形式,帮助系统更好的发现用
总结本院收治的慢性肾功能衰竭(CRF)患者的心理问题和护理方法,包括随时与患者及其家属沟通交流,及时了解患者的心理问题,制定相关的护理措施,对患者进行健康教育和心理咨询,
本文以时间为线索,对先秦两汉时期文学中的女性心理进行了初步的考察。全文分五部分,包括绪论和正文四章。“绪论”回顾了以前学者对女性的研究现状,提出选题的缘由和意义,并对相