Web数据挖掘和个性化搜索引擎研究

被引量 : 0次 | 上传用户:memeshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web已成为人们获取信息的一个重要途径,随着Web信息的日益增长,人们不得不花费大量的时间去搜索浏览自己需要的信息。搜索引擎随之成为人们最普遍使用的信息检索的工具。该工具涉及到信息检索、数据库、数据挖掘、人工智能、分布式处理、自然语言处理等多个领域的理论和技术,因而具有综合性和挑战性。但是,目前大多数的搜索引擎提供的服务还不能令用户满意,尤其是个性化的查询请求。因此,个性化搜索引擎成为当前的一个重要研究课题。 本文针对目前搜索引擎存在的不足,充分研究了个性化搜索引擎的发展现状,设计并实现了一种个性化搜索引擎,同时提出了一种查询语句优化策略,在此基础上,又对基于语义Web的搜索引擎进行了研究探索。 本文的主要工作如下: ● 对信息检索技术、搜索引擎的工作流程、发展历史、现状和存在问题进行了简要综述。 ● 对个性化搜索引擎相关技术—Web数据挖掘进行了研究。 ● 对个性化搜索引擎的研究现状进行了总结,并设计了个性化搜索引擎模型。 ● 提出了一种查询语句优化策略。 ● 对语义Web进行了简要综述,设计了一个基于语义Web的搜索引擎。 本文的研究与探索为进一步研究搜索引擎的个性化技术,开发高质量的网络检索工具提供了良好的开端。
其他文献
被誉为"侦探小说女王"的英国侦探小说家阿加莎·克里斯蒂以朴实无华的小说语言向世人展示了侦探小说的神奇和玄妙。会话是阿加莎·克里斯蒂侦探小说的基本要素,也是推动案情
从王琦瑶的处世方式和婚恋态度等方面来探讨其形象怎样体现上海精明实惠、功利缜密的弄堂文化,怎样用独特的女性视角来诠释上海弄堂的市民精神。阐释女性顽强的生存能力,延续
基于广州批发零售市场潮汕商人群体调查,发现以亲属和同乡联系为纽带形成的经营型移民聚集不是一个暂时性的、非正常的存在,它具有强大的社会经济潜力,为后来的移民提供了一
价值自信是指一个人或群体对自身的价值及所形成的价值观、价值观体系的充分肯定和高度评价,它以价值自省和价值认同为前提和基础,是形成价值自觉和外化为价值实践的精神动力
从容量化管理、减量化控制、无害化处理、资源化能源化利用、通过倡导生态农业与循环经济实现生态化发展等方面,阐述在遵循畜禽养殖业污染防治技术规范前提下,提倡畜禽养殖业的
军事与文化密不可分,战争的较量本质上是文化的较量,精神的较量。征服一个国家不仅要征服其军队和政权,更重要的是征服其文化。楚汉战争期间的“四面楚歌”以楚文化瓦解了楚
目的 比较免疫层析法(Immununochromatographic Test,ICT)、酶联免疫吸附法(Enzyme Linked Immunosorbent Assay,ELISA)和免疫斑点法(Dlot Immunobinding Assay,DIBA)检测登
SF6全封闭组合电器GIS(Gas Insulated Switchgear,简称:GIS)传统上采用电磁式电流、电压互感器来测量电流、电压信号,但由于电磁式电流/电压互感器的自身缺陷,已不能适应GIS发
根据目前开关电源的发展现状和发展方向,作者研究开发了一种通信系统常采用的48V/25A直流高频开关电源。本论文首先对高频开关电源主电路进行设计以及零电压软开关技术在移相
城市土地利用系统是自然—社会—经济的复合系统,城市土地可持续利用目标就是要达到环境效益、经济效益和社会效益的协调统一;从资源环境支撑性、经济可行性、社会可接受性等