旅游网络资源监控系统的研究与实现

被引量 : 1次 | 上传用户:a443532159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前互联网上存在着种类繁多的旅游资源,旅游管理部门要对以上资源进行监控,同时游客也要检索出自己感兴趣的个性化信息,这需要花费大量的时间和精力。本论文对旅游网络资源监控系统进行了研究与实现。论文完成的主要工作如下:(1)提出和构建了一种主题采集算法,建立了起始URL、话题关键字和URL预测机制。该算法包含三个阶段:首次爬行阶段、学习阶段、连续爬行阶段。采用开放式分类目录搜索(ODP)进行相似度判断以及结果评价。实验结果表明随着爬行过程的连续执行,相关页面的搜集速度越来越快。(2)提出了基于文本密度的文本抽取TTR算法。该算法按行计算出文本标签比值,并采用阈值抽取算法区分出文本区域和非文本区域。实验结果表明TTR算法能从种类繁多的网页中成功抽取出文章的主体内容。(3)提出了改进的aRocchio算法用来计算个人特征矩阵,将改进的aRocchio算法与已有的Rocchio算法进行了比较。提出了混合特征匹配算法。采用基于评分的I-PageRank搜索排序算法进行排序。实验结果表明以上算法使系统的检索性能得到了较大提高。(4)实现了旅游网络资源监控系统,该系统包括主题采集子系统、文本抽取子系统、个性化检索子系统。对各子系统的主要实现进行了详细说明,并对各个子系统进行了测试。本论文以旅游网络资源的监控为研究对象,建立了旅游网络资源监控系统,可为用户提供可定制的、全方位的、实时的旅游网络资源采集、抽取和检索服务,从而为旅游资源的监控和游客出行带来便利。
其他文献
我国是全球性的海工装备制造大国,但总体存在市场规模和国际标准主导权不匹配的情况。我国可借助部分海工装备的技术优势,及时固化技术成果,推动国内海工装备标准走出去,成为
当今中国教育改革的深入开展,对教学的方法与手段要求也日益严格,所以教学的方法和手段的改革也势在必行。语文这门学科由于本身的基础性和特殊性,势必应该走在教学方法与手
目的探讨直接测序法、单克隆基因测序法和高分辨率溶解曲线法在肺癌患者血浆循环DNA中EGFR突变检测的临床应用价值,并结合临床资料分析肺癌患者EGFR突变与临床病理特征之间的
新中国成立初期,为了从根本上废除旧社会遗留下来的娼妓制度,人民政府采取有力措施,封闭、取缔妓院,严厉惩处妓院的老板、领家和鸨母,并对妓女实行集中收容改造,从而在短短的几年时
比吸收率(SAR)的建模与测量用部分球形替代品对比吸收率(SAR)评估的研究用头部的部分模型可以有效地减少比吸收率(SAR)的计算量,从而减少复杂的运算和时间的消耗。研究了用少
近几十年来,我国国民经济高速的发展使我们对能源的需求也正在高速的增长,尤其在石油资源上,我国已经成为了继美国之后的世界上第二进口国。同时为了应对国际油价的波动和产
入世后,燃气行业也同样面临着一个很大的标准体系转型和健全的问题。由于燃气产品市场也越来越需要走向国际化,中国标准无疑要为国内产品的技术发展提供必须的依据和指导,所
采矿损失率和贫化率是地下采矿中两个重要的技术经济指标,由于其受众多因素影响,预先准确地估算比较困难。,传统的损失率和贫化率估算方法主要是通过与实际矿山指标进行类比
受产品价格和原料价格的限制,目前我国芒果浆加工产业所用原料芒果的病害较多,导致企业在芒果浆加工前处理时原料损失率较高。本文以芒果浆加工用的原料芒果为主要实验原料,
实验采用浓硫酸直接酯化法制备Vc棕榈酸酯,详细研究了静置反应时间,反应温度,棕榈酸与Vc的摩尔比,搅拌反应时间,硫酸加入量和硫酸浓度对收率的影响,采用正交设计实验法优化工艺条件