用户参与的在线旅游网站信息本体构建研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:chongyou2025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  关键词:用户;在线旅游;网站信息;本体构建;马蜂窝
  随着经济以及旅游业的发展,旅游资源越来越丰富,外出旅游也成为人们的日常休闲活动。网络信息技术的不断进步和发展.让在线旅游获得了极大的进展.在线旅游网站也因此层出不穷,如人们常用的有马蜂窝旅游网、携程旅行网、途牛旅游网、去哪儿旅行网等。面对旅游网站中大量的旅游景区、美食、住宿等信息,人们通常是通过基于关键词的查询方式获取信息,然后再筛选出真正满足自身需求的信息加以利用。在互联网 旅游的模式下,人们获取旅游信息资源的渠道增加,获取的网络信息数量也随之增加.使其更易受到信息迷航或信息过载的困扰。因此,如何将大量的信息进行合理组织以便更贴近于用户的需求.使得用户在大量嘈杂的数据中可以简便清晰地获取有价值的信息是一个亟需解决的问题。
  互联网的快速发展使得更多的用户从信息的使用者渐渐转变为主动的内容生产者.这既使得网络信息数量激增,又由于一手信息的丰富增强了信息的时效性。因此,笔者认为為了使得获取的信息更符合用户的需求,优化用户的检索效果,可利用用户参与行为产生的信息来构建旅游信息本体,在本体的基础上对旅游网站信息进行重新组织。该方法的优势在于:首先,以用户发布的信息作为数据源构建本体.一方面可以使获取的信息更贴合用户的需求:另一方面可以使本体的进化变得更为自动化,不用过多地依赖领域专家参与,只需每隔一段时间爬取用户发布的信息即可完成更新。其次本体主要定义了事物的概念、属性以及概念之间的关系,能够体现出信息之间的关联性。将本体技术应用于在线旅游网站的信息组织,能够将各个旅游信息类之间的关系体现出来,在语义和知识层次上表示复杂的知识,比如当用户搜索某一景区时,网站会将与景区相关联的美食、酒店、交通等信息以及其自身的属性都反馈给用户,为用户提供更精确、有价值、有关联的旅游信息。
  1国内外研究现状综述
  1.1国内外旅游本体构建相关研究综述
  旅游本体是将本体技术应用于旅游领域,通过对相关旅游概念的描述,构建概念间的逻辑关系,国内外的学者在旅游本体构建方面也进行了大量的研究。如闫晓鹏通过在旅游信息检索系统中引入本体技术,以山东省为例,利用七步法构建了山东旅游信息本体模型。封珏以扬州风景区为例研究了其中的类结构,最后使用OWL本体描述语言定义本体类、类之间的属性关系、属性的约束以及实例的创建,构建了扬州领域旅游信息本体。戚利娜为了提升旅游信息资源的检索效果,以张家界为例,利用六步法研究了类的层次结构,最后使用Protege工具构建了张家界旅游信息本体。李艳等以商洛地区为例,提出了基于本体的全域旅游信息平台建设模式.并通过使用Protege工具构建了商洛地区的全域旅游信息本体。李庆赛在比较大众分类法与本体的异同上,采用七步法对旅游领域本体建模,并在此基础上使用本体构建工具Protege详细介绍了旅游本体的构建过程。Chan.trapornchai c等以泰国健康旅游为例,通过信息收集、语料库研究、本体的构建和发布评价以及应用构建等过程,构建了泰国第一个健康旅游本体。Xavier C C等提出了利用半自动化的抽取方法提取维基百科数据库的类别.其主要过程为逐步抽取旅游分类结构、类别的层级结构、概念关系、子类和实例,进而以此为基础最终构建旅游信息本体。Mili H等结合本体构建工具Protege和OWL本体语言构建了一个法语旅游本体,为构建的电子旅游平台系统提供了基础框架。Daramola J O等在构建尼日利亚旅游业的旅游推荐服务框架时.利用本体构建工具Protege和OWL语言构建了目的地环境本体和住宿本体。
  1.2简要述评
  综上所述.国内外对于旅游信息本体构建研究已有一定的成果.目前的研究大多集中在通过使用某一地区的旅游信息进行本体的构建。但尚未有从用户的角度出发,利用在线旅游网站中用户发布的信息进行本体构建的研究。将用户在在线旅游网站发布的信息重新组织应用,能够在较大程度上满足用户自身的需求,并更好地体现出信息的时效性价值,而本体作为一种有效的知识组织方式,能够帮助用户在大量的信息之间简便快速地获取有价值的关联信息。因此,本文在借鉴现有旅游信息本体构建研究相关成果的基础上,以在线旅游网站中用户发布的信息为切入点,从用户的角度出发构建在线旅游网站信息本体。
  2用户参与的在线旅游网站信息本体设计
  2.1用户对旅游信息组织的需求分析
  在线旅游网站是用户通过互联网进行互通和分享旅游信息的网络平台。随着旅游活动的日常化,在出行前,越来越多的用户习惯于从在线旅游网站中获取相关的景区、美食、住宿以及交通等信息。因此,为了了解用户使用在线旅游网站的现状,本文调研了马蜂窝旅游网、携程旅行网、途牛旅游网等相关在线旅游网站的产品体验分析报告,以此为基础分析了目前用户对于在线旅游网站的需求,在分析过程中发现有4个方面容易影响到用户满意度:第一.虽然网络技术的普及让人们获取信息变得容易,但网络信息的增长量超出了用户的认知能力,造成了信息过载等诸多问题。而目前在线旅游网站只提供了简单的关键词查询、分类搜索等检索方法,展示的游记、攻略和旅游产品信息过多,导致页面之间的交互复杂需要跳转多个界面进行查询,已无法使用户快速获取有价值的旅游信息;第二,旅游领域中信息的复杂性强,涉及游、购、娱、食、住、行等多方面,再加上各个在线旅游网站面向的用户群体阶层也有所不同,如马蜂窝旅游网的用户大多为25~35岁的年轻女性,而携程旅行网、途牛旅游网的用户则较多为35岁左右的商务男性。因此,不同的用户在查询信息时,需要查询多次或者尝试多个在线旅游网站才能够获取全面的信息,单个的网站难以满足用户全面的信息需求;第三,用户在通过查看相关游记获取旅游信息时,因为大部分游记是由图文以及视频组成,在获取相关信息时,一般都要看完视频或者阅读完整篇内容才能获取其中的零星信息.所得到的信息也较为分散、关联性弱,并且需要花费较多时间浏览和阅读;第四,从互联网技术方面来说,在线旅游网站提供的搜索引擎对语义的理解和表达有限,往往会造成信息的检准率低和信息之间语义关联性差的问题。   基于以上分析,为了提高用户对于获取的信息的满意程度,笔者认为可采用用户参与构建在线旅游网站信息本体的方法,从用户的角度出发,以用户发布的信息为基础使用本体方式对在线旅游网站中的信息进行组织,构建一个可重用、可发展的在线旅游网站信息本体,提供更有关联的、更满足用户需求的信息。
  2.2用户参与的在线旅游网站信息本体设计机理
  通过上文的分析可知,随着在线旅游网站的发展,大量繁杂的网络信息不仅没有很好地满足用户的需求,反而降低了用户获取有价值旅游信息的效果。针对此问题,本文提出一种以用户发布的旅游信息为基础,通过用户参与构建在线旅游网站信息本体的方法,以期通过基于本体的查询来优化用户检索信息的效果,使得检索的结果更加满足用户需求。在本研究中用户参与的方式主要是在在线旅游网站中的信息发布行为,发布的信息包括游记、攻略、评论等多种内容,也即在本体构建过程中用户的参与是一种隐式的参与,该种方式可减轻用户的负担。用户参与的在线旅游网站信息本体设计机理具体如图1所示.其整个流程主要包括用戶数据的生成、用户数据的获取、在线旅游网站信息本体构建、旅游信息检索4个模块。
  1)用户数据的生成。该部分是指用户通过在线旅游网站发布旅游游记、攻略、评论等信息,组成了网站中有关于用户的大量旅游信息文本集,对这些信息中的相关内容进行挖掘可用于后续的本体构建,这一部分是整个用户参与的在线旅游网站信息本体构建的数据基础。
  2)用户数据的获取。第一步是利用数据采集工具爬取在线旅游网站中用户发布的文本信息,然后进行文本信息的筛选,筛选标准是剔除爬取到的重复、乱码以及含有错误的文本。第二步是将经过预处理的文本信息利用分词系统进行分词以及关键词的提取。第三步是将提取出的关键词依据词语的词性以及词频进行筛选.主要是过滤没有意义的虚词和实词,选取词性为名词且出现频次相对较高的关键词,然后将内容或意义相同但名称不同的词汇进行归类或合并,最后以词频进行排序形成在线旅游网站用户旅游信息数据集。
  3)在线旅游网站信息本体构建。综合相关研究得出,目前常用的本体构建方法主要包括IDEF5法、TOVE法、METHONLOGY法、骨架法和七步法。它们的成熟度依次为七步法
其他文献
[摘要]网络衍生舆情形成的根本原因是网络舆情信息和主体异化问题。根据信息异化理论,通过分析网络舆情演化的萌芽期、扩散期与消退期3个阶段,归纳了网络衍生舆情的一般特征和演化规律,指出网络谣言是信息异化作用下一种典型的综合网络舆情,并以网络谣言治理为例,深入剖析了网络谣言的基本要素与演化机理,进而,提出了治理网络谣言的“主体——社会——技术”的“三雏一体”策略,以期为我国综合网络舆情治理体系建设提供有
随着四季的变化,人们的饮食也要相应变化,谓之“顺时而变”。  春季饮食原则  习惯了冬天大补的人们,到了春天可要注意管住嘴。  春天不可大补,而应该温和地补,以升补为主,来顺应春天的阳气升发之力。具有升补作用的食物有:豆芽、春笋、韭菜、香椿、葱、姜、蒜等。到了春天的最后一个月,阳气已经升发起来,可以减少升温食物,此时正是各种绿叶蔬菜上市的时候,应多吃蔬菜。  以中医五行来说,春天要注意养肝。五种味
《一篇读罢头飞雪,重读马克思》  作者用平实、生动甚至略带犀利的笔触,援引马克思著作中的精彩部分,充分解读了马克思对当今世界社会发展趋势以及经济危机的成功预测和判断。针对马克思的三部作品《资本论》《法兰西内战》和《路易·波拿巴的雾月十八日》,作者引导读者沿着马克思的足迹解读资本主义、社会主义、货币、债务、道德、信用等,并反思马克思对上述问题的剖析有哪些现实指导意义,从而鞭策现代人要想看懂并解决政治
英语很烂?GPA为零?都不重要,成功取决于你有一颗想要留学的心。  从大三开始有了留学的念头,因为自己学习医学相关专业,前一年我心里最理想的目的地就是日本。但是真正踏足留学这条路却完全转变了念头。我的专业不是临床,虽然日本医学发达,但是仔细思考了一下预防相关领域,北美才是更适合的方向。在大三这一年我并没有开始准备托福考试,而是参加了外教课,一年下来其实学到的知识不多,但是开阔了眼界和敢于张口的勇气
她与丈夫拥有自己的公司,生活过得有滋有味,却不幸先后身患癌症。夫妻俩手术后回到老家休养,面对贫穷的山村和乡亲们一双双祈盼致富的眼睛,她用自己的羸弱之躯让小村发生了今非昔比的巨变。她就是“全国最美‘村官’”、山西省晋中市昔阳县井沟村村委会主任马怀兰。  老板夫妇回村休养却心酸  昔阳县井沟村是马怀兰丈夫周银柱的故乡。但在2002年之前,周银柱少小读书离家之后,和这个小山村的交集甚少,尤其是父母去世后
1955年共和国首次授衔时,装甲兵首任司令员许光达专门给毛泽东主席写了一份“降衔申请”,请求将自己的大将军衔降为上将军衔,被毛泽东誉为“这是一面明镜,共产党人自身革命的明镜”。  不要大将军衔  1908年11月19日,许光达出生于湖南省长沙县。1925年,17岁的许光达在长沙师范学校加入中国共产党,第二年考入黄埔军校,1927年参加南昌起义。从1941年起,许光达历任军委参谋部部长、八路军第12
〔摘 要〕在当前“互联网 ”背景下,应用大数据挖掘技术提高知识服务的智能化、个性化、自动化水平,实现智慧性的知识服务是图书馆服务的发展趋势。首先提出基于大数据挖掘的图书馆智慧服务模型,通过用户群挖掘、用户兴趣挖掘、学科和领域知识挖掘、业务关联挖掘来沟通大数据应用和智慧服务需求;然后提出基于Hadoop平台的图书馆大数据挖掘技术支撑体系,为智慧服务应用落地提供技术方案;最后探讨大数据挖掘支持下的场景
〔摘 要〕简要的介绍Dspace系统,详细描述Dspace系统具体的安装过程及在安装过程中碰到的相关问题,对其 原因进行分析,提出了解决的方法。  〔关键词〕开源软件;Dspace;开放获取  〔中图分类号〕G202 〔文献标识码〕C 〔文章编号〕1008-0821(2009)09-0059-03    The System Installation of Dspace and Analysis
每个人都渴望拥有完美生活,那么究竟什么样的生活才算完美呢?  2005年4月11日,在美国加州克莱蒙克大学,95歲高龄的现代管理学之父彼得·德鲁克在接受访谈时说:“我所认识的一些人,虽然说算不上幸福,但绝对是满意现有生活的,因为他们大多数都过着完美的生活;相反,多见于政界的一些人,因只重政治不问他事,最终成为郁郁寡欢之人。一个人的事业一旦达到顶峰,就无路可攀了,而永居顶峰又确实是不可能的。所以,完
[摘要]尝试在构建中国女性人物专题数据库的实践过程中运用数据仓库技术和数据挖掘技术,帮助学术研究者对这些人物在社会发展厦其自身发展的某个具体层面中所呈现的典型现象进行分析。力图改善以往专题数据库建设在这方面局限性。为研究学者搭建更加深层次信息分析的研究平台。  [关键词]中国女性人物;专题数据库;数据挖掘研究  DOl:10.3969/i.issn.1008-0821.2010.06.013  [