论文部分内容阅读
关键词:用户;在线旅游;网站信息;本体构建;马蜂窝
随着经济以及旅游业的发展,旅游资源越来越丰富,外出旅游也成为人们的日常休闲活动。网络信息技术的不断进步和发展.让在线旅游获得了极大的进展.在线旅游网站也因此层出不穷,如人们常用的有马蜂窝旅游网、携程旅行网、途牛旅游网、去哪儿旅行网等。面对旅游网站中大量的旅游景区、美食、住宿等信息,人们通常是通过基于关键词的查询方式获取信息,然后再筛选出真正满足自身需求的信息加以利用。在互联网 旅游的模式下,人们获取旅游信息资源的渠道增加,获取的网络信息数量也随之增加.使其更易受到信息迷航或信息过载的困扰。因此,如何将大量的信息进行合理组织以便更贴近于用户的需求.使得用户在大量嘈杂的数据中可以简便清晰地获取有价值的信息是一个亟需解决的问题。
互联网的快速发展使得更多的用户从信息的使用者渐渐转变为主动的内容生产者.这既使得网络信息数量激增,又由于一手信息的丰富增强了信息的时效性。因此,笔者认为為了使得获取的信息更符合用户的需求,优化用户的检索效果,可利用用户参与行为产生的信息来构建旅游信息本体,在本体的基础上对旅游网站信息进行重新组织。该方法的优势在于:首先,以用户发布的信息作为数据源构建本体.一方面可以使获取的信息更贴合用户的需求:另一方面可以使本体的进化变得更为自动化,不用过多地依赖领域专家参与,只需每隔一段时间爬取用户发布的信息即可完成更新。其次本体主要定义了事物的概念、属性以及概念之间的关系,能够体现出信息之间的关联性。将本体技术应用于在线旅游网站的信息组织,能够将各个旅游信息类之间的关系体现出来,在语义和知识层次上表示复杂的知识,比如当用户搜索某一景区时,网站会将与景区相关联的美食、酒店、交通等信息以及其自身的属性都反馈给用户,为用户提供更精确、有价值、有关联的旅游信息。
1国内外研究现状综述
1.1国内外旅游本体构建相关研究综述
旅游本体是将本体技术应用于旅游领域,通过对相关旅游概念的描述,构建概念间的逻辑关系,国内外的学者在旅游本体构建方面也进行了大量的研究。如闫晓鹏通过在旅游信息检索系统中引入本体技术,以山东省为例,利用七步法构建了山东旅游信息本体模型。封珏以扬州风景区为例研究了其中的类结构,最后使用OWL本体描述语言定义本体类、类之间的属性关系、属性的约束以及实例的创建,构建了扬州领域旅游信息本体。戚利娜为了提升旅游信息资源的检索效果,以张家界为例,利用六步法研究了类的层次结构,最后使用Protege工具构建了张家界旅游信息本体。李艳等以商洛地区为例,提出了基于本体的全域旅游信息平台建设模式.并通过使用Protege工具构建了商洛地区的全域旅游信息本体。李庆赛在比较大众分类法与本体的异同上,采用七步法对旅游领域本体建模,并在此基础上使用本体构建工具Protege详细介绍了旅游本体的构建过程。Chan.trapornchai c等以泰国健康旅游为例,通过信息收集、语料库研究、本体的构建和发布评价以及应用构建等过程,构建了泰国第一个健康旅游本体。Xavier C C等提出了利用半自动化的抽取方法提取维基百科数据库的类别.其主要过程为逐步抽取旅游分类结构、类别的层级结构、概念关系、子类和实例,进而以此为基础最终构建旅游信息本体。Mili H等结合本体构建工具Protege和OWL本体语言构建了一个法语旅游本体,为构建的电子旅游平台系统提供了基础框架。Daramola J O等在构建尼日利亚旅游业的旅游推荐服务框架时.利用本体构建工具Protege和OWL语言构建了目的地环境本体和住宿本体。
1.2简要述评
综上所述.国内外对于旅游信息本体构建研究已有一定的成果.目前的研究大多集中在通过使用某一地区的旅游信息进行本体的构建。但尚未有从用户的角度出发,利用在线旅游网站中用户发布的信息进行本体构建的研究。将用户在在线旅游网站发布的信息重新组织应用,能够在较大程度上满足用户自身的需求,并更好地体现出信息的时效性价值,而本体作为一种有效的知识组织方式,能够帮助用户在大量的信息之间简便快速地获取有价值的关联信息。因此,本文在借鉴现有旅游信息本体构建研究相关成果的基础上,以在线旅游网站中用户发布的信息为切入点,从用户的角度出发构建在线旅游网站信息本体。
2用户参与的在线旅游网站信息本体设计
2.1用户对旅游信息组织的需求分析
在线旅游网站是用户通过互联网进行互通和分享旅游信息的网络平台。随着旅游活动的日常化,在出行前,越来越多的用户习惯于从在线旅游网站中获取相关的景区、美食、住宿以及交通等信息。因此,为了了解用户使用在线旅游网站的现状,本文调研了马蜂窝旅游网、携程旅行网、途牛旅游网等相关在线旅游网站的产品体验分析报告,以此为基础分析了目前用户对于在线旅游网站的需求,在分析过程中发现有4个方面容易影响到用户满意度:第一.虽然网络技术的普及让人们获取信息变得容易,但网络信息的增长量超出了用户的认知能力,造成了信息过载等诸多问题。而目前在线旅游网站只提供了简单的关键词查询、分类搜索等检索方法,展示的游记、攻略和旅游产品信息过多,导致页面之间的交互复杂需要跳转多个界面进行查询,已无法使用户快速获取有价值的旅游信息;第二,旅游领域中信息的复杂性强,涉及游、购、娱、食、住、行等多方面,再加上各个在线旅游网站面向的用户群体阶层也有所不同,如马蜂窝旅游网的用户大多为25~35岁的年轻女性,而携程旅行网、途牛旅游网的用户则较多为35岁左右的商务男性。因此,不同的用户在查询信息时,需要查询多次或者尝试多个在线旅游网站才能够获取全面的信息,单个的网站难以满足用户全面的信息需求;第三,用户在通过查看相关游记获取旅游信息时,因为大部分游记是由图文以及视频组成,在获取相关信息时,一般都要看完视频或者阅读完整篇内容才能获取其中的零星信息.所得到的信息也较为分散、关联性弱,并且需要花费较多时间浏览和阅读;第四,从互联网技术方面来说,在线旅游网站提供的搜索引擎对语义的理解和表达有限,往往会造成信息的检准率低和信息之间语义关联性差的问题。 基于以上分析,为了提高用户对于获取的信息的满意程度,笔者认为可采用用户参与构建在线旅游网站信息本体的方法,从用户的角度出发,以用户发布的信息为基础使用本体方式对在线旅游网站中的信息进行组织,构建一个可重用、可发展的在线旅游网站信息本体,提供更有关联的、更满足用户需求的信息。
2.2用户参与的在线旅游网站信息本体设计机理
通过上文的分析可知,随着在线旅游网站的发展,大量繁杂的网络信息不仅没有很好地满足用户的需求,反而降低了用户获取有价值旅游信息的效果。针对此问题,本文提出一种以用户发布的旅游信息为基础,通过用户参与构建在线旅游网站信息本体的方法,以期通过基于本体的查询来优化用户检索信息的效果,使得检索的结果更加满足用户需求。在本研究中用户参与的方式主要是在在线旅游网站中的信息发布行为,发布的信息包括游记、攻略、评论等多种内容,也即在本体构建过程中用户的参与是一种隐式的参与,该种方式可减轻用户的负担。用户参与的在线旅游网站信息本体设计机理具体如图1所示.其整个流程主要包括用戶数据的生成、用户数据的获取、在线旅游网站信息本体构建、旅游信息检索4个模块。
1)用户数据的生成。该部分是指用户通过在线旅游网站发布旅游游记、攻略、评论等信息,组成了网站中有关于用户的大量旅游信息文本集,对这些信息中的相关内容进行挖掘可用于后续的本体构建,这一部分是整个用户参与的在线旅游网站信息本体构建的数据基础。
2)用户数据的获取。第一步是利用数据采集工具爬取在线旅游网站中用户发布的文本信息,然后进行文本信息的筛选,筛选标准是剔除爬取到的重复、乱码以及含有错误的文本。第二步是将经过预处理的文本信息利用分词系统进行分词以及关键词的提取。第三步是将提取出的关键词依据词语的词性以及词频进行筛选.主要是过滤没有意义的虚词和实词,选取词性为名词且出现频次相对较高的关键词,然后将内容或意义相同但名称不同的词汇进行归类或合并,最后以词频进行排序形成在线旅游网站用户旅游信息数据集。
3)在线旅游网站信息本体构建。综合相关研究得出,目前常用的本体构建方法主要包括IDEF5法、TOVE法、METHONLOGY法、骨架法和七步法。它们的成熟度依次为七步法
随着经济以及旅游业的发展,旅游资源越来越丰富,外出旅游也成为人们的日常休闲活动。网络信息技术的不断进步和发展.让在线旅游获得了极大的进展.在线旅游网站也因此层出不穷,如人们常用的有马蜂窝旅游网、携程旅行网、途牛旅游网、去哪儿旅行网等。面对旅游网站中大量的旅游景区、美食、住宿等信息,人们通常是通过基于关键词的查询方式获取信息,然后再筛选出真正满足自身需求的信息加以利用。在互联网 旅游的模式下,人们获取旅游信息资源的渠道增加,获取的网络信息数量也随之增加.使其更易受到信息迷航或信息过载的困扰。因此,如何将大量的信息进行合理组织以便更贴近于用户的需求.使得用户在大量嘈杂的数据中可以简便清晰地获取有价值的信息是一个亟需解决的问题。
互联网的快速发展使得更多的用户从信息的使用者渐渐转变为主动的内容生产者.这既使得网络信息数量激增,又由于一手信息的丰富增强了信息的时效性。因此,笔者认为為了使得获取的信息更符合用户的需求,优化用户的检索效果,可利用用户参与行为产生的信息来构建旅游信息本体,在本体的基础上对旅游网站信息进行重新组织。该方法的优势在于:首先,以用户发布的信息作为数据源构建本体.一方面可以使获取的信息更贴合用户的需求:另一方面可以使本体的进化变得更为自动化,不用过多地依赖领域专家参与,只需每隔一段时间爬取用户发布的信息即可完成更新。其次本体主要定义了事物的概念、属性以及概念之间的关系,能够体现出信息之间的关联性。将本体技术应用于在线旅游网站的信息组织,能够将各个旅游信息类之间的关系体现出来,在语义和知识层次上表示复杂的知识,比如当用户搜索某一景区时,网站会将与景区相关联的美食、酒店、交通等信息以及其自身的属性都反馈给用户,为用户提供更精确、有价值、有关联的旅游信息。
1国内外研究现状综述
1.1国内外旅游本体构建相关研究综述
旅游本体是将本体技术应用于旅游领域,通过对相关旅游概念的描述,构建概念间的逻辑关系,国内外的学者在旅游本体构建方面也进行了大量的研究。如闫晓鹏通过在旅游信息检索系统中引入本体技术,以山东省为例,利用七步法构建了山东旅游信息本体模型。封珏以扬州风景区为例研究了其中的类结构,最后使用OWL本体描述语言定义本体类、类之间的属性关系、属性的约束以及实例的创建,构建了扬州领域旅游信息本体。戚利娜为了提升旅游信息资源的检索效果,以张家界为例,利用六步法研究了类的层次结构,最后使用Protege工具构建了张家界旅游信息本体。李艳等以商洛地区为例,提出了基于本体的全域旅游信息平台建设模式.并通过使用Protege工具构建了商洛地区的全域旅游信息本体。李庆赛在比较大众分类法与本体的异同上,采用七步法对旅游领域本体建模,并在此基础上使用本体构建工具Protege详细介绍了旅游本体的构建过程。Chan.trapornchai c等以泰国健康旅游为例,通过信息收集、语料库研究、本体的构建和发布评价以及应用构建等过程,构建了泰国第一个健康旅游本体。Xavier C C等提出了利用半自动化的抽取方法提取维基百科数据库的类别.其主要过程为逐步抽取旅游分类结构、类别的层级结构、概念关系、子类和实例,进而以此为基础最终构建旅游信息本体。Mili H等结合本体构建工具Protege和OWL本体语言构建了一个法语旅游本体,为构建的电子旅游平台系统提供了基础框架。Daramola J O等在构建尼日利亚旅游业的旅游推荐服务框架时.利用本体构建工具Protege和OWL语言构建了目的地环境本体和住宿本体。
1.2简要述评
综上所述.国内外对于旅游信息本体构建研究已有一定的成果.目前的研究大多集中在通过使用某一地区的旅游信息进行本体的构建。但尚未有从用户的角度出发,利用在线旅游网站中用户发布的信息进行本体构建的研究。将用户在在线旅游网站发布的信息重新组织应用,能够在较大程度上满足用户自身的需求,并更好地体现出信息的时效性价值,而本体作为一种有效的知识组织方式,能够帮助用户在大量的信息之间简便快速地获取有价值的关联信息。因此,本文在借鉴现有旅游信息本体构建研究相关成果的基础上,以在线旅游网站中用户发布的信息为切入点,从用户的角度出发构建在线旅游网站信息本体。
2用户参与的在线旅游网站信息本体设计
2.1用户对旅游信息组织的需求分析
在线旅游网站是用户通过互联网进行互通和分享旅游信息的网络平台。随着旅游活动的日常化,在出行前,越来越多的用户习惯于从在线旅游网站中获取相关的景区、美食、住宿以及交通等信息。因此,为了了解用户使用在线旅游网站的现状,本文调研了马蜂窝旅游网、携程旅行网、途牛旅游网等相关在线旅游网站的产品体验分析报告,以此为基础分析了目前用户对于在线旅游网站的需求,在分析过程中发现有4个方面容易影响到用户满意度:第一.虽然网络技术的普及让人们获取信息变得容易,但网络信息的增长量超出了用户的认知能力,造成了信息过载等诸多问题。而目前在线旅游网站只提供了简单的关键词查询、分类搜索等检索方法,展示的游记、攻略和旅游产品信息过多,导致页面之间的交互复杂需要跳转多个界面进行查询,已无法使用户快速获取有价值的旅游信息;第二,旅游领域中信息的复杂性强,涉及游、购、娱、食、住、行等多方面,再加上各个在线旅游网站面向的用户群体阶层也有所不同,如马蜂窝旅游网的用户大多为25~35岁的年轻女性,而携程旅行网、途牛旅游网的用户则较多为35岁左右的商务男性。因此,不同的用户在查询信息时,需要查询多次或者尝试多个在线旅游网站才能够获取全面的信息,单个的网站难以满足用户全面的信息需求;第三,用户在通过查看相关游记获取旅游信息时,因为大部分游记是由图文以及视频组成,在获取相关信息时,一般都要看完视频或者阅读完整篇内容才能获取其中的零星信息.所得到的信息也较为分散、关联性弱,并且需要花费较多时间浏览和阅读;第四,从互联网技术方面来说,在线旅游网站提供的搜索引擎对语义的理解和表达有限,往往会造成信息的检准率低和信息之间语义关联性差的问题。 基于以上分析,为了提高用户对于获取的信息的满意程度,笔者认为可采用用户参与构建在线旅游网站信息本体的方法,从用户的角度出发,以用户发布的信息为基础使用本体方式对在线旅游网站中的信息进行组织,构建一个可重用、可发展的在线旅游网站信息本体,提供更有关联的、更满足用户需求的信息。
2.2用户参与的在线旅游网站信息本体设计机理
通过上文的分析可知,随着在线旅游网站的发展,大量繁杂的网络信息不仅没有很好地满足用户的需求,反而降低了用户获取有价值旅游信息的效果。针对此问题,本文提出一种以用户发布的旅游信息为基础,通过用户参与构建在线旅游网站信息本体的方法,以期通过基于本体的查询来优化用户检索信息的效果,使得检索的结果更加满足用户需求。在本研究中用户参与的方式主要是在在线旅游网站中的信息发布行为,发布的信息包括游记、攻略、评论等多种内容,也即在本体构建过程中用户的参与是一种隐式的参与,该种方式可减轻用户的负担。用户参与的在线旅游网站信息本体设计机理具体如图1所示.其整个流程主要包括用戶数据的生成、用户数据的获取、在线旅游网站信息本体构建、旅游信息检索4个模块。
1)用户数据的生成。该部分是指用户通过在线旅游网站发布旅游游记、攻略、评论等信息,组成了网站中有关于用户的大量旅游信息文本集,对这些信息中的相关内容进行挖掘可用于后续的本体构建,这一部分是整个用户参与的在线旅游网站信息本体构建的数据基础。
2)用户数据的获取。第一步是利用数据采集工具爬取在线旅游网站中用户发布的文本信息,然后进行文本信息的筛选,筛选标准是剔除爬取到的重复、乱码以及含有错误的文本。第二步是将经过预处理的文本信息利用分词系统进行分词以及关键词的提取。第三步是将提取出的关键词依据词语的词性以及词频进行筛选.主要是过滤没有意义的虚词和实词,选取词性为名词且出现频次相对较高的关键词,然后将内容或意义相同但名称不同的词汇进行归类或合并,最后以词频进行排序形成在线旅游网站用户旅游信息数据集。
3)在线旅游网站信息本体构建。综合相关研究得出,目前常用的本体构建方法主要包括IDEF5法、TOVE法、METHONLOGY法、骨架法和七步法。它们的成熟度依次为七步法