论文部分内容阅读
[摘 要]分面搜索以允许用户交互复杂的信息搜索和导航空间,成为一种流行的搜索方法。它已经被用在电子商务、音乐、旅游等多个方面。它有效地提高了信息检索的效率,改善了用户体验。然而分面搜索在索引这些资源时,对于不同用户认知水平都是单一的检索界面和搜索方式本文介绍了认知理论和分面搜索的定义,并围绕认知搜索的关键技术、研究热点、最新进展和应用前景进行了探討。
[关键词]认知;分面搜索;交互
中图分类号:G353.11 文献标识码:A 文章编号:1009-914X(2016)03-0306-01
1 引言
近年来,呈现在网络上的数据库的数量和规模大幅度增加,利用分面搜索(Faceted Search)帮助用户更为有效地查找所需文件已经成为互联网服务的一个重要问题,与传统的分类相比,分面允许一个文件同时存在多个重叠的分类。
将认知理论加入到分面搜索中,那么利用分面搜索在索引这些资源时,人们寻找和使用信息的一部分,他们就可以不断地在日常生活和相关的工作以及许多其他议题,寻求一个巨大的范围的来源。无论你正在寻找的你的第一份工作,跳槽,重新进入就业市场后一个扩展的情况下,不同的候选人之间进行选择进行表决,获得你需要的产品信息,或正准备即将到来的假期,你必须搜索许多文件内的信息分发到越来越多的网站
2 相关工作
认知是人们适应周围环境以生存的必要条件。人的认知一般包括:认识、组织、同化和处理外环境信息的能力。具体来说,认知是一种思想过程,它包含有注意、知觉、思维及记忆等。认知风格又称认知模式,是个体在信息加工过程中在认知活动组织与认知功能方面表现出的持久一贯的特有风格。它既包括个体知觉、记忆、思维等认知过程方面的差异,又包括个体态度、动机等人格形成和认知能力与认知功能方面的差异。在超文本信息环境中,认知风格与用户的认知活动有着极为密切的关系,研究用户的认知风格对于深入了解用户的认知心理,对用户进行个性化服务有着重要意义。
分面搜索(Faceted Search)提供的结果是上下文相关的,用户选择某个条件后,分面结果会在该条件限定下的结果集中动态获取,从而能够从不同的角度对数据进行归类整合,帮助用户进一步了解他们需要获取的数据信息[5]。分面搜索的优势可以总结为以下几点:首先,分面搜索支持用户根据自己的需要选取不同的分面进行筛选。其次,分面搜索允许用户自己创建搜索路径。最后,分面搜索只展现有对应结果的选项,避免了结果为空的情况。
3 研究现状及成果
3.1 信息搜索过程模型(ISP)
ISP模型在1985年首次出现,然后慢慢地被丰富起来。起初,Kuhlthau开发了一个信息搜索过程的整体模型,该模型将情感、认知和身体经历的不同阶段融入到了信息检索中。在用户不确定自己找的是什么,即信息需求比较模糊的情况下进行某一主题的搜索时,以分面方式展示的导航是非常有用的搜索辅助功能。
3.2 学术上研究成果
与分面搜索最相关的人就是马蒂.赫斯特,他加入加州大学的伯克利分校,全心从事研究工作:Flamenco项目[6]。
3.3 商业领域的应用
分面搜索最大的成功应该是它在商业领域的应用(a)ENDECA:ENDECA成立于1999年,它为电子商务网站(如Wal-Mart and Home Depot)提供分面搜索,但是它还把这技术应用于制造业、出版业、财经服务和政府等领域(b)eBAY:易趣网最初是以在线拍卖网站出名的。
3.4 开源社区
虽然分面搜索首先应用于商业,但是后来也得到了开源社区的关注。
4 新的研究方向及存在的问题
4.1 分面搜索新的研究方向和趋势
除了针对于RDF数据进行分面搜索,还有针对XML文档进行的分面搜索, INEX会议是XML检索界最著名的测评会议,在2011年INEX会议上首次提出了对以数据为中心的结构丰富的XML文档的分面搜索评测任务。
大量的信息会把用户淹没,于是出现了许多改善分面推荐的算法。如文献[8]提出把分面浏览看作是构建和遍历一棵决策树,帮助选择能够浏览这棵树的最有效的分面
4.2 分面搜索中存在的问题
分面搜索研究领域还存在许多问题需要解决:
(1)分面多时全部显示分面会淹没用户视线:由于屏幕实际大小的限制以及人的注意力的限制,我们不能显示所有的分面和值,需要每一步推荐分面来精炼查询。
(2)传统的分面搜索技术适用于结构化数据,对于XML这种半结构化数据等的搜索不适用:分面搜索是基于分面分类系统来组织文档集的。这种情况下由于分面搜索要求文档包含元数据,没有元数据,就成了文本搜索。需要采用一些技术,丰富非结构化文本来获取元数据,这些技术都属于文本挖掘领域。(3)数据量大时分面搜索的计算效率:精炼查询的计算量远远大于计算满足查询约束的结果的计算量,如何有效地执行集合之间的交集运算是提高效率的关键。
5 结论
该综述重点介绍了分面搜索的研究历史、现状、已取得的研究成果以及研究方法等。论述了该领域已解决的问题、尚存在的问题。综合分析了分面搜索以往研究的优点、不足和贡献,总结了分面搜索新的研究方向和趋势:以往的分面搜索是对结构化的数据进行检索,未来的研究可能对半结构化的XML文档进行分面检索,通过分面推荐有效提高信息检索的效率,改善用户体验。
参考文献
[1] Sacco, G. M. Dynamic taxonomies and guided searches , J. of the American Society for Information Science and Technology, 57:6, pp. 792-797, 2006.
[2] Sacco, G. M.Analysis and Validation of Information Access through Mono, Multidimensional and Dynamic Taxonomies, FQAS 2006, Springer LNAI 4027, 2006.
[3] Sacco, G. M. Uniform access to multimedia information bases through dynamic taxonomies, IEEE 6th Int. Symp. on Multimedia Software Engineering, (ISMSE'04), 2004, 320-328 .
[4] Nan Niu , Anas Mahmoud , Xiaoyong Yang .Faceted navigation for software exploration.19th IEEE International Conference on Program Comprehension . IEEE , 2011.
[5] 陈波.基于开源全文检索系统Solr的OPAC分面浏览.应用实践,2007,11:72-75.
[6] http://sourceforge.net/projects/flamenco.
[7] http://search.trln.edu/.
[关键词]认知;分面搜索;交互
中图分类号:G353.11 文献标识码:A 文章编号:1009-914X(2016)03-0306-01
1 引言
近年来,呈现在网络上的数据库的数量和规模大幅度增加,利用分面搜索(Faceted Search)帮助用户更为有效地查找所需文件已经成为互联网服务的一个重要问题,与传统的分类相比,分面允许一个文件同时存在多个重叠的分类。
将认知理论加入到分面搜索中,那么利用分面搜索在索引这些资源时,人们寻找和使用信息的一部分,他们就可以不断地在日常生活和相关的工作以及许多其他议题,寻求一个巨大的范围的来源。无论你正在寻找的你的第一份工作,跳槽,重新进入就业市场后一个扩展的情况下,不同的候选人之间进行选择进行表决,获得你需要的产品信息,或正准备即将到来的假期,你必须搜索许多文件内的信息分发到越来越多的网站
2 相关工作
认知是人们适应周围环境以生存的必要条件。人的认知一般包括:认识、组织、同化和处理外环境信息的能力。具体来说,认知是一种思想过程,它包含有注意、知觉、思维及记忆等。认知风格又称认知模式,是个体在信息加工过程中在认知活动组织与认知功能方面表现出的持久一贯的特有风格。它既包括个体知觉、记忆、思维等认知过程方面的差异,又包括个体态度、动机等人格形成和认知能力与认知功能方面的差异。在超文本信息环境中,认知风格与用户的认知活动有着极为密切的关系,研究用户的认知风格对于深入了解用户的认知心理,对用户进行个性化服务有着重要意义。
分面搜索(Faceted Search)提供的结果是上下文相关的,用户选择某个条件后,分面结果会在该条件限定下的结果集中动态获取,从而能够从不同的角度对数据进行归类整合,帮助用户进一步了解他们需要获取的数据信息[5]。分面搜索的优势可以总结为以下几点:首先,分面搜索支持用户根据自己的需要选取不同的分面进行筛选。其次,分面搜索允许用户自己创建搜索路径。最后,分面搜索只展现有对应结果的选项,避免了结果为空的情况。
3 研究现状及成果
3.1 信息搜索过程模型(ISP)
ISP模型在1985年首次出现,然后慢慢地被丰富起来。起初,Kuhlthau开发了一个信息搜索过程的整体模型,该模型将情感、认知和身体经历的不同阶段融入到了信息检索中。在用户不确定自己找的是什么,即信息需求比较模糊的情况下进行某一主题的搜索时,以分面方式展示的导航是非常有用的搜索辅助功能。
3.2 学术上研究成果
与分面搜索最相关的人就是马蒂.赫斯特,他加入加州大学的伯克利分校,全心从事研究工作:Flamenco项目[6]。
3.3 商业领域的应用
分面搜索最大的成功应该是它在商业领域的应用(a)ENDECA:ENDECA成立于1999年,它为电子商务网站(如Wal-Mart and Home Depot)提供分面搜索,但是它还把这技术应用于制造业、出版业、财经服务和政府等领域(b)eBAY:易趣网最初是以在线拍卖网站出名的。
3.4 开源社区
虽然分面搜索首先应用于商业,但是后来也得到了开源社区的关注。
4 新的研究方向及存在的问题
4.1 分面搜索新的研究方向和趋势
除了针对于RDF数据进行分面搜索,还有针对XML文档进行的分面搜索, INEX会议是XML检索界最著名的测评会议,在2011年INEX会议上首次提出了对以数据为中心的结构丰富的XML文档的分面搜索评测任务。
大量的信息会把用户淹没,于是出现了许多改善分面推荐的算法。如文献[8]提出把分面浏览看作是构建和遍历一棵决策树,帮助选择能够浏览这棵树的最有效的分面
4.2 分面搜索中存在的问题
分面搜索研究领域还存在许多问题需要解决:
(1)分面多时全部显示分面会淹没用户视线:由于屏幕实际大小的限制以及人的注意力的限制,我们不能显示所有的分面和值,需要每一步推荐分面来精炼查询。
(2)传统的分面搜索技术适用于结构化数据,对于XML这种半结构化数据等的搜索不适用:分面搜索是基于分面分类系统来组织文档集的。这种情况下由于分面搜索要求文档包含元数据,没有元数据,就成了文本搜索。需要采用一些技术,丰富非结构化文本来获取元数据,这些技术都属于文本挖掘领域。(3)数据量大时分面搜索的计算效率:精炼查询的计算量远远大于计算满足查询约束的结果的计算量,如何有效地执行集合之间的交集运算是提高效率的关键。
5 结论
该综述重点介绍了分面搜索的研究历史、现状、已取得的研究成果以及研究方法等。论述了该领域已解决的问题、尚存在的问题。综合分析了分面搜索以往研究的优点、不足和贡献,总结了分面搜索新的研究方向和趋势:以往的分面搜索是对结构化的数据进行检索,未来的研究可能对半结构化的XML文档进行分面检索,通过分面推荐有效提高信息检索的效率,改善用户体验。
参考文献
[1] Sacco, G. M. Dynamic taxonomies and guided searches , J. of the American Society for Information Science and Technology, 57:6, pp. 792-797, 2006.
[2] Sacco, G. M.Analysis and Validation of Information Access through Mono, Multidimensional and Dynamic Taxonomies, FQAS 2006, Springer LNAI 4027, 2006.
[3] Sacco, G. M. Uniform access to multimedia information bases through dynamic taxonomies, IEEE 6th Int. Symp. on Multimedia Software Engineering, (ISMSE'04), 2004, 320-328 .
[4] Nan Niu , Anas Mahmoud , Xiaoyong Yang .Faceted navigation for software exploration.19th IEEE International Conference on Program Comprehension . IEEE , 2011.
[5] 陈波.基于开源全文检索系统Solr的OPAC分面浏览.应用实践,2007,11:72-75.
[6] http://sourceforge.net/projects/flamenco.
[7] http://search.trln.edu/.