论文部分内容阅读
互联网的进一步发展与广大用户专门化、垂直化的需求,激化了互联网庞大而又无序的海量信息库与用户需求之间的矛盾。随着网络通信技术和智能化技术的迅猛发展,信息服务工作者应把用户特定的信息需求作为过滤条件对资源进行过滤,把资源流中符合需求的内容提取出来提供给用户,从而形成一种因人而异的信息服务形态,即个性化信息服务的形态。个性化信息服务的实质是针对性,即对不同的用户采用不同的服务策略,提供不同的服务内容。个性化信息服务可使用户通过尽可能小的努力获得尽可能好的服务。
1 个性化服务系统的主要形式
1.1 个性化信息检索系统
信息检索是用户寻找、定位感兴趣信息的主要途径,Internet信息检索服务的质量决定了用户使用Internet信息的效率。而个性化信息检索则是指根据用户的兴趣和特点进行检索。为了高效地开展个性化信息检索服务,应致力于设计基于三层代理的个性化信息检索系统,即用户代理、用户代理的代理、信息检索代理。用户代理对用户的信息检索行为进行监控,全面地分析用户的个性化信息需求模式,然后将其传给用户代理的代理。信息检索代理将来自不同搜索引擎的信息进行集成归并,然后推送给用户代理的代理。用户代理的代理再将二者进行匹配过滤,使过滤的信息能够满足用户的个性化检索要求。该检索系统应注意解决以下几方面的问题:
(1)能快速适应用户兴趣的变化。现有系统发现用户兴趣的方式通常有两种:一是由用户以关键字方式提供自己的兴趣;二是从一类文档中提取。以关键字的方式提供兴趣的缺陷是用户经常不能准确地表达自己的兴趣。而从一类文档中提取用户兴趣的缺陷是不能全面地发现用户的兴趣。并且现有系统普遍采用相关反馈技术作为用户和系统进行交互的手段。因此,应该采用根据用户浏览页面的信息来自动更新用户兴趣模型的系统。
(2)提高系统对用户检索提问的理解。为了提高检索系统对用户检索提问的理解,就必须有一个好的检索提问语言,而为了克服关键词检索和目录查询的缺点,应该采用自然语言智能答询。用户可以输入简单的疑问句,检索系统在对提问的结构和内容进行分析之后或直接给出答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,使网络交流更加人性化,使查询更加方便、直接、有效。
(3)能从分布式的海量信息资源中确定检索系统信息检索范围,提高检索系统的针对性。现有的检索系统很难收集全所有主题的网络信息,或者尽管信息主题收集得比较全面,但是由于主题范围太广,很难将各主题都做得精确而又专业,致使检索结果垃圾过多。因此,可以采用Internet信息发现的分布协作策略对信息资源空间进行划分。划分原则可以按照科学领域划分,也可以按照地理区域等划分。将信息资源空间划分成若干个子空间后,对于每一个子空间,分别建立一个信息检索系统以提供相应的信息检索服务。这样,信息检索的结果会更加专业化、目的化。
(4)能够按用户兴趣排列、分类,提供更优化的检索结果。可以结合用户自身的需要向相应的专业领域信息检索系统提出请求,对信息进行分类、排列及过滤,匹配信息,优化检索结果。采用这种信息检索策略,各个信息检索系统所要管理的信息资源相对缩小,可以降低消耗,便于维护。同时,各系统之间通过相互协作,提高了查全率和查准率。
1.2 个性化信息推荐系统
个性化信息推荐系统是采用先进的技术,自动识别用户需求,不需用户登录网站就能采集符合其个性化需求的信息,利用“信息找用户”的获取方式,将用户从繁忙的查找工作中解放出来。服务实现的关键是了解用户的信息需求,为不同层次的信息需求者提供层次对应的、高智能的、简洁方便的信息服务;对各种信息进行收集、整理和分类,通过收集、分析用户的兴趣爱好和访问历史,建立用户模型并用于信息过滤和排序,从而指导用户的浏览和信息采集。现有的个性化信息推荐系统大致包括人机交互界面、用户信息库、用户需求分析模块、信息智能检索、知识抽取、规则库、资源库、外部信息的检索与获取、总体控制等部分。但其还不能很好地满足个性化信息服务的需要。一是现在推荐的内容是根据用户登记的个人信息,不能随用户信息需求的变化而变化,而且推荐的内容及形式过于单一,一般都是采用文本格式;二是推荐形式不能满足用户多方面需要,例如,有的用户希望以邮件的形式进行推荐,有的则希望以信息导航的形式进行推荐等。因此,今后个性化推荐服务应从以下几方面加以改善:
(1)要为用户推荐高质有效的学术信息,包括文本、多媒体、音频、视频等捆绑式的信息推荐,即内容推荐。
(2)从数据库中挖掘出隐性知识推荐给用户。系统应自动跟踪信息内容的变化,当用户需要定期了解某一主题信息时,系统将定期进行搜索查询,根据用户的需求定制检索结果,自动推送给用户。
(3)出现多种推送方式并存的局面,如:按用户类型分类,可采用同类用户的群体化推送及分层次、分人员素质需求的推送等;按内容分类,可采用个性化定题推送等。推送形式多种多样,包括网上期刊目次通报服务、网上专题热点服务、网上资源订阅服务和定题信息服务,并将检索结果通过邮件系统直接主动推送至用户桌面等。其推送模式应面向社会,面向大众,并运用电子商务系统向全国乃至世界拓展。
1.3 个性化网站
个性化网站是指那些为不同用户提供相应内容和服务的网站。个性化网站的功能应该保证在用户满意的时间内,以用户期望的方式,浏览准确、完备的信息。一般来说,个性化网站是通过个人或群体的定制实现的。个性化网站的定制包括风格定制和信息提取方式定制。
(1)风格定制是针对结构和内容的定制。结构定制是各个信息检索界面模块的布局形式,例如各模块在界面存放的位置,以及界面上的有关图像、菜单等位置的设置。系统应该能够提供若干基础模板供用户选择,并允许用户在各个模板的相应指定位置插入一定内容。内容定制是用户根据自己的爱好、兴趣选择自己所需的内容模块,如新闻、股票价格、天气等。
(2)信息提取方式定制则是针对浏览方法实现形式的定制,包括:①浏览表达式定制。用户可自定义默认的检索方式是简单还是复杂方式,自定义布尔检索式中“与”、“或”、“非”的表示符号,系统还可为用户记录最近的特定数量的检索提问,以供用户选择。②个人词表定制。允许用户写入常用词汇的自定义规范词、同义词、近义词等,当用户使用到该常用词时,系统可根据 个人词表调用相应词汇优化结果。③浏览结果分析定制。用户可根据个人需要对所需信息的专业、深度、语言、地域、数量、时域等进行定制,从而对检索结果进行再次分析,限制检索条件。④浏览结果处理定制。可对检索结果的相关度计算方式、输出格式、排序方式、重合记录的处理方式、下载格式、传送地址等进行定制。
目前,一般个性化网站的查找对象仅为静态HTML页面,不能提供较完善的交互,而且网站后台数据库信息资源缺乏,即使是大型的网站也都要借助一些专门的搜索引擎来查询信息。未来个性化网站应向更加深入的方向发展,使网站扩展为真正的个人信息源。网站服务可以从生成动态页面的后台数据库提取信息,使用户通过风格定制的内容更加丰富,更具动态性、交互性,实现多种格式的提取。个性化网站信息内容包括许多个人业务处理,与新闻、娱乐、通讯等其他行业紧密合作,创造出一个全面、主动的信息服务空间。在信息提取方面,应综合运用计算机人工智能、数据挖掘、分布式数据处理、自然语言处理、数据库管理等技术,分析用户提交的信息请求,针对网站信息的大容量、异构性、分布性和动态性等特点,尽量透明地为用户提供精确的查询结果。未来的个性化服务网站将成为 种深入到用户个人生活和工作各个层面的辅助性工具。
2 个性化信息服务的原则
我们提出的个性化信息服务是以用户服务工作为基础的,因此,除原有信息服务的普遍原则外,还要遵循以下几方面服务原则:
2.1 体现以人为本的服务理念
传统信息服务的管理思想是以信息量为本,虽然“用户第一”的服务理念已提倡多年,实际上多半停留在口号上,并未落到实处。个性化信息服务要体现“用户第一”的服务理念,必须改变以信息量为本、以数据库为本的管理思想,做到以人为本,以用户服务的质量、水平和深度来评估信息服务的业绩,一切从方便用户出发,减少对用户的限制。
2.2 加强隐私保密
为了更好地开展个性化信息服务,用户的个人信息是不可缺少的,这就涉及到了用户的隐私问题。不能因为隐私问题的存在,就限制使用用户个人信息。个性化信息服务应该使用户相信其个人信息不会被滥用。同时,要鼓励用户积极提供个人信息,形成良性循环。
2.3 重视版权保护
由于信息服务为用户提供了信息下载服务,因而产生了版权问题。有关网上知识产权保护问题的讨论已经很多,相信不久会有正式的法律法规出台。目前,可暂时采用以下方法来解决:一是网络只提供部分下载功能,如UMI提供的硕士、博士论文只能从网上下载其摘要或部分文章内容。二是利用先进的信息技术加以控制,如模仿软件推销商,允许用户通过专门软件下载图文,但过了某一时限或超过限定的使用次数,则下载的文本就无法阅读。
个性化信息服务的出现,不仅革新了观念,而且改变了传统信息服务模式,伴随智能化技术的进展,个性化信息服务将会有更加广阔的发展前景。对用户而言,个性化信息服务节约了操作时间i对于服务提供商而言,提高了服务质量,吸引了更多的用户。随着现代化技术的迅猛发展,如何提供优质的个性化信息服务已成为人们共同关注的焦点。
1 个性化服务系统的主要形式
1.1 个性化信息检索系统
信息检索是用户寻找、定位感兴趣信息的主要途径,Internet信息检索服务的质量决定了用户使用Internet信息的效率。而个性化信息检索则是指根据用户的兴趣和特点进行检索。为了高效地开展个性化信息检索服务,应致力于设计基于三层代理的个性化信息检索系统,即用户代理、用户代理的代理、信息检索代理。用户代理对用户的信息检索行为进行监控,全面地分析用户的个性化信息需求模式,然后将其传给用户代理的代理。信息检索代理将来自不同搜索引擎的信息进行集成归并,然后推送给用户代理的代理。用户代理的代理再将二者进行匹配过滤,使过滤的信息能够满足用户的个性化检索要求。该检索系统应注意解决以下几方面的问题:
(1)能快速适应用户兴趣的变化。现有系统发现用户兴趣的方式通常有两种:一是由用户以关键字方式提供自己的兴趣;二是从一类文档中提取。以关键字的方式提供兴趣的缺陷是用户经常不能准确地表达自己的兴趣。而从一类文档中提取用户兴趣的缺陷是不能全面地发现用户的兴趣。并且现有系统普遍采用相关反馈技术作为用户和系统进行交互的手段。因此,应该采用根据用户浏览页面的信息来自动更新用户兴趣模型的系统。
(2)提高系统对用户检索提问的理解。为了提高检索系统对用户检索提问的理解,就必须有一个好的检索提问语言,而为了克服关键词检索和目录查询的缺点,应该采用自然语言智能答询。用户可以输入简单的疑问句,检索系统在对提问的结构和内容进行分析之后或直接给出答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,使网络交流更加人性化,使查询更加方便、直接、有效。
(3)能从分布式的海量信息资源中确定检索系统信息检索范围,提高检索系统的针对性。现有的检索系统很难收集全所有主题的网络信息,或者尽管信息主题收集得比较全面,但是由于主题范围太广,很难将各主题都做得精确而又专业,致使检索结果垃圾过多。因此,可以采用Internet信息发现的分布协作策略对信息资源空间进行划分。划分原则可以按照科学领域划分,也可以按照地理区域等划分。将信息资源空间划分成若干个子空间后,对于每一个子空间,分别建立一个信息检索系统以提供相应的信息检索服务。这样,信息检索的结果会更加专业化、目的化。
(4)能够按用户兴趣排列、分类,提供更优化的检索结果。可以结合用户自身的需要向相应的专业领域信息检索系统提出请求,对信息进行分类、排列及过滤,匹配信息,优化检索结果。采用这种信息检索策略,各个信息检索系统所要管理的信息资源相对缩小,可以降低消耗,便于维护。同时,各系统之间通过相互协作,提高了查全率和查准率。
1.2 个性化信息推荐系统
个性化信息推荐系统是采用先进的技术,自动识别用户需求,不需用户登录网站就能采集符合其个性化需求的信息,利用“信息找用户”的获取方式,将用户从繁忙的查找工作中解放出来。服务实现的关键是了解用户的信息需求,为不同层次的信息需求者提供层次对应的、高智能的、简洁方便的信息服务;对各种信息进行收集、整理和分类,通过收集、分析用户的兴趣爱好和访问历史,建立用户模型并用于信息过滤和排序,从而指导用户的浏览和信息采集。现有的个性化信息推荐系统大致包括人机交互界面、用户信息库、用户需求分析模块、信息智能检索、知识抽取、规则库、资源库、外部信息的检索与获取、总体控制等部分。但其还不能很好地满足个性化信息服务的需要。一是现在推荐的内容是根据用户登记的个人信息,不能随用户信息需求的变化而变化,而且推荐的内容及形式过于单一,一般都是采用文本格式;二是推荐形式不能满足用户多方面需要,例如,有的用户希望以邮件的形式进行推荐,有的则希望以信息导航的形式进行推荐等。因此,今后个性化推荐服务应从以下几方面加以改善:
(1)要为用户推荐高质有效的学术信息,包括文本、多媒体、音频、视频等捆绑式的信息推荐,即内容推荐。
(2)从数据库中挖掘出隐性知识推荐给用户。系统应自动跟踪信息内容的变化,当用户需要定期了解某一主题信息时,系统将定期进行搜索查询,根据用户的需求定制检索结果,自动推送给用户。
(3)出现多种推送方式并存的局面,如:按用户类型分类,可采用同类用户的群体化推送及分层次、分人员素质需求的推送等;按内容分类,可采用个性化定题推送等。推送形式多种多样,包括网上期刊目次通报服务、网上专题热点服务、网上资源订阅服务和定题信息服务,并将检索结果通过邮件系统直接主动推送至用户桌面等。其推送模式应面向社会,面向大众,并运用电子商务系统向全国乃至世界拓展。
1.3 个性化网站
个性化网站是指那些为不同用户提供相应内容和服务的网站。个性化网站的功能应该保证在用户满意的时间内,以用户期望的方式,浏览准确、完备的信息。一般来说,个性化网站是通过个人或群体的定制实现的。个性化网站的定制包括风格定制和信息提取方式定制。
(1)风格定制是针对结构和内容的定制。结构定制是各个信息检索界面模块的布局形式,例如各模块在界面存放的位置,以及界面上的有关图像、菜单等位置的设置。系统应该能够提供若干基础模板供用户选择,并允许用户在各个模板的相应指定位置插入一定内容。内容定制是用户根据自己的爱好、兴趣选择自己所需的内容模块,如新闻、股票价格、天气等。
(2)信息提取方式定制则是针对浏览方法实现形式的定制,包括:①浏览表达式定制。用户可自定义默认的检索方式是简单还是复杂方式,自定义布尔检索式中“与”、“或”、“非”的表示符号,系统还可为用户记录最近的特定数量的检索提问,以供用户选择。②个人词表定制。允许用户写入常用词汇的自定义规范词、同义词、近义词等,当用户使用到该常用词时,系统可根据 个人词表调用相应词汇优化结果。③浏览结果分析定制。用户可根据个人需要对所需信息的专业、深度、语言、地域、数量、时域等进行定制,从而对检索结果进行再次分析,限制检索条件。④浏览结果处理定制。可对检索结果的相关度计算方式、输出格式、排序方式、重合记录的处理方式、下载格式、传送地址等进行定制。
目前,一般个性化网站的查找对象仅为静态HTML页面,不能提供较完善的交互,而且网站后台数据库信息资源缺乏,即使是大型的网站也都要借助一些专门的搜索引擎来查询信息。未来个性化网站应向更加深入的方向发展,使网站扩展为真正的个人信息源。网站服务可以从生成动态页面的后台数据库提取信息,使用户通过风格定制的内容更加丰富,更具动态性、交互性,实现多种格式的提取。个性化网站信息内容包括许多个人业务处理,与新闻、娱乐、通讯等其他行业紧密合作,创造出一个全面、主动的信息服务空间。在信息提取方面,应综合运用计算机人工智能、数据挖掘、分布式数据处理、自然语言处理、数据库管理等技术,分析用户提交的信息请求,针对网站信息的大容量、异构性、分布性和动态性等特点,尽量透明地为用户提供精确的查询结果。未来的个性化服务网站将成为 种深入到用户个人生活和工作各个层面的辅助性工具。
2 个性化信息服务的原则
我们提出的个性化信息服务是以用户服务工作为基础的,因此,除原有信息服务的普遍原则外,还要遵循以下几方面服务原则:
2.1 体现以人为本的服务理念
传统信息服务的管理思想是以信息量为本,虽然“用户第一”的服务理念已提倡多年,实际上多半停留在口号上,并未落到实处。个性化信息服务要体现“用户第一”的服务理念,必须改变以信息量为本、以数据库为本的管理思想,做到以人为本,以用户服务的质量、水平和深度来评估信息服务的业绩,一切从方便用户出发,减少对用户的限制。
2.2 加强隐私保密
为了更好地开展个性化信息服务,用户的个人信息是不可缺少的,这就涉及到了用户的隐私问题。不能因为隐私问题的存在,就限制使用用户个人信息。个性化信息服务应该使用户相信其个人信息不会被滥用。同时,要鼓励用户积极提供个人信息,形成良性循环。
2.3 重视版权保护
由于信息服务为用户提供了信息下载服务,因而产生了版权问题。有关网上知识产权保护问题的讨论已经很多,相信不久会有正式的法律法规出台。目前,可暂时采用以下方法来解决:一是网络只提供部分下载功能,如UMI提供的硕士、博士论文只能从网上下载其摘要或部分文章内容。二是利用先进的信息技术加以控制,如模仿软件推销商,允许用户通过专门软件下载图文,但过了某一时限或超过限定的使用次数,则下载的文本就无法阅读。
个性化信息服务的出现,不仅革新了观念,而且改变了传统信息服务模式,伴随智能化技术的进展,个性化信息服务将会有更加广阔的发展前景。对用户而言,个性化信息服务节约了操作时间i对于服务提供商而言,提高了服务质量,吸引了更多的用户。随着现代化技术的迅猛发展,如何提供优质的个性化信息服务已成为人们共同关注的焦点。