论文部分内容阅读
在人类进入21世纪的今天,科学技术日新月异,知识经济初见端倪,社会对劳动者提出了更高的要求。素质教育和终身教育成为在未来社会中生存的一种必需,并体现出大众化、终身化和个性化的特点。这就要求教育提供大覆盖面、多方式、全方位的服务,保证任何人、任何时间、在任何地方可以接受所需的教育,获取所需的知识。随着网络技术的发展,网络教育为上述需求提供了一种很好的解决方案,正在成为学校和公众教育的重要模式。科技馆作为青少年的教育基地,担负着普及科学知识,为青少年提供教育的重任。但是由于地理位置、资金、场馆条件等各种客观原因,其科普的作用受到了一定的限制。因此,立足现有科技馆的资源,利用网络技术,建立数字科技馆,开发网上展品和其它多媒体内容,建设一个面向全社会的网上科技馆,提供方便快捷的网络教育服务,势在必行。数字科技馆作为一个重要的网络科普平台,提供对信息的检索功能必不可少。目前,一般的数字科技馆系统大多是较大型的网站,只提供简单查询、组合查询以及模糊查询等操作,很少提供对已有的其他网站的相关知识的统一检索。用户需要将自己需求表达成一个个关键字,计算机系统再根据这些关键字才能比较容易的在数据库中进行查找操作。为此,本文结合山东省科技馆正在研发的“山东省数字科技馆”系统的需求,主要是采用搜索引擎、自然语言查询、摘要生成等技术,重点研究开发一个面向数字科技馆的中文信息检索子系统。通过该系统,人们可以通过使用自然语言,方便准确地获取数字科技馆中的科普信息,同时在杂乱无章的网络世界中快速、准确地获得自己需要的信息。概括地说,针对数字科技馆的需求与特点,本文主要做了如下工作;1)研究设计了面向数字科技馆的中文信息检索子系统的系统架构。2)设计实现了面向数字科技馆的受限自然语言理解与数据库查询子模块,给出了符合数字科技馆需求的受限汉语的文法和规则,定义了相关的数据词典。3)利用搜索引擎、摘要自动生成技术,设计实现了互连网信息查询子模块,可在网络上快速准确地查找相关的信息,并给出信息的摘要。本系统检索的信息目前仅包含恐龙的相关知识,以后希望可以扩展到多个方面。当然,系统本身仍存在不完善的地方,如受限自然语言的歧义性,搜索结果的准确性等,这都将是下一步工作的方向。