论文部分内容阅读
随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注的热点,促进了文本处理领域的形成和发展。自动收集和整理所需要的各类信息成为信息产业面临新的挑战和新的发展契机,而信息检索技术是解决这些问题的关键。根据不同的应用背景和不同的使用目的,信息检索技术已经演化为信息检索、信息过滤、信息分类、文本摘要,和问题回答等方向。 由于信息主要是以文本形式表示,本文主要讨论中文文本检索和相关应用的处理技术。文本检索主要研究的对象是大规模、非结构化的真实文本,进行文本分类、文本检索、文本过滤和文本摘要等方面处理,以满足用户的信息需求。 本文主要讨论的问题包括:提高文本检索效率的索引文件系统和提高系统精度的相关反馈技术等。 文本分类既可以作为独立应用系统,也可以作为检索系统的组件用以提高系统的效率。作者建议在检索系统中采用层次分类方法。