论文部分内容阅读
"语料检索"跟一般的信息检索不同,它是为语言学工作者服务的,主要关注语料文本的形式特征以及相关的语篇属性。不仅需要字符串检索,也需要更复杂的词语/词性模式检索。本文分析语料检索的特殊需要以及引起的数据存储、索引和查找问题,比较了倒排文件和射串数组两种存储结构在字符串检索方面的优劣,提出了"词语/词性模式"检索的概念,对射串数组作了一些改造,在统一的存储结构上实现了字符串检索和词语/词性模式检索的共存。