论文部分内容阅读
年鉴中有很多关于数值知识元的描述,如何把这些知识元抽取出来是细粒度知识组织的重要研究内容之一。本文通过对中国信息年鉴进行内容分析,把数值知识元分为引用型、比率型、总结型、时间型、排名型、对比型和消息型七种类型。对年鉴中包含数值的句子进行抽取,过滤句子中的其他不相关词后形成句子的线性描述结构,在此基础上经过人工审核与合并归类,形成数值知识元的描述规则,为后续知识元抽取提供支撑.