关键词自动标引系统的知识库建设

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:jinlu2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词对于文本聚类/分类、信息检索等任务都具有非常重要的意义。然而,其自动标引技术的实现离不开知识库的支持。本文首先列出了关键词自动标引系统的重要组成部分,并对知识库进行了详细介绍,并且列出了与一般专家系统知识库的区别。最后介绍了目前知识库的建立主要通过手工方法,也辅以半自动方法获取知识,知识库已经具备一定的规模。
其他文献
有监督的统计词义消歧方法需要大规模高质量的词义标注实例。词义标注的首要问题是确定词义标注集。基于翻译时源语中多义词被译成不同目标词的现象,一些学者建议采用异词汇化
本文研究与设计的人机对话管理器是面向2008年北京奥运会的多语言智能信息服务系统核心平台的一部分。混合主导的对话管理系统的关键问题是用户输入偏离所期望的对话顺序;而多
会议
自然语言生成是人机对话系统中的基本组成部分。其性能的优劣决定着对话系统应答的智能性和友好性。本文介绍了一种基于模板的自然语言生成方法,并将其应用于多语言智能信息服
本文给出了一个基于知识的Internet新闻信息自动识别、采集、过滤、索引的软件Agent系统KBAS,介绍了该系统的体系结构和功能,讨论了系统实现中涉及的新闻信息采集器、知识库、
随着网络信息的日益增加和广泛传播,口语对话系统已经为越来越多的研究者所关注。本文主要介绍了一个天气预报口语对话系统的设计与实现,该系统可以实现对国内外150个城市的天
对于一个概念来说,存在很多不同的解释,因此,解释说明一个概念的语义是非常重要的,为了得到模糊集合理论中联合的隶属函数,需要一定的定性解释,本文从两个方面讨论了模糊集合的语义
目前网上文本过滤多采用基于关键词匹配的文本分类技术,虽然简单、快捷,但效果并不理想。本文以全信息自然语言理解方法论为指导,采用统计(粗分——主题识别)和规则(细分——倾
随着信息时代的到来和网络的迅猛发展,具有增量学习功能的分类技术正逐渐成为当前信息的智能化发现和挖掘的关键技术之一。与传统的分类技术相比,增量学习分类技术的优越性在于
传统的文本信息抽取方法有两种:知识工程方法和自动训练方法。前者需要对领域知识很熟悉的知识工程师的参与,而且需要大量的工作来发现有用的规则(或模式):而后者的劣势在于需要
在计算机教学中,我经常运用比喻向学生讲解算法和理论。认识到比喻不仅是一种有效的教学方法,而且触及到思维的实质同时也足一种重要的思维方式。本文探讨了比喻与相似性,联想以