【摘 要】
:
互联网时代下最明显的特征就是信息数量的增加,信息数量的增加导致信息获取的过程更加困难。传统方法实现的信息检索是一种以部分代替整体的技术,而在很多情况下部分是无法代
论文部分内容阅读
互联网时代下最明显的特征就是信息数量的增加,信息数量的增加导致信息获取的过程更加困难。传统方法实现的信息检索是一种以部分代替整体的技术,而在很多情况下部分是无法代替整体意图的,从而导致这种检索技术的效果非常差,人们急需一种效果更好的检索技术,这时语义检索出现了。应某电气公司的需求,设计并实现了一个支持语义查询的报表系统。该报表系统具有报表设计和产生、个性化推荐、权限管理、语义检索等功能。其中着重介绍了语义检索模块的设计和实现,以实现对系统中存在的大量报表进行语义检索,让用户快速找到自己想要的报表信息。为了实现语义查询,首先从报表创建工具BIRT中提取出报表领域的术语及术语之间的关系,使用Protege建立报表领域本体,并使用知网创建了报表领域的语义知识库。对于报表文件首先要提取出参数和列名信息,然后根据报表本体,使用Jena解析器对本体进行操作和语义扩展,利用Lucene自带的索引功能建立参数和语义信息两个字段的索引结构。对于用户输入的查询语句,首先使用语言云处理平台(LTP)对其进行分词和词性标注,从分词和词性标注结果中提取出用户对报表的检索条件,然后对检索条件和用户输入的语句根据报表本体使用Jena进行同义词扩展和语义扩展。对于提取到的检索条件使用Lucene自带的查询功能对索引结构中建立的参数字段进行精确匹配。对于语义扩展结果则使用Lucene自带的查询功能对检索结构中建立的语义字段进行模糊查询,最后整合两个查询条件得到最终的查询结果。实验阶段,展示了报表领域的语义知识库、创建的报表本体以及语义匹配的检索系统。对比基于关键词匹配的查询系统查询结果和本文实现的语义查询系统查询结果,统计查准率和查全率,并作出散点图,表明本文实现的基于本体的检索系统比基于关键词匹配的检索系统更加适合某电气公司的要求。
其他文献
目的:本课题拟对早期肝癌患者中mir-19和mir-185这两个分子标记物的可靠性及应用价值进一步研究。同时比较不同转移潜能肝癌细胞系中mir-19和mir-185的表达变化,探讨mir-19在
当前,世界各国都开始重新重视制造业,我国也通过制定“中国制造2025”再次凸显了制造业在我国经济发展中的重要性。但是随着我国用工成本的升高与资源保护力度的加强,我国制造业一些原本具有的优势不再突出。这种情况下,制造业的转型发展就显得尤为重要。而它又与其他行业的发展特别是生产性服务业的发展密不可分。由于FDI可以带来资本与技术,生产性服务业FDI能够形成技术溢出效应,促进技术进步,提高技术效率,进而
通过枞酸与顺酐的加成反应得到马来海松酸酐(MPA),MPA与ZnO成盐反应得到马来海松酸锌(MPAZn),通过静态热稳定性测试和动态融合流变分析研究了MPAZn在PVC材料中的热稳定作用。
高位ADC的测试中,对输入信号的质量要求较高,一般的混合信号测试系统难以达到要求。论文提出了一种基于电流积分法的高位ADC典型静态参数测试方法,充分利用了聚丙烯电容在积
黄连素含铜废水产生于黄连素生产过程中的脱铜反应环节,每天的废水产生量为30 t。脱铜反应是盐酸缩合物与乙二醛和无水氯化铜经过环合反应生成黄连素铜盐,黄连素铜盐在盐酸的
目的:食管癌术后生存率以及生活质量受多方面因素影响,如年龄、术前心肺功能、手术切口选择、消化道重建方式、临床分期、术后并发症、术后化疗、饮食营养与精神因素等,本文
为研究红掌根部浸提液和红掌种植水对铜绿微囊藻生长的化感抑制作用,考察了红掌根添加量(以ρ计)分别为0、0.5、1.0、2.0、3.0、4.0 g/L及红掌种植水对铜绿微囊藻生长的抑制
随着世界性行政管理改革浪潮,我国也开始在公共管理领域进行创新和改革。在公共财政制度中,政府会计制度是其重要组成部分,与其他财政制度执行结果有直接联系,在深化我国公共
随时社会的发展,育条件也在不断提高,提供给学生的硬件设施也在逐步完善,微机室就是其中一项,学生通过在微机室的具体实验操作,达到对知识的全面掌握,特别是职业技术学院,更