基于语义的金融企业非结构化信息检索系统研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：yogonet

【摘要】

：

随着金融行业自身信息化水平的不断提高,越来越多的金融业务以信息化方式提供着监管与服务。在这些业务数据中存在着大量非结构化信息,如何快速的从海量的非结构化数据信息中

【作者】

：

陈斌

【出处】

：

上海交通大学

【发表日期】

：

2011年期

【关键词】

：

非结构化信息本体技术 UIMA 全文检索语义检索金融企业

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着金融行业自身信息化水平的不断提高,越来越多的金融业务以信息化方式提供着监管与服务。在这些业务数据中存在着大量非结构化信息,如何快速的从海量的非结构化数据信息中获取有价值的内容并加以应用是金融企业在信息管理中面临的问题。传统的全文检索技术虽然能够满足根据关键字快速查找匹配资料的需求,但存在以下缺点:无法完成具有异源异构特性的非结构化信息数据整合;无法根据查询要求对需求的信息进行语义分析与推理;在检索结果中存在过多的无价值与不相关信息。为了解决这些问题,本文在非结构化信息管理架构UIMA(Unstructured Information Management Architecture)规范和全文检索技术的基础之上,提出了一种基于语义的非结构化信息检索方法。该方法首先对金融企业异源异构的非结构化信息数据源进行整合,并通过内容管理系统CMS(Content Management System)对信息资源进行统一管理。然后利用可扩展的UIMA框架实现对这些非结构化金融信息资源的数据获取与扩展化数据分析,并应用Lucene索引技术实现对数据内容和分析结果的序列化索引。在信息检索中,该方法在传统搜索模型的基础上,引入本体概念,提出了一种基于领域本体的检索模型,通过构建基于OWL(Web Ontology Language)标准的金融领域本体库实现基于语义的信息检索。以基于语义的非结构化信息检索方法为依据,本文提出了基于语义的金融企业非结构化信息检索系统设计方案,根据该方案设计与实现了一个应用系统FUIRS(Financial Unstructured Information Retrieval System)。FUIRS由非结构化信息内容管理子系统、分析子系统、内容索引子系统、关联检索子系统四部分组成。内容管理子系统负责对金融企业异源异构数据的整合与管理。分析子系统负责获取内容管理子系统中的数据信息并实现可扩展的数据分析。内容索引子系统负责对数据进行索引与存储。关联检索子系统负责基于语义的信息检索,并提供用户访问的可交互搜索平台。通过FUIRS系统,金融企业能够有效的整合非结构化信息资源,实现业务数据的内容分析应用,并通过本体技术为金融企业用户提供高效的数据检索服务。本文通过单元测试、性能测试两种方法对FUIRS的核心功能模块与系统运行性能进行了测试,同时根据其特点在应用案例中对FUIRS的信息检索功能进行了数据验证,结果表明基于语义的金融企业非结构化信息检索系统设计方案在实践中是可行并有效的。与传统的全文检索系统相比,FUIRS系统具有以下特点:实现了对非结构化数据源的有效整合与内容获取;基于金融企业特点构建,支持业务数据内容的扩展化数据分析与应用;使用基于OWL标准的本体技术,在检索中支持语义分析与推理功能,使得用户能够获得更全面、准确的信息。

其他文献

PPP模式下城市污水处理风险管理

城市污水处理利国利民、造福自然,是公益性质的,且项目周期长、涉及因素复杂。因此需要积极引入社会资本,实现多元化投资管理,以发挥各方所长。但是城市污水处理的特性导致其

期刊

风险管理城市污水处理PPP

健身房减肥女性能量消耗与形态学指标的相关研究

通过最先进的心率表芬兰Polar S810对在健身房参加减肥的女性测试其跳操过程中的能量消耗,找出健身操活动能量消耗与其形态指标的关系,从而为健身人员在制定有氧健身处方时提

期刊

能量消耗形态学

来自窑洞的建筑智慧——建筑系教授吴思融

香港中文大学建筑系教授吴恩融在甘肃省东部的毛寺村做了个实验:利用当地的材料与人力,首次建造一所"生态实验小学",而实验结果是,当地学生刚于新校舍度过了内地历年来风雪最

期刊

建筑系香港中文大学洗手间生态建筑

谈谈内蒙古农村公共管理工作

内蒙古自治区农村正处在社会经济发展的关键时期 ,人民的生活还有待于进一步提高。农村怎样更好地适应改革发展的需要 ,提高生产、生活的水平 ,必须改善农村公共管理环境 ,农

期刊

农村农民公共管理

基于Word2Vec和HowNet的情感词典构建方法

基于情感词典对文本进行情感倾向分析是一种行之有效的途径,提出一种基于Word2Vec和HowNet构建情感词典的方法。该方法首先利用Word2Vec训练语料得到词向量进而获得与候选词

期刊

情感词典情感倾向分析Word2VecHowNet

教师教育观念形成的社会学解读

教师教育观念作为教师个体成长的"伴生物",是教师文化的核心构成元素,具有稳定性和可塑性。依据结构功能理论,教师身处和谐社会体系之中,其行为不可避免地受到体系结构的规约

期刊

教师教育观念社会学解读结构功能理论社会冲突理论符号互动理论

山区高速公路预制拼装式涵洞施工技术研究

山区高速公路地形地质条件复杂,传统的混凝土涵洞施工由于狭窄的地形和复杂的施工条件不利于工程质量的控制,同时也会导致工期的延长和施工成本的增加。本文结合工程案例,介

期刊

预制拼装涵洞山区高速公路施工条件

中职数学课与专业课情境教学结合——以幼师专业为例

中职数学课是一门文化基础课,中职学前教育专业学生存在对数学毫无兴趣,基础差及重视专业课而轻视基础文化课、理论与实际脱离等一系列问题,尤其学前教育专业的学生大部分为

期刊

中职数学专业课情境教学幼师

经济发达三线城市停车发展政策

随着经济发达的三线城市城市化与机动化的快速发展,停车难问题日益突出,甚至赶超一线城市,主要原因是没认清停车问题产生的根源,仅靠增加停车泊位的传统做法已行不通。从经济

会议

停车问题发展经验停车政策三线城市

基因检测在肿瘤免疫检查点抑制剂应用中的研究进展

以程序性死亡因子及其配体(PD-1/PD-L1)抑制剂为代表的免疫检查点抑制剂在恶性肿瘤治疗中取得了突破性进展,为癌症患者的治疗带来了新的希望。由于免疫系统与肿瘤细胞相互作

期刊

肿瘤免疫检查点抑制剂基因检测

基于语义的金融企业非结构化信息检索系统研究

其他学术论文