基于审计知识库的文本关联分析研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:shamobingshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着政府部门政务信息化程度的进一步提升,大量的信息开始以电子数据的形式存储起来,并被信息系统统一管理。但大量的文本信息仍以文档的形式被使用,文档中大部分的信息未能被深入使用。本文以国家社会保险审计工作的实际需要为出发点,深入研究社会保险领域文本信息知识发现的途径。本文首先研究了国内外数据挖掘领域关联规则挖掘的研究成果,总结了文本关联分析方法的一般过程。其次,针对文本数据的非结构化的特点,分析在处理文本数据中存在的困难和问题,并就文本预处理工作中的方法进行了讨论。再次,在文本预处理的基础之上,讨论文本特征化表示结构上的关联分析的方法,以及结合审计知识库的语义关系特点,提出基于审计知识库的文本关联分析方法。最后分析了文本关联规则在审计领域中的应用。基于社会基本养老保险的相关文本数据,对本文中提出的文本关联分析策略的实际效果进行验证,基于审计知识库的文本关联分析系统具备了领域内的适用性。
其他文献
近年来,社区问答门户网站作为新兴的一种知识共享平台给问答系统带来了新的契机,为问答系统提供大量可用的问句及相应的答案信息。因其具有的交互性和开放性的特点,使它能够很好
建筑交易信息平台是保障建筑市场公平、公开开展交易活动的基本条件,原有的软件系统已不能满足管理中心日益发展的需求,迫切需要开发具有扩展性强、配置方便和服务质量高等特点
现阶段,联网审计在解决因数据量迅速膨胀带来的审计难题方面表现出了很大的优势,且极大地削减了审计成本,因此,在较短的时间内得到迅速推广,逐步取代了传统的审计手段。但是其仍然
饮食习惯健康与否与人们的日常生活息息相关,随着医疗水平与科技水平的不断发展,人们越来越关注健康问题。移动医疗也在这样的情境下应运而生,对生活音信号进行监测,不仅能够对饮
地震灾害是人类面临的最严重的自然灾害和世界上最重要的科学挑战之一。长久以来,人类对地震预报的研究投入了巨大的努力,给予了极大的关注。自20世纪中期以来,世界上许多相关学
随着信息技术的不断发展,传统的对社会保障的人工审计已经不能满足现阶段的审计需求,因此,利用计算机进行审计工作成为了一种有效的方法。在利用计算机进行社保审计时,第一步需要
作为新兴的安全访问策略,RBAC由于具有模型清晰、扩展性大、稳定性高、易于应用等优点,被越来越多的研究者所关注,其研究范围也不断扩大并被越来越广泛的应用于各个领域来减少管
E-Learning(Electronic Learning),又被称为网络化、数字化学习,是一种新的教育方式,学生可以通过互联网进行快速有效、探索、延伸性的学习。WebQuest教学模式是E-Learning教育方
大力发展奶牛畜牧业可以在很大程度上促进我国的经济发展。因为牛奶食品有很高的营养价值,它含有120种人们所需要的营养成分,含20多种氨基酸和20多种矿物质及多种维生素。因
三点相关函数是天文学中主要的宇宙模拟算法之一,如何对其进行高效的计算一直是困扰天文学家的难题之一。本文基于对FFT三点相关算法的研究,为改进该算法计算精度不足和面对海