海量电子发票归集管理系统设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hzfjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球向数字化信息时代的转变,各行各业都掀起了一场数字化浪潮,尤其是我国电子商务和电子支付的迅猛发展,使得企业在财务报销和税务管理方式上发生了深刻的变化。面对电子发票开具量的急剧增加,分布式存储架构成为支撑电子发票管理、查询和维护的首选方案。然而,在构建高效、便捷、快速的电子发票服务系统的同时,分布式架构的数据管理性能、非关键字查询效率和数据有效性查验等方面依然存在诸多不足,因此还需寻找并研究高效的电子发票管理方案,提供实时的数据管理和数据查询能力。电子发票管理系统的构建面临着以下挑战:首先,系统的查询功能只支持发票关键字快速索引,这导致电子发票的非关键字查询请求效率低下,难以满足数据实时响应的查询需求;其次,系统存在数据未被存储导致请求无效的问题,无效数据执行整个请求流程会造成不必要的系统访问开销,影响系统处理效率。本文针对上述问题,分别从发票非关键字查询和无效数据预处理两个方面对系统进行优化,设计了海量电子发票归集管理系统,提取发票的要素信息,实现发票关键字快速归集,同时过滤无效访问请求,提升整体的查询效率。具体的研究内容和贡献如下:(1)针对现有电子发票管理系统非关键字查询难的问题,为满足电子发票快速访问的需求,本文设计了一种基于非关键字查询的电子发票归集方法,提取已存储的发票要素和关键字信息,采用散列算法哈希后存储于归集数据库中,为发票要素查询提供关键字索引功能,避免全局搜索的低效查询过程。同时,该方法对发票关键字分类获取,实现同一特征的发票关键字统一归集,减少数据分散造成的系统开销,提升非关键字查询请求的即时性。(2)针对系统存在无效数据访问请求,并且造成整体检索效率降低的问题,需要对传输数据做预处理操作,判断访问请求的有效性。本文设计了一种基于改进布谷鸟过滤器(Cuckoo Filter,CF)的数据过滤机制,在数据流转之前过滤系统不存在的访问请求,并且支持动态添加和删除元素。该方案结合了负载均衡和去重技术,降低过滤器的哈希碰撞率,同时,选择最佳平衡的参数配置设计过滤器的结构表,使得系统空间开销和查找假阳性最低。综上,本文基于上述两个方案实现了海量电子发票归集管理系统,并在实验环境下对该系统进行了性能测试,将提出的方案与现有电子发票管理系统的访问时延和系统开销进行对比分析,该系统能够显著降低非关键字查询和无效访问请求的响应时间,提升查询的性能,证明了该方案的可行性。
其他文献
随着计算机和互联网技术的飞速发展,越来越多的民众选择在社交媒体上撰写评论,表达自己的观点和看法。微博、脸书、推特等互联网平台每天都会产生海量的文本数据,挖掘并分析这些文本数据的潜在情感倾向,对于辅助政府、企业等团体机构进行舆情掌控及决策有着重要的价值。情感分析技术的核心在于情感分类模型的构建,传统方法是以情感词典或机器学习算法为基础来构建模型。基于词典的情感分析方法存在着情感词典构建难度大,泛化能
学位
利用2020年贵州省安顺站大气电场仪和地面气象要素观测资料,在分析该地区大气电场时间演变特征的基础上,分类讨论了晴天、降雪、强雷暴等天气类型下大气电场与同期气象要素的关系。结果表明:安顺站大气电场全年日变化均为正,夏半年、冬半年和全年平均三者日变化基本一致,在午后到傍晚较低,其数值在夏半年明显弱于冬半年和全年平均。月变化整体呈减弱趋势,其中6~7月有明显的跃升;晴天,大气电场平均强度介于0.15~
期刊
中国制造2025背景下电子工业技术快速发展,其产品自动化生产和封装技术都相对比较成熟。但由于生产过程中的诸多因素,导致产品外观时常出现划痕、斑痕、压痕等外观缺陷,严重影响产品质量。而目前外观缺陷检测仍以人工检测为主,其检测效率低,准确度不稳定,且人力成本高,这些都严重影响产品产量。基于计算机视觉和人工智能技术的外观缺陷检测技术也逐渐发展起来。但传统图像处理方法对图像特征的表征相对比较低级,而且容易
学位
数字孪生(Digital Twin,DT)是联系物理现实和数字虚拟的关键桥梁,随着人类社会方方面面日益数字化、虚拟化,数字孪生技术应用也正在快速发展。数字孪生网络(Digital Twin Network,DTN)是一种新兴网络,它利用数字孪生技术为物理对象创建虚拟孪生节点,由孪生节点扩展形成对等网络。DTN通过DT建模、通信、计算以及数据处理技术实现物理空间与虚拟空间的协同进化,这有助于提高建模
学位
随着智能手机和移动网络的发展,伴随着App功能的丰富,人们的生活越来越离不开智能手机。基于数据保密的要求,App通常采用加密的手段对数据、用户信息进行保护。同时,客户端与服务端的数据通信也离不开加密。虽然加密算法是公开的,但加密时明文的组成则不尽相同。为了保护明文的组成形式,许多开发者都在.so文件中实现核心代码。因此,对于.so文件的保护就显得尤为重要。保护.so文件的方式之一就是加固。UPX是
学位
应用程序的功能越来越丰富,但用户常用的功能只占其中的一小部分,冗余功能的代码会扩大应用程序的攻击面。程序裁剪技术通过程序分析识别并删除程序中的冗余代码,能够防止攻击者利用冗余代码中的漏洞,减小程序的攻击面。现有程序裁剪技术分为二进制裁剪技术和源代码裁剪技术两类,本文研究基于二进制的裁剪技术。现有主流二进制裁剪框架采用执行轨迹收集和启发式控制流路径发现相结合的方式确定合法控制流图,实现二进制裁剪。但
学位
随着信息技术的不断发展,智能建筑、智慧城市已经成为如今一个重要的发展目标,指针式仪表由机械结构构成,其结构简单,不受各种温度、压力、电磁干扰等因素的影响,造价便宜且相比于电子仪表更加稳定可靠,目前仍大量应用于存储运输、化工、燃油煤矿、电气、水利等领域的设备测量监控中,由于这些仪表工作场景条件复杂,使用人工进行巡检看护效率低成本高,难以适应如今信息化的现代生活需求。近些年来设备性能的改善及深度学习技
学位
安全协议也被称之为密码学协议,它的目标是通过应用密码学基件在不安全的网络环境中提供安全的通信服务。安全协议的海量、复杂、易错等特点,导致协议安全性自动化分析的需求与日俱增。CPN Tools(Colored Petri Net,CPN)是一种基于模型检测的协议自动化分析工具,作为模型检测的代表性方法之一,因具备并发分布式系统建模的能力且集成了大量强有力的自动化计算工具,在协议自动化分析领域具有很好
学位
区块链技术具有不可篡改、公开透明和分布式等特点,被认为是构建未来“信任互联网”的重要支撑性技术,拥有广泛的应用前景。然而,区块链技术为传统行业带来新机遇的同时,也不可避免的面临一些问题与挑战,引起了学术界和工业界的广泛关注。首先,随着区块链落地应用规模的扩大,数据量与日俱增,目前区块链系统查询类型单一,查询效率较低,不能满足人们日益增长的查询需求。其次,区块链轻客户端依赖于完整节点执行查询操作,但
学位
自从2008年区块链问世以来,区块链在金融和数字货币、社会治理、数据存证与溯源、游戏和教育等多个领域行业的探索创新与应用不断地推进,呈现百家争鸣的盛况。然而区块链种类繁多,实现方案参差不齐,使得区块链系统之间的存在明显的异构化问题,区块链之间互联的难度也大大提高。另外其安全措施、共识算法和隐私保护等安全措施的差异性,导致了区块链系统安全性差异较大,区块链间的互通难、互信难的问题日益突出,形成了区块
学位