信息系统运行性能监控分析

来源 :中国电气工程学报 | 被引量 : 0次 | 上传用户:chaircat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】B/S架构等在当前应用系统方面的快速开发和普及,使得运营商的业务支持系统普遍采用了新的部署模式。此时,我们基于业务系统安全稳定的要求,需要分析影响业务系统运行的不同因素,展开性能监控与故障分析,从而了解到业务系统的后台运行状态,更好地完善及优化系统的整体性能及部署架构。
  【关键词】信息系统;运行性能;监控分析
  0.引言
  业务范围的扩张呈现出多元化的发展趋势,当前市场发展与服务发展从本质上看就是信息化程度的竞争,对于信息系统的整体性能提出了更高的要求。一般情况下,系统性能的降低往往伴随着其对业务发展产生的不利影响,我们也应该采取某些控制手段来对系统的性能进行监控和管理,重点针对可能出现的性能和技术问题进行改进,保障整体运行质量,有效控制和缩短系统的响应时间。
  1.当前信息系统运行性能的监控现状
  在系统管理的过程当中,基础设施的管理是最核心的内容之一,网络管理朝着服务管理的过渡过程当中,也需要良好的基础设施系统作为技术支持。在设计阶段我们应始终秉承这一目标,而在系统正式投入运行之后也应该及时发现并处理现有的、潜在的故障类型,也让不同的性能监控方式开始出现。
  一般情况下,在出现正式的监控软件之前,一直采取的都是分层次监控方案,在每个设备上运行不同的命令来获取自身的参数,以此为基础判断设备的具体运行状态,但该方案本身具有一定的局限性,该管理方案也需要大量的人力资源进行支持。后续网络技术的发展背景下设备监控开始分离,我们在一台设备上就可以实现对不同设备的远程管理调度,配合自动化监控功能的出现,采取了更加优化的管理模式。具体来看,数据信息通过网络集中在管理站之内,在后续处理的工作当中会运行现有的命令,采集到的数据信息也包括动态信息、静态信息,在日常的管理中也是最受关注的部分。
  但当前大数据背景之下,数据量与数据规模发生了显著改变,在当前的监控系统中也出现了门限告警的功能需求,在对参数进行设定之后,监控界面会呈现出告警情况的参数信息,采取不同的方式进行提醒。从软件界面分析,所有的参数都可以被平面化地进行展示。然而我们需要意识到某个参数所反映的问题可能是因为“类别”所导致,且实际的参数之间本身存在着一定的联系,多个参数同时报警也许只是因为单个故障所导致,而我们如果不能对后续参数展开进一步处理,那么在界面上反映出的情况也会造成对系统性能判断的失误,进而采取一些错误的控制手段,还会影响到系统的正常运行。
  另一方面,随着电力业务的不断增长,信息化系统的不断增加,促使了IT基础资源(服务器容量、應用程序、存储空间等等)的数量级飞速增长,企业的IT运维状况也变得越来越复杂。电力企业即使拥有专业的IT团队,但同样面临很大的困惑及挑战。例如:IT运维项目多,复杂,繁琐,以及频繁的大数据更新及分析等。
  2.应用运行性能监控模式
  应用性能运行监控是一个比较新的网络管理方向,主要指对企业的关键业务应用进行监测、优化,提高企业应用的可靠性和质量。Gartner在《应用性能监控魔力象限》分析报告指出IT运维管理日渐趋向于以应用为中心,大多数IT运维团队仍认为基础设施的管理工作(真实和虚拟服务器、网络和存储)是其主要业务,但他们已经认可,基础设施只有通过支持应用才能为企业带来价值。因此,在管理基础设施组件时,如果不考虑其对应用性能的影响,传统IT运维管理所投入的资金和工作也就很难说有什么现实意义了。
  为了适应及满足电力企业信息化快速发展的步伐,如何提高运维服务质量,将事后运维转变为事前预防是电力企业所面临的重大挑战。这势必要求提供一种及时高效的、主动式的获取到企业内部核心业务系统可用性及服务质量性能数据的技术手段。建立从基础设施到应用程序的全方位监控系统,实现核心业务系统服务质量的实时监控,在出现问题故障接到客户申报与投诉前,第一时间定位问题, 有效提高运维敏感度,力求及时发现故障进行处理并为优化应用程序提供性能数据支持,降低整体运维成本。
  应用运行性能监控是利用实时大数据处理及分析技术手段,进行数据分析发现和建立运维数据的联动关系模型;通过可视化、建模的方式,以多维视角直观的展示应用系统真实运行性能情况。一方面通过对应用运行过程的数据收集,发现版本间变化情况、应用架构及业务架构的一致性、性能优化、代码错误修复,明确版本的迭代过程的持续优化,对收敛性进行监控;另一方面对于应用系统在线运行实时数据分析在系统运行故障或容量限制之前发现问题进行数据监控,可有效预防和减少系统运行故障的发生。
  应用运行性能监控将传统的IT基础设施运维,转变为以系统、用户、业务等多维度的整体运行监控。包括了业务功能运行性能监控、功能访问量监控、功能可用性监控、故障/异常回溯分析、告警影响分析等内容,实现了以功能调用为视角,根据功能访问次数、成功/失败次数等指标实现对功能的访问量进行监控;根据功能调用的响应时长、错误信息、调用次数以及硬件资源和中间件资源的消耗情况等综合判断功能的可用性;业务功能发生故障/性能异常时,支持事后对故障的回溯,以便对故障产生的原因进行深度分析,包括堆栈、调用SQL等内容。同时,提供对发布前后应用程序执行效率和程序错误率的对比,能够评估不同版本应用程序的优化和改进的效果,以及快速发现和定位发布带来的问题和对用户的影响,这也为评判业务系统建设厂商KPI绩效提供真实有效的数据支撑。
  3.服务器运行性能监控模式
  系统出现的各类问题都可以通过基本的操作系统要求进行体现,包括对内存、CPU等使用情况展开监控和分析。我们需要掌握操作系统的更新情况和文件使用情况,包括用户权限与服务器硬件层面的性能指标监控,进入操作系统层面完成对设备信息的采集和监控[1]。
  3.1 CPU性能
  在系统中除了正常运行的线程之外还包括可能出现故障和例外的线程,作为一种异步事件,主要由I/O设备等产生。而软件的中断可以被视为是一种应用运行的手段,并不需要进行特别监控。硬件中断频率过高,且与底层关系较为密切,那么对于系统线程的正常运行也会产生影响,尤其是底层硬件出现技术故障时,硬件中断数量也会出现异常。   3.2 内存性能
   内存管理包含内容回收、分配等可执行的系统服务内容,处理硬件将检查到的虚业置入内存当中。在与工作集相关的参数研究过程中,考虑到系统工作集的特殊要求,如果内存不出现短缺,则之前使用过的内存和未来可能使用的内存将被保留;反之,内存出现短缺,部分内存会被释放。例如working set值在短时间内出现了明显下降趋势时,我们则可以判定内存出现了短缺现象。当然,在内存使用率过大的情况下,还应该分析系统内核是否占用了过大的内存,一般情况下这种情况出现较少,除非是系统本身添加了新的驱动内容。相反,内存空间未被内核数据过多占用,需根据实际情况评估是否出现内存锁定、内存泄露等,必要时进行程序控制保障系统的稳定运行[2]。
  3.3 磁盘系统性能
  以磁盘的工作状态来说,磁盘空闲空间分散,在空闲空间不足的前提下其服务时间会显著延长。并且在利用率过高时还可能成为整个运行系统的瓶颈内容。在CPU侧,如果CPU利用率的出现同时伴随着磁盘利用率过高的情况,那么我们也应该考虑是否有磁盘问题的产生。
  4.数据库性能监控模式
  按照数据库种类的差异,我们可以选择不同的监控方法与监控工具,但这些工作开展的前提在于我们充分了解服务器上的数据库部署情况,并且包括数据备份部署、占用空间、运行模式设置等,必要时还需采取监控手段来对数据库运行、系统资源利用、数据增长情况展开定期监控。例如通过数据字典了解其运行性能指标,分析性能状态后获取数据库配置的参数信息。当然,如果每个平台来源于多个供应商的解决方案,我们获取良好性能数据信息的难度会提升,此时可以借助行业内的数据库监控方案来简化性能监控与规划工作,改善现有的服务水平。
  数据库的性能受到多个方面的影响,除去操作系统的影响之外,参数设置、SQL语句等也是影响系统性能的主要因素。相比于一般的操作系统,数据库在性能监控和问题定位方面明显具备其特性,而衡量数据库性能的总体参数包括数据库的吞吐量、用户响应时间,其中这些数据出现报警时,就表明系统性能已经出现下降问题。而用户响应时间具有两个途径的改善方案,一是减少系统的服务时间,提升数据库的吞吐量;二是减少用户的等待时间,减少用户访问数据库时出现的冲突情况。数据库的多用户特征决定了数据库之内会有并发操作的出现,数据库也需要采取多種方式来实现对资源的互斥操作。然而某些特殊的操作需要等待之前操作完成后展开,但是随之而来的延迟问题与系统性能下降问题也需要纳入考虑范围之内。对于等待事件的监控,无疑也成为了当前数据库监控过程中的关键信息,同时还包括磁盘、文件争用基础上的数据分布调整[4]。
  5.结语
   通过对现有的IT系统不同层面的分析后,我们可以了解到不同基础设施的协同运行方案与业务服务支撑之间的关系,建立从硬件资产到软件资产完整的资产关系模型。而不同的监控技术在特定的环节下也与故障性能的敏感度之间存在必然联系,所以在未来的技术研究中,对于性能监控的标准划分也会更加复杂,但是这项工作如果能落实到位,不仅监控系统的效率可以得到提升,系统稳定性也可以得到保障,所以将对IT基础设施的监控与基础架构、应用性能进行融合,也是今后需要细化分析的部分。
  【参考文献】
  [1]方方, 胡健, 吴小志,等. 信息系统性能监测评估平台的研究与实现[J]. 微型电脑应用, 2014, 30(4):11-14.
  [2]梁飞. 信息系统应用性能管理(APM)系统在企业信息化中的作用[J]. 电子技术与软件工程, 2014(22):19-19.
  [3]张磊, 杨明杰, 王刚. 促进电力信息化业务稳定运行的性能优化机制研究[J]. 电力信息与通信技术, 2015, 13(8):15-19.
  [4]袁昊, 祝唯薇, 孙沛,等. 信息系统应用性能监控在电力系统的应用与实践[J]. 信息技术与信息化, 2017(11):58-60.
其他文献
一、案例经过  110kV某变电站35kV I母开关柜参数型号为KYN61A,生产厂家为吉林永大集团股份有限公司,出厂日期为2008年06月,投运日期为2009年9月。2018年7月9日,我公司检测人员在对110千伏某变电站35千伏开关柜带电检测时,发现35kV I段母线开关柜后中上部位均存在异常放电信号,超声波数据均超过注意值(检测数值在16dB-27dB),结果值均大于标准限值。2018年11
期刊
摘要:本篇文章浅要分析了近些年我国目前化工废水的相关特征与及处理现状,并且总结了当下化工行业对于化工废水的处理态度极其行业发展前景。指出化工生产企业在化工废水处理当中的不足之处,针对其中的不足之处,提出一些解决措施。从企业优势结合处理化工废水产生经济效益、重视化工废水预处理流程、重视化工废水处理的专业人才培养的几个角度出发,对化工废水做好综合防治工作,希望可以给有关的化工废水处理工作者一些启示。 
期刊
摘要:针对目前精密电子厂房诸如光纤厂房内用电负荷以及目前市场常见的几种无功功率补偿产品的特性,进行对比,选择最适合该生产厂房的无功补偿产品。  关键词:光纤厂房 无功补偿  一、光纤厂房中无功的来源  随着社会数据通信与多媒体业务需求的发展,全社会对通信传输载体有很大的需求,因此光纤光缆制造业飞速发展。光纤的制作即将制备好的光纤预制棒加热熔融后,拉制成直径符合要求的细小光纤纤维,同时为其涂上弹性涂
期刊
摘要:在我国国民经济发展过程中,电力供应显得尤为重要,随着现阶段电力体制改革的不断深入,我国电力企业整体市场化步伐明显加快。本文根据实际工作经验,对该研究项目的建设内容进行总结,并从验收及交付物要求、质量保证要求、项目团队要求、标准服务要求四方面,论述了CSGII南网营销管理系统V2.0云南V1.0个性化改造项目的具体要求。  关键词:营销管理;个性化;改造项目  前言:在南网营销管理系统建设过程
期刊
摘要:随着我国国家科学技术的迅速发展,4g移动技术覆盖的领域越来越多,为我国居民提供了更稳定的高速移动网络。但是,随着无线移动通信技术的迅猛发展,对无线移动通信基站的需求也越来越大。为了确保中国人民在使用移动网络时的稳定和均匀性,必须确保移动通信基站的性能符合中国人民日常使用的需要。因此,有效解决我国移动通信基站的管理和维护问题,为我国居民建立更快、更稳定的无线移动网络,是网络运营商必须解决的主要
期刊
摘要:我国经济快速发展,电力行业竞争激烈,在该行业占有一席之地十分艰难,这对电力企业来说是机遇,也是挑战。所以,电力企业可以从提高管理工作质量入手,管理渗透到电力企业的各个方面,例如:配电专业、营销部、电力系统等等,做好电力行业营销业扩现场的安全管理有助于电力营销工作的顺利开展,提高客户的满意度。  关键词:电力工程;营销业扩;现场安全;管理对策。  1电力营销业扩现场安全管控模式的应用价值  1
期刊
摘要:随着我国科技水平的提升,我国电弧炉炼钢技术取得了很大的进步和发展。电弧炉是冶金工业的重要熔炼设备,电能消耗非常大,在企业生产成本中所占比例相当高。因此,如何降低电弧炉炼钢的电能消耗,以最小的能耗取得最大的经济效益,一直是冶金工作者的一项重要任务。本文就铸钢电弧炉炼钢节电的途径展开探讨。  关键词:铸钢;电弧炉炼钢;节电;途径  引言  炼钢电弧炉是消耗电能很大的设备,人称“电老虎”。如何发挥
期刊
摘要:随着移动通信技术的不断成熟,基站的安全持续运营成为技术人员考虑的首要问题。由于其系统的安装位置较高,且周围较为空旷,极易受雷电的袭击,带来不可避免的经济损失。对此,通过防雷检测技术的实施可有效避免雷击率,維护正常的移动通信业务。基于此,以下对移动通讯基站防雷检测技术及实施要点进行了探讨,以供参考。  关键词:移动通讯;基站防雷检测技术;实施要点  前言:  经过几十年的发展,我国移动通信从第
期刊
【摘要】输电线路走廊的三维重建,主要是将输电线路的走廊以真实的三维场景仿真模拟,并保障场景能够交互、能够量测,为输电线路的选择、施工管理、运维检修等提供准确的数据支撑与技术。而在线路走廊的三维重建过程中,传统测量技术很难保障三维重建质量,直接影响了输电线路走廊的后续建设与运维。对此,积极引进倾斜摄影测量技术,推动走廊三维模型的自动化、高精度构建,充分发挥三维重建的目的。  【关键词】倾斜摄影测量;
期刊
摘要:随着新能源行业的快速发展,近年来,业内人士提出通过无人机搭载高清摄像头或红外热像仪对抽水蓄能电站进行监测的方法。该新兴方法或基于集群通信,可以高质量、快速地检测到抽水蓄能组件的热斑、遮挡、隐裂等问题;但是由于整个巡检系统复杂、投入大,对运维人员的专业技能要求高,较适合在超大规模抽水蓄能电站中使用,目前在绝大多数电站中还少有运用;有的巡检系统还存在自动化程度不高的情况。对于中、大规模电站而言,
期刊