论文部分内容阅读
“7·23”事故初步调查报告指出,“信号设备遭雷击发生故障后,本应显示为红灯的区间信号机错误显示为绿灯。”这也就基本认定雷击问题是造成723动车事故的直接原因之一。这是一个非常不幸的现实,因为电子设备的雷击问题,在现有国际标准框架内是完全可以事前避免的。欧盟的电子产品安全标准(CE标准),就包含了雷击测试的项目。任何正规手机要在欧洲销售,都必须通过雷击测试。在开发过程中,我们必须仿真雷击用1干伏高压冲击手机电源,冲击之后所有功能都要恢复正常才算通过。与正规手机开发形成鲜明对比的是,山寨手机是不会做这些标准化测试认证的,背后的原因一是为了省成本,二是为了赶进度。
动车沿线的电子设备,不是要出口到欧洲的消费类电子产品,欧洲人不会来要求我们做强制性的CE认证,但这并不意味着这些电子设备就没有安全方面的要求。事实上,由于这些设备要24小时全天候工作,而且是直接关联高铁动车的安全运行,像CE之类的电子设备安全标准认证应该是对动车沿线电子设备的最低要求,而不是最高标准。
电子产品安全标准的背后,常常是一个个血淋淋的教训,在国际上也是一个长期的积累过程。围绕这些标准而建立起来的测试流程、测试手段,和测试标准现在都已经比较成熟。从这个角度讲,强制性要求高铁和动车沿线电子设备通过国际上通用的安全标准认证,就直接借鉴和利用了其他国家长期以来的经验教训。另一方面,像CE之类的国际安全标准认证,必须经由专门的第三方认证机构和公司来实施,这也保证了认证过程的权威性和可靠性。这在设备制造厂家(通常是铁道部关联企业)和设备使用方(铁路局)之间通常存在千丝万缕联系的现实情况下,显得尤其必要。铁道部作为国家监管机构,在7·23”事故后,有必要有责任强制性要求高铁和动车沿线电子设备通过国际上通用的安全标准认证。
而在“7·23”事故后,在网传的安路生局长讲话中,专门提到要“厂家技术主管人员驻段,驻所包保”。产品销售后,厂家一般有专门技术支持人员负责维护,只有严重和紧急的问题才由技术主管到现场解决。但一是不可能有那么多技术主管,二是现场未必有适当的调试工具。安路生要求由厂家技术主管作一线技术支持,可见现场问题繁多而且紧急。这样做,只能是应付一时的政治需要,厂家现在会配合,但不可能长久。
正确的途径应该是厂家的产品在没有严格模拟测试之前,不能出货。设备使用方有权力要求厂家提供原始测试记录。厂家产品的设计要包含实时诊断和记录模块。在现场使用时,铁道部作为设备使用方,要有途径实时反馈诊断和记录信息给厂方,故障和错误的记录要有追踪系统。厂家的现场技术支持还是不可少的,但把技术主管抓去当技术支持,重视是重视了,可这样做实际上会延缓产品故障和错误的修复速度和效率。毕竟对每个产品,真正懂而且能解决问题的人并不多。
应该建立的是一个高铁和动车运行的全路故障跟踪系统。这个系统要能录入各小系统设备的诊断和记录数据。当小故障发生时,当班人员要输入发生时的前后步骤和设备本身的记录数据。各个路局要分享这些数据。厂家可以在线访问和跟踪他们自己的那部分。对故障的跟踪要直到故障修复为止,故障最终原因和解决方案也必须有记录。
建立全路范围(或者至少是铁路局范围内)的高铁和动车故障跟踪系统的一大好处,是可以通过实时统计小故障和小系统设备之间的关系,提前预警大故障和相关薄弱环节。同时,通过对子系统故障率和误报率的量化,还可以让调度人员和高层管理人员对高铁和动车的运行健康有定量的认识。
简单说来,高铁技术创新要尊重产品技术支持的一般性规律。设备安全的第一关是厂家自身的模拟测试,厂家不能把运行现场当测试场。同时,设备现场运行中出现的问题,铁路局可以通过建立全路高铁和动车系统的故障跟踪系统,提前预警相关薄弱环节,实时反馈现场诊断和记录给厂家,从而最大限度防止大故障的发生。
跨越式发展不是走捷径
此外,有些看起来是人为的因素,深究下去会让我们发现复杂的技术缺陷背景。比如高速动车的调度,由计算机系统来做当然是不二选择。但如果这个系统故障率高,误报率高,在实际使用中,可能就会出现“非常站控”,即关掉自动系统由人来调度的局面。反过来讲,非常站控的频繁存在说明动车自动调度系统有大的技术问题。在“7·23”事故之前,我们就频频看到京沪高铁故障的报道。故障的原因也许多种多样,但一个由计算机管理的自动系统故障率高和误报率高,就会给造成操作人员造成一个印象,即认为由人工来进行非常站控是可以接受的。故障率高和误报率高,一种可能是终端采样的数据不可靠,这可能就是安陆生提到的道岔和ATP系统故障,另一种可能是计算机系统本身的漏洞,比如没有考虑到一些边缘情况。无论如何,这些平时积累起来的问题,让调度人员有理由搞非常站控。这就给产生人为灾难奠定了背景。所以,有些事情表面上看是调度人员的人为责任,实际上是计算机管理系统平时工作不够好,给人为责任创造了条件。毕竟,速度快的东西,你必须用速度更快的东西去控制。飞机加大炮出了问题,你得把飞机大炮搞得更好,而不是用小米加步枪去解决,不然还是要出大问题。
我们现在看到的“7·23”事故初步调查报告,着重强调了事故的人为因素。对相关责任人员的处理,当然是必要的。但是我们一定要看到,对相关责任人员快意恩仇式的处理,并不能意味着这些人为因素背后的技术缺陷就会自动消失。相反,如果不克服这些技术缺陷,我们就会面临第二次事故的现实可能。
跨越式发展不等于走捷径。发现和克服技术缺陷是没有捷径可走的。这些都集中体现在工程师群体对工程卓越的追求上。一是体现在要把技术上能够做到的东西做得最好,二是体现在要知道技术的局限在哪里,知道哪些是做不到的。工程师在实际工作中,当然会面临各种各样的压力,有进度的压力,有上级的压力,有技术上的压力,这些在地球上哪个地方都是一样的,但不一样的地方却往往体现在工程师群体对工程卓越的追求是在什么程度。面对“7·23”事故的遇难同胞,面对将来长大后的小伊伊,每一个和高铁相关的工程师都有责任问自己,我对工程卓越的追求是在什么程度,我怎样才能做得更好。
动车沿线的电子设备,不是要出口到欧洲的消费类电子产品,欧洲人不会来要求我们做强制性的CE认证,但这并不意味着这些电子设备就没有安全方面的要求。事实上,由于这些设备要24小时全天候工作,而且是直接关联高铁动车的安全运行,像CE之类的电子设备安全标准认证应该是对动车沿线电子设备的最低要求,而不是最高标准。
电子产品安全标准的背后,常常是一个个血淋淋的教训,在国际上也是一个长期的积累过程。围绕这些标准而建立起来的测试流程、测试手段,和测试标准现在都已经比较成熟。从这个角度讲,强制性要求高铁和动车沿线电子设备通过国际上通用的安全标准认证,就直接借鉴和利用了其他国家长期以来的经验教训。另一方面,像CE之类的国际安全标准认证,必须经由专门的第三方认证机构和公司来实施,这也保证了认证过程的权威性和可靠性。这在设备制造厂家(通常是铁道部关联企业)和设备使用方(铁路局)之间通常存在千丝万缕联系的现实情况下,显得尤其必要。铁道部作为国家监管机构,在7·23”事故后,有必要有责任强制性要求高铁和动车沿线电子设备通过国际上通用的安全标准认证。
而在“7·23”事故后,在网传的安路生局长讲话中,专门提到要“厂家技术主管人员驻段,驻所包保”。产品销售后,厂家一般有专门技术支持人员负责维护,只有严重和紧急的问题才由技术主管到现场解决。但一是不可能有那么多技术主管,二是现场未必有适当的调试工具。安路生要求由厂家技术主管作一线技术支持,可见现场问题繁多而且紧急。这样做,只能是应付一时的政治需要,厂家现在会配合,但不可能长久。
正确的途径应该是厂家的产品在没有严格模拟测试之前,不能出货。设备使用方有权力要求厂家提供原始测试记录。厂家产品的设计要包含实时诊断和记录模块。在现场使用时,铁道部作为设备使用方,要有途径实时反馈诊断和记录信息给厂方,故障和错误的记录要有追踪系统。厂家的现场技术支持还是不可少的,但把技术主管抓去当技术支持,重视是重视了,可这样做实际上会延缓产品故障和错误的修复速度和效率。毕竟对每个产品,真正懂而且能解决问题的人并不多。
应该建立的是一个高铁和动车运行的全路故障跟踪系统。这个系统要能录入各小系统设备的诊断和记录数据。当小故障发生时,当班人员要输入发生时的前后步骤和设备本身的记录数据。各个路局要分享这些数据。厂家可以在线访问和跟踪他们自己的那部分。对故障的跟踪要直到故障修复为止,故障最终原因和解决方案也必须有记录。
建立全路范围(或者至少是铁路局范围内)的高铁和动车故障跟踪系统的一大好处,是可以通过实时统计小故障和小系统设备之间的关系,提前预警大故障和相关薄弱环节。同时,通过对子系统故障率和误报率的量化,还可以让调度人员和高层管理人员对高铁和动车的运行健康有定量的认识。
简单说来,高铁技术创新要尊重产品技术支持的一般性规律。设备安全的第一关是厂家自身的模拟测试,厂家不能把运行现场当测试场。同时,设备现场运行中出现的问题,铁路局可以通过建立全路高铁和动车系统的故障跟踪系统,提前预警相关薄弱环节,实时反馈现场诊断和记录给厂家,从而最大限度防止大故障的发生。
跨越式发展不是走捷径
此外,有些看起来是人为的因素,深究下去会让我们发现复杂的技术缺陷背景。比如高速动车的调度,由计算机系统来做当然是不二选择。但如果这个系统故障率高,误报率高,在实际使用中,可能就会出现“非常站控”,即关掉自动系统由人来调度的局面。反过来讲,非常站控的频繁存在说明动车自动调度系统有大的技术问题。在“7·23”事故之前,我们就频频看到京沪高铁故障的报道。故障的原因也许多种多样,但一个由计算机管理的自动系统故障率高和误报率高,就会给造成操作人员造成一个印象,即认为由人工来进行非常站控是可以接受的。故障率高和误报率高,一种可能是终端采样的数据不可靠,这可能就是安陆生提到的道岔和ATP系统故障,另一种可能是计算机系统本身的漏洞,比如没有考虑到一些边缘情况。无论如何,这些平时积累起来的问题,让调度人员有理由搞非常站控。这就给产生人为灾难奠定了背景。所以,有些事情表面上看是调度人员的人为责任,实际上是计算机管理系统平时工作不够好,给人为责任创造了条件。毕竟,速度快的东西,你必须用速度更快的东西去控制。飞机加大炮出了问题,你得把飞机大炮搞得更好,而不是用小米加步枪去解决,不然还是要出大问题。
我们现在看到的“7·23”事故初步调查报告,着重强调了事故的人为因素。对相关责任人员的处理,当然是必要的。但是我们一定要看到,对相关责任人员快意恩仇式的处理,并不能意味着这些人为因素背后的技术缺陷就会自动消失。相反,如果不克服这些技术缺陷,我们就会面临第二次事故的现实可能。
跨越式发展不等于走捷径。发现和克服技术缺陷是没有捷径可走的。这些都集中体现在工程师群体对工程卓越的追求上。一是体现在要把技术上能够做到的东西做得最好,二是体现在要知道技术的局限在哪里,知道哪些是做不到的。工程师在实际工作中,当然会面临各种各样的压力,有进度的压力,有上级的压力,有技术上的压力,这些在地球上哪个地方都是一样的,但不一样的地方却往往体现在工程师群体对工程卓越的追求是在什么程度。面对“7·23”事故的遇难同胞,面对将来长大后的小伊伊,每一个和高铁相关的工程师都有责任问自己,我对工程卓越的追求是在什么程度,我怎样才能做得更好。