第二十八章,重大事故 (3 / 6) 首页

字体:      护眼 关灯

上一章 目录 下一章

第二十八章,重大事故 (3 / 6)
        伟华有严格的事故处理以及回溯的机制,在每一起重大事故处理完成后都必须先进行技术回溯,找到导致事故发生的所有原因,识别出根因,然后在技术回溯的基础上进行管理回溯,找到在业务流程、管理机制上的改进点,并且对责任人进行相应的问责。

        重大事故的根因分类要么是因为客户或者网络上的第三方设备导致的非供方原因事故,要么是因为伟华的设备原因或者现场服务人员操作错误导致的供方原因事故。

        最糟糕是被定性为现场服务人员操作错误导致的人为事故,当事人往往会受到严厉的处罚,例如一年多以前,也门代表处的人为重大事故之后,当事工程师被辞退,代表处服务主管被撤职、调离,连地区部的老韩、老谢都负连带责任被通报批评并被罚掉一笔“巨款”。

        几个人已经不存在吃午饭这回事了,也忘记了晚饭。

        他们一直忙到深夜才把事故的来龙去脉梳理清楚,ST电信的这套预付费系统的核心数据网络未与客户维护人员的维护操作网络做有效隔离,客户维护人员的网络也没有与客户办公室的办公网络做有效隔离,正是其办公室网络上的异常网络流量,也就是所谓的网络风暴导致核心系统受到影响,从而导致事故发生。

        事故中断时长三十分钟,五十万用户呼叫受影响,也就是说当天中午苏丹有五十万在三十分钟内打不通电话。

        事故的导火线是客户办公室网络的网络风暴,客户的维护团队也不想把账算在自己头上,和曹松他们一起写了报告,把事故原因归结在了其办公网络的管理上,再加上陈永生跑上跑下地做着几个关键客户的关系,两边的管理层对曹松他们并没有太大不满,只是责令双方技术团队完成数据网络的整改。

        过了两天,曹松、钱旦召集软件服务团队的所有成员开事故总结会。

        小伟讲解了事故回溯报告,他说:“这次幸好是客户原因造成的事故,影响不算太大,我们要提高警惕,不能再出事故。”

        曹松站起来走到门口望望外面,把门关上,等不及回到座位上就开口了:“没有外人,别客户原因事故了,我一世英名差一点就毁在苏丹了!这就是人为事故,几年前在国内就发生过因为网络没有隔离,客户维护人员在维护终端上用‘金山影霸’看电影把网络搞瘫了的事故。早几年公司就发过预警要求全网整改,现在都是哪一年了?亏得是在苏丹,要是在国内现在出这种事故我就死定了。都算我的错,下不为例,我明天请大家好好吃一顿去。”

        钱旦说:“这颗雷好歹是被我们自己踩了,没有留给后人。不仅是ST电信的数据网络要整改,我们要组织检查中东北非的所有数据网络,有隐患的都得整改。另外,我这两天琢磨,我们要把维护工作的要素总结出来,提高警惕,抓好三个K,第一个K是Keywork,我们把区域内需要重点保障的关键网络识别出来,重点盯防;第二个K是KeyAs,明确每张网络日常维护要做的关键动作,包括日常的检查;第三个K是KeyTime,每张网络都要有应急预案,维护人员要熟知事故发生时的应对方法,还要不时演练。”

        林汉说:“三个K,好,我现在就提一条KeyA,今后所有兄弟都要有两个手机,而且必须是两个不同运营商的手机,万一再出这种业务全断了的事故不能再互相联系不上了。”

        小伟说:“我也提一条,,,”

        既然曹松表了态要请大家好好吃一顿,大家没有理由不热烈拥护。

        内容未完,下一页继续阅读

更多完整内容阅读登陆

《墨缘文学网,https://wap.mywenxue.org》
加入书签我的书架


上一章 目录 下一章