日常运维管理制度 下载本文

欢迎阅读

日常运维管理制度

1.运维保障机制

(1)建立硬件、网络、系统、应用及业务软件日常维护流程机制; (2)建立故障应急处理流程机制; (3)建立备份恢复保障机制; (4)建立安全保障管理机制; (5)建立版本管理机制,管理平台生产环境运行的软件版本; 以上机制应形成文档,作为日常遵循规范,按要求执行。 2.硬件维护能力 需对硬件设备具备7*24小时不间断的支持、响应能力,原则上每日对硬件设备至少健康检查一次并记录;定期对网络环境进行检查。我公司服务器部署在移动云上定期通过命令进行硬件检测,内存、硬盘、I/O的使用情进行查询并进行登记,每台服务器运行的软件对硬件性能使用情况检测,对于服务器我们进行系统备份、软件,每日对网络使用情况进行观察,针对突发异常流量进行分析。 3. 故障处理响应及要求

设备(系统)出现故障时,根据不同的故障级别提供相应的服务响应,响应方式及要求如下:

欢迎阅读

故障级故障内容 别 果 响应时间及效其他 出现系统故障,不影响系工程师即时响应I 一般故障 作 决。 对于硬件统运行,不影响业务正常运处理,24小时内解故障(含机房环境故障),要求不论在何时确诊需要进行备件更换,发出备件更换指令出现系统故障,系统崩溃工程师即时响应III 重或其他状况,影响核心业务处理,2小时内解大故障 的正常运行 决。 起3小时内备件到达故障现场,并恢复系统正常运行。 4.具备应急预案 针对部署国家平台节点服务器我们实施系统备份、软件重要数据实时备份,主机备份是提供的保留某个时间点上的主机系统数据状态的服务。基于主机备份可以随时生成或删除备份,并基于已备份进行主机的恢复,实现已有应用和主机数据的快速复用,如系统出现事故无法使用将进行系统恢复并把最近一次备份的数据进行恢复。对于突

出现系统故障,影响系统工程师即时响应II 次运行或影响非关键业务运处理,8小时内解要故障 作,不影响核心业务运作 决。 欢迎阅读

发情况建立应急服务流程,主要是针对可能发生的各种意外情况设计应急的方案,以控制和规避突发事件带来的集中性风险,从而降低设备集中性风险所造成的损失,制定以下流程图:

应急机制处理流程图用户提出服务需求受理并记录服务需求工程师分析故障联系处理结果携带配件现场处理未解决驻厂经理沟通用户负责人报告故障进度、结果项目经理解决报告总经理录入后台数据库提供故障技术报告结束

为保证服务实施的质量能够稳定并不断有所提升,保障客户需求能够得到有效满足,保障服务实施团队为客户提供统一、标准化的服务支