运维管理服务
准化和模版化是管理大规模数据库集群的法门,可以显著的提高数据库运维的效率与可靠性。但是事务都是具有两面性的:网易的产品众多,涉及的业务类型覆盖电商、社交媒体、云计算、智慧企业、邮箱、IM等多种类型,这些业务对数据库的使用场景不尽相同,进而也对数据库本身的性能、高可用、服务形态、运维管理有不同的要求。当一支数据库团队同时运维这么多不同类型的数据库环境,既要保障运维的可靠可持续,又要针对每一种数据库进行定制的精细化管理,这是网易DBA团队不得不解决的问题。

数据中心运维管理原则
数据中心运维管理就是为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、***、协调与控制,是信息系统服务有关各项管理工作的总称。
对于很多数据中心来说,保障和提高数据中心运维管理绩效是现在数据中心亟待解决的问题。
(1)管理界限不清楚,只维护部分基础设施设备,忽略或不维护发电机和空调室外机等。
(2)只维护关键设备,对发电机、电池、配电、线缆长时间不做维护。
(3)设施文档不全或不正确。
(4)发生事故时简单地归结为设备问题,不愿也无法找出引发事故的真正原因,以至于故障修复后再发生故障,或诱发其他环节故障。
数据中心运维需要具备哪些知识和能力?
首先是基础知识:
1、电力知识。一般来说需要具备110以下的供配电知识,中压知识知道个皮毛就行了,低压要掌握的透一点。具体涉及的设备就是变压器、配电系统、UPS/高压直流、发电机、精密列头柜、PDU等设备原理、维护方法、故障处理等。再往后学学开关电源、服务器供电(皮毛)啥的。
2、暖通知识。暖通需要全的知识,直膨、水、自然新风、间接新风,各种制冷方式均应有所了解。
***是水系统,冷机冷塔、泵、阀、末端、这些都要深入掌握原理、维护方式、故障处理等。以及发电机的供油系统,室内空气质量、腐蚀、颗粒、新风等知识。
3、弱电知识。弱电需要综合布线全知识。光纤、绞线的等级、应用范围、成本,测试方法。扎线
4、监控系统。这个也要很全。系统的原理、系统的维护(数据备份、应用停启)。
5、消防系统。这个不用了解太深,读读消防系统设计规范、消防法啥的就行,有事情有专门的供应商可以搞定。