数据中心运维管理原则
(1)对设备和系统的智能监控管理功能不熟悉,已有的智能管理功能不能得到充分的利用。
(2)无专门维护人员配制。
(3)管理制度不健全,缺乏维护操作流程,无严格的交接班制度。
(4)运维人员不了解系统规划情况主要工作局现在对设备的维护上。
(5)简单的依照标准确定运维内容,包括一些不重要、无关紧要和不对的指标。
(6)机房环境指标指示不正常(温度、湿度、正压等),不知道如何改变制冷设备设置,使系统运行达到好的状态。
(7)供电系统异常(接地、零地电压、干扰、IT设备异常)时,只知道在供电设备上查找原因,而不能解决问题。
这些问题无一不会对数据中心的运维工作带来挑战,只有正确解决这几个方面的问题,才能让数据中心保持长期稳定运行,并能产生良好的效益;也是数据中心运维水平高低的主要重要体现。
运维管理服务包含哪些内容?
通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。
结合用户现有的环境、***结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。
信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况。
配置信息。
可用性情况及健康状况性能指标。
统计运维数椐、提供信息系统管理和工作报告、归纳总结并提供用户想了解的数椐报告。
设备运维管理系统的主要功能
1、自助式服务台设备运维管理系统提供自助式服务台门户,可通过页面注册或对接数据库的方式导入自助服务用户账号,用户登录后可方便的从自助式服务台直接提交故障报修或服务请求,并随时查看处理进度。
2、闭环故障处理综合监控系统轮询时产生资源故障告警,将其推送至运维管理系统;设备运维管理系统解析资源故障告警后,按照用户预先设定的条件生成响应的事件工单并推送至服务台;服务台分配工单给相应工程师,经由事件管理流程流转处理,处理完成后关闭工单;运维管理系统向综合监控系统发送结束标记,反向清除相应的资源故障告警。
3、自定义业务流程图形化的业务流程自定义框架,以托、拉、拽的方式直观定义符合用户业务需求的ITIL流程以及业务流程,所见即所得。流程中所使用的所有字段均可自定义,支持多种字段展现方式,并提供数据字典功能,用户可根据需求灵活设置流程字段的类型、校验、长度、显示的节点等。业务流程自定义框架允许用户自行设定流程中各节点的驱动权限,提供多种权限维度,并支持节点超时触发动作。