第一篇:IT运维管理一体化模式
IT运维管理一体化模式
摘要
随着网络应用业务的不断扩展和信息化建设的持续深入,IT系统越来越复杂,业务对IT系统的依赖程度也越来越紧密,对IT系统运行的稳定性、可靠性要求越来越高,确保IT系统的稳定安全运行是企业面临的普遍问题和考验。本文从信息化的发展趋势、IT运维的实际需求和信息安全的必然要求出发,阐述了构建IT运维管理一体化平台的建设思路。
1、IT运维管理一体化模式提出的背景
1.1信息化高速发展的必然趋势
随着网络应用业务对IT系统的依赖程度越来越紧密,对IT系统运行的稳定性、可靠性也要求越来越高,而与之相对应的是IT运维管理工作多年来一直处于手工处理维护的状况,各种服务工作始终处于被动的状态之中。特别是近年来,各类应用系统的推广规模、建设速度迅猛发展,信息人员的数量、维护能力和知识水平日显不足。如何更有效地利用现有资源,建立高效、规范的运维体系,确保IT系统的稳定运行是企业面临的普遍问题和考验。因此构建企业的IT运维管理一体化平台,建立自上而下、主动而长效的运维管理体制,成为解决问题的关键。
1.2精细化、服务化运维管理的必然需求
企业IT应用不断扩大,各种不同的应用和业务系统在网络上运行越来越多,对网络依赖性的增强,也增加了对网络管理内容的关注,网络管理,性能管理、应用管理,使用管理、安全系统等内容也逐渐摆到了桌面。网络的规模增大,规划、维护、安全、管理等分工更加细致,迫切要求对网络的使用和维护建立统一、规范、体系化、层次化的服务管理流程。通过进行集中化的管理,进行智能化的分析、统计,得出有利于网络管理和维护的数据,更有效、快捷的解决问题。建立与用户之间的服务水平协议,快速地支持用户业务的IT服务需求,规划好IT系统建设更好地为业务部门提供发展的动力等,均成IT运维管理过程中不可或缺的一部分。
1.3信息安全的必然要求 IT运维管理对象所涉及到的种类繁多,从供配电设施到IT设备、到应用系统、到各类人员。另外,作为IT服务的物理载体,用户对IT服务实时性、安全性、可靠性等的要求最终将内化为对IT运维管理的要求。IT运维管理必须符合相关标准与行业规范。随着技术的广泛应用与信息的转型,信息对机构来说,已经变得与土地,人力与资金等传统资源同等重要。另外,随着信息面临的威胁逐年增加,如病毒,钓鱼网站、间谍软件、错误操作、越权使用、人员安全等,作为承载用户信息系统运行的IT运维管理而言。信息安全绝对是IT运维管理的重要要求。
2、lT运维管理一体化模式的内涵及创新点
2.1 IT运维管理—体化的内涵
通过IT运维管理一体化平台建设实现对IT基础架构的监控,即对主机系统、桌面PC机、网络系统、安全产品、数据库、中间件、存储设备系统、IT环境系统的集中监控和管理。能够及时采集各类告警数据、性能数据和配置数据,进行集成统一的分析、查询、报告和展示,帮助运维管理人员方便有效的定位系统问题,直观快速的诊断和分析问题,将运维模式由被动的支持转为主动式服务。通过帮助台接收各类告警事件,按照预先定义的事件管理流程完成事件的处理。建立故障管理、问题管理、变更管理,配置管理等八个服务工作流程,通过管理人员、技术和流程的有机结合,实现IT运维管理标准化和规范化,形成一个整体的IT运维平台。
2.2 IT运维管理—体化模式的创新点
内容一体化:传统模式下的管理是分散式、粗放式管理,各单位、部门根据自身信息化建设实际情况,建立了相应的管理体系,承担相对独立的内部管理职能。管理的内容、要求缺乏统一标准,发展水平不均衡,项目建设,数据共享和管理水平参差不齐,管理缺位,不到位现象不可避免。一体化管理模式是将多个管理体系经过有机整合,按照系统化原则形成相互统一、相互协调、相互补充、相互兼容的有机整体。在全面梳理各方面内容和要素的基础上,对各个管理点进行共性抽取、差异分析和整合归类,确保整合后的管理体系覆盖IT运维管理的每个环节,管理内容明确,管理标准统一,便于组织实施。
方式一体化:传统模式下各单位、部门的管理相对独立,整体性和协同性不足。对于涉及多级机构的工作,采取任务自上而下逐级部署,执行情况自下而上逐级反馈的方式,体现了一定程度的一体化,但对于各级机构大量的日常管理工作,则并未纳入一体化的管理范畴,在管理上采取自定规则、自成体系,自行执行、自我监督的方式,缺乏总体上的规划指引和外部约束。在IT运维管理一体化模式下,信息化建设将全面纳入统一规划和管理,一方面要求确保发展规划和实施策略的科学性、可行性,增强科学决策能力和统筹协调能力,另一方面要求各级机构服从和服务于大局,严格遵守管理制度和规范流程,明确自身的定位和职责,积极配合、切实落实IT运维管理工作部署,形成分工合理、各负其责、协同合作的一体化格局,体现集中资源办大事的发展思路。
手段一体化:IT运维管理是一项最终要落实到操作层面的具体工作,即让合适的人、利用合适的资源,做正确的事,在此过程中,如何确保指令有效、落实到位、过程可控、可审计是摆在每一个管理者面前的现实问题。传统模式下,指令的下达存在多种渠道。任务的执行过度依赖于执行者个人的工作态度、能力高低和经验多寡。随着信息化建设的推进,在优先建立IT资源基础数据库的基础上,逐步将所有IT运维工作纳入统一的管理平台。采用流程化的管理思路,以规范流程驱动人、物、事的优化搭配和动态流转,强化事务督办、进度监控和外部审计,将管理做精做细。
3、IT运维管理一体化模式的建立及应用
3.1理清工作思路,明确工作职责
IT运维管理一体化建设使信息系统的运行和维护模式发生了重大变化,企业各分支机构的工作重心将向前台运维和安全防护方向转移,同时配合企业IT运维的统一调度,突出专而精的特点及与企业IT运维协调一体。机构职能的转变使工作思路快速调整,重新制定和完善各单位的工作职责。根据IT运维管理一体化的要求,明确各级信息部门的职责范围及岗位分工。从横向上,分析各单位、部门职责范围并从管理的角度进行归类,理清各单位、部门职责覆盖面。从纵向上,确定各管理链条的延伸深度和各节点职责,使各单位和信息员均能准确定位各自的职责。改变过去抓大放小、粗放式的管理思路,将全部职责内容、岗位分工以制度的形式确定下来、落实下去,达到以制度规范和约束个体行为的目标。
3.2梳理工作流程.提高工作水准
在明确工作职责分工的基础上规范工作流程。第一步,按照IT运维管理的建设要求及流程化.规范化的管理思路,对各项工作的操作步骤,流程和标准进行梳理,建立详尽的流程指引和操作规范,特别是要对新增或强化的职责建立健全相应的规范流程;第二步。按照集约化、扁平化管理的原则整合流程,通过辨识、分解、评估业务流程中各个环节,删除、压缩或整合不必要的环节,集合区域生产要素进行统一调配,以提升核心力量,实现可持续发展。第三步,按照精细化管理的理念将各项工作做深、做细、做到位,将常规管理引向深入。其核心是计划、岗位流程和执行力,即应用已优化的岗位业务流程,强调管理的细致、精准和有效。力求达到事事有计划、有标准、有检查,有总结,杜绝管理上的漏洞和盲点,提高管理效能。
3.3完善协同工作机制,调动各方积极性
IT运维管理一体化模式不但要使各单位、部门信息人员明确各自在本单位、部门中所承担的职责,同时还应使其能够准确定位在整个IT运维体系下的责任分工.将各级机构,各个岗位的工作融入到IT运维管理一体化建设中,提升各级信息人员的全局意识,调动各方积极性。随着信息化建设的推开.在信息化规划上要将各单位IT基础设施建设纳入企业信息化工作统一框架,统一规划、统一管理一采取有力措施实现分工协作、协调配合。企业各分支机构做为系统运维和业务需求的最前端,也应当主动转变观念,承担起发现问题、反映需求的桥梁和纽带,通过整合优化、统一调配资源,逐步建立合理分工、有效配合的协同工作机制。
3.4依托一体化管理平台,提升IT运维监控手段
在资源整合的大环境下。各级机构在运维领域的工作日益强化,技术支持精细化、专业化要求明显提高。向一体化转型的过渡期,亦是运维模式、管理体制和标准规范的关键形成期.通过建立一体化管理平台,实现管理规范和操作流程的标准化,一致化,以降低运维成本,提高运维水平。
一是建立网络资源监测系统。在系统繁多、环境复杂、人员不足的情况下.借助配套的预警体系和管理机制,提早发现和准确定位问题。按照“横向到边、纵向到底”的原则,将各类重要IT资源纳入统一监控。
二是制订统一的运行维护服务制度、工作流程和操作规程,为运维人员协同操作提供规范和约束,包括一体化的巡检规程、问题处理、事故报告和反馈机制等。
三是加大自身信息化建设力度,建设统一、集成、开放并可扩展的运行维护技术支持平台.推动运维工作的智能化和高效率。强化管理平台与资源监控平台的联动。
4、lT运维管理一体化模式保障运行体系
IT运维管理一体化模式在逐步转变工作思路和模式的过程中,不可避免地会遭遇许多困惑和问题。IT运维管理一体化建设是不可逆转的大趋势,必须服从和服务于这一大局,应对IT运维管理一体化建设中可能出现的问题做好充足的准备,并采取积极有效的保障措施和对策及时化解问题。
4.1树立正确的认知观和发展观
从图1IT运维管理过程成熟度模型图来看,IT运维管理体系建设是一个动态的,需要常抓不懈的,持续调整的过程。随着信息化应用的纵深发展及其对业务影响程度的日益提升,信息化建设三分技术、七分管理的特点日益突出,IT运维管理的重要性得到进一步提升。我们认识到,IT运维管理体系是随着信息化发展实际情况而不断调整和优化的过程,要避免一步到位的想法、避免受僵化的管理体制约束,IT运维管理必须根据客观实际进行调优,切实以科学的管理思路和政策举助推信息化持续发展。
4.2提升IT综合治理水平,促进信息与业务的协同发展
IT运维管理的成功建设必然是业务和技术合力的结果,业务部门的积极参与是不可或缺的关键因素。作为IT运维管理一体化的推动者和实践者,信息部门要正确处理好技术发展与业务的协同关系.牢固树立信息为业务服务的宗旨。将技术实现目标与业务发展目标紧密联系起来?要加强与业务部门的沟通和配合,引导业务部门研究和反映业务需求、构建业务架构,促进信息与业务的融合,互相支持,协调配合,共同推动企业创新发展能力的更快更全面的提升。4.3积极实践—体化的项目管理模式
IT运维管理一体化是一个全员参与的系统工程,企业要以项目管理的方式进行组织运作.并着力处理好以下三方面的工作。
一是要处理好当前需求和远期规划的关系。一体化运维是业务实现创新发展对提升信息服务能力的需求,其过程和效益的显现具有渐进式的特点,必须深人分析信息化发展现状和趋势,采取与之相适应的,切实有效的措施进行推进。
二是要处理好分支机构与企业整体力量提升之间的关系。在推进一体化运维过程中,要注意统一信息人员的思想和行动。实现企业整体信息力量的优化整合和均衡发展。
三是要采取切实措施,提高需求实现和问题处理的效率。对于业务部门来说,需求的快速实现、问题的及时解决是其关注点所在,要避免因管理链条延长导致问题处理低效的可能性,切实使信息部门和业务部门均能理解IT运维管理一体化运行的必要性。并切实感受到由此带来的对业务发展和创新支持力度的提升。
图2 IT运维管理组织流程图
5、总结
IT运维管理落实一体化,集约化、精细化的管理思路,建立与信息化发展相配套、相适应的整体设想.通过持续,科学的管理,保障了企业信息化的快速,协调、可持续发展。建立了自上而下的主动管理体制。IT运维管理平台是对计算机系统进行综合集中管理,既面向资源又面向应用,同时还面向管理维护人员,为减轻各分支机构运维人员工作量打下良好的基础,是人才、流程和工具紧密结合的三位一体的系统。规范了IT运维管理流程。IT运维一体化管理平台帮助信息部门整合支离的IT服务,实现了由局部,单项、按部门开展运维服务向全局的,一体化的IT运维服务转变,由被动的“救火”的服务转变成科学有效的流程服务化管理,从根本上解决基础台帐管理不规范、故障发现和解决滞后,设备资产底数不清等问题。实现了全方位的IT系统管理。整合了对网络、服务器与业务应用、安全设备,客户端和机房基础环境的分割管理,实现了对IT系统的集中.统一、全面的监控与管理-在设计理念上遵循“管理思想+系统工具+管理实践”的原则,不但直接服务于IT运维部门,而且能辅助主管领导掌控、评估IT全局,为重大规划和决策提供了科学依据。
实践证明,IT运维管理一体化模式所带来的社会效益和经济效益显著,不仅是管理模式改变.更重要的是强调对于企业IT资源的一体化管控,全面提升各部门协同管理、高效运作的能力,从而持续推进企业的信息化建设,这也将是企业IT运维管理发展的必然趋势所在。
第二篇:大检修之运维一体化检修模式探讨
大检修之运维一体化检修模式探讨
摘要:本文首先从一次误跳闸事件出发,分析了专业分工负责制检修模式的弊端。然后结合电力发展趋势,阐述了推进大检修体系建设,实施运维、检修专业化的必要性。并从变电站标准化建设、员工培训、员工队伍建设、管理流程和制度改革、交流学习等方面提出了推进大检修体系建设,实现发展方式转变的应对策略。关键词:大检修、运维一体化
1、引言 XXXX年XX月,某500kV变电站检修人员完成500kV线路保护换型工作后,进行送电前断路器临时过流保护接入试验。检修工作负责人在开始试验前未确认现场设备运行状态,检查设备压板投退状态,未意识到工作过程中断路器失灵保护出口导致母线跳闸的安全风险,造成断路器失灵保护出口,启动500kV I母母差联跳I母全部断路器,致使500kV I母非计划停运1小时30分钟。检修人员安全风险辨识与控制不力,二次工作安全措施不到位,标准化作业执行不力是造成本次事故的直接原因。仔细分析,此次事故同时也暴露出以往电力生产体制各专业分工负责制维护模式的弊端。此次送电过程中,检修工作人员不熟悉运行倒闸操作流程,不明确临时保护电气试验的最佳时机;运行人员不熟悉电气试验过程中的危险因素。双方仅按照例行工作流程协同工作,并未真正意义上实现生产作业全过程“本质安全”。
2、国家电网“三集五大”对“大检修”的要求[1] 随着电力行业技术的飞速发展和电网结构迅速扩展,以往电力生产管理模式已越来越难以与之适应。首先,电力设备生产安装质量日趋完善,智能化水平逐步提高,采用设备定期检修模式不具备科学性,而且容易发生检修过剩,造成人、财、物的不必要浪费;其次,近年来电网结构迅速扩展,维护设备数量几何级增加大大加大了检修人员的工作压力。因此,探索科学的生产管理模式,减轻一线生产人员的工作压力,同时保证电网运行的安全稳定,刻不容缓。
为适应电网快速发展,国家电网公司提
出了“两个转变”的发展战略,即转变国家电网公司发展方式,转变电网发展方式,“三集五大”体系建设就是公司实现“两个转变”的重要内容。“大检修”作为“五大”管理体系中的一项重要组成部分,牵涉到电力系统运行的安全稳定,其意义非常重要。国家电网公司对大检修体系建设的要求是强化资本全寿命周期管理,实施运维、检修一体化管理,实现电网检修维护人、财、物的集中管理和控制,降低生产成本,提高工作效
率。以往电网生产体制采用专业分工负责制生产模式。运行专业负责输变电设备的巡视监控、倒闸操作和事故应急处理,并根据设备运行中出现问题的严重程度分类报送到调度和设备检修部门。调度和检修专业按照设备维护周期和电网运行方式,协调运行专业停运设备进行检修维护。检修专业的主要职责是对输变电设备进行定期小修预试、大修技改以及日常性缺陷处理,保证输变电设备正常运行。然而,如果各专业工作人员
仅精通本专业知识,对其他专业或一知半
解,或完全不懂,必将导致有些配合性工作
现场缺少安全管控。
根据“三集五大”中“大检修”的要求,运行专业和检修专业的工作模式将发生较大改变。由于电网整体规模的不断扩大和人力资源成本的显著提高,电网检修模式将转变到以状态检修为基础,以设备全寿命周期管理模式为抓手的动态检修模式。因此,运维一体化人才是保证大检修模式成功运转的关键环节。同时,随着国民经济的快速发展,各级电网的规模指数级的扩大与人力资源匮乏的矛盾非常突出。基于运维一体化的大检修模式是有效解决这一矛盾的有效手段。
在现有组织结构下,如何改变思维方式,推进大检修体系建设,实施运维一体化,对公司管理人员和生产人员都提出了严峻的挑战。传统生产管理模式变革涉及很多因素,是一个系统工程。如何在推进变革的同时,继续保持队伍稳定、电网安全、企业发展、管理难度显著增大。同时,生产人员如何适应改革要求,改变自己过去单一知识结构,提升自己各方面的业务技能,同样至关重要。[2]
3、推进大检修体系建设、实施运维一体化的应对措施
推进大检修体系建设、实施运维一体化,公司需从变电站标准化建设、员工培训、员工队伍建设、管理流程和制度改革、交流学习等方面着手,才能实现平稳改革的同时,保证电网的安全稳定运行。
1)标准化变电站建设
变电站采用“六统一”标准化设计:统一功能配置、统一回路设计、统一端子排布置、统一接口规范、统一报告输出、统一格式输出。变电站间差异性越来越小,大大减小了检修试验的工作强度和难度。同时回路设计的统一规范,减小了电网设备的安全隐患,为推进大检修体系建设,实施运维一体化提供了便利条件。2)员工培训
推进大检修体系建设、实施运维一体化对员工业务技能提出了更高的要求。运维一体化要求员工不但懂得输变电设备的维护检修,还要求员工能够根据调度命令倒换运行方式,将输变电设备停止运行,解除备用,采取安全措施。运行人员需要实现从设备的使用者到设备的维护、分析、检修者的角色转换;检修人员需要熟悉各种运行方式的特点以及安全注意事项,并能迅速判断,作出相应的决策。因此,员工培训必须根据大检修体系建设要求,结合新岗位知识能力要求和员工现有知识结构,开
展有针对性的单元制培训,把运维队伍
培养成为一批“一专多能”、“多专多能”的复合型人才。[3] 3)员工队伍建设
随着数字化、智能化变电站的推广,变电站一次设备智能化、二次设备网络化、运行管理自动化逐渐变为可能。其运行维护工作,尤其是继电保护工作将面临完全不同新的局面。配合性工作任务迅速增加,如何在保证安全的前提下,保质保量按时完成工作任务,成为各分局继电保护室面临的新的挑战。研究维护工作发展方向,适当调整生产专业人员比例结构,避免员工疲劳作业,同样是保证电网安全运行的重要环节。[4]
4)标准制度及作业流程改革
推进大检修体系建设、实施运维一体化是一个系统工程。加快建立协调统一的技术标准、制度标准、管理标准和工作标准体系,不断优化现场检修标准化作业流程,进一步以提高检修工艺,深化检修现场作业的全过程细化、量化、标准化,提高安全管理和监督的实效,保证作业过程处于“可控、在控、能控”状态,有效避免作业风险,从而确保变电设备安全可靠运行。5)交流学习
重庆公司和江苏公司在国家电网公司二届一次职代会暨2011年工作会议上被确定为“三集五大”体系建设综合试点单位后,通过改革探索成效显著[5] [6]
。加强向兄弟单位交流学习,探索适合本公司的改革模式,避免走弯路,实现“弯道超车”,是实现大检修体系改革的捷径。
4、结语
随着电力系统的不断发展,传统检修模式不适应电力生产的需要。“大检修”运营模式优化组织架构,实现电网检修维护人、财、物的集中管理与控制,降低生产成本,提高工作效率,实现企业生产管理模式由分散粗放向集中精益方式的根本性转变。因此,推进大检修体系建设,实施运维、检修一体化建设是电力生产发展的必由之路。参考文献:
[1] 李晨 陈希正 郝艳春.大检修组织运维一体化人才培养研究[J].中国电力教 育,2011(09)[2] 严利雄.电网大检修体系建设探析[J].武汉电力职业技术学院学报,2011(09)[3] 顾振江 “大生产、大运行”变革下单元制培训模式的研究[J].中国电力教
育,2010(35)
[4] 戎俊康 浅析智能变电站建设对继电保护工作的新要求[J],中国电力教育,2011(36)[5] 李庆梅.“大检修”下的标准化成本探讨[J],产业经济
[6] 沈芝春 单莹 大检修:术业专攻有其道[J],国家电网,2012(02)
第三篇:运维一体化班组建设经验交流材料
运维一体化班组建设经验交流材料
各位领导、同事大家好:
我叫王勇,来自检修公司酒泉分部,在现阶段公司运维一体化改制的大方向下,酒泉分部各基层班组积极响应,班组建设迅速跟进,从基础资料整改,盒签更换到工作转型及安全管理均以运维一体化要求为指导,下面我就将我班目前运维一体化转型后的一些办法和措施向大家做一汇报,不足之处请各位领导批评指正。
一、安全管理
众所周知,班组安全活动作为企业安全管理的一个载体,自始至终是伴随着企业的生产经营活动来开展的,而且在不断发生变化。2012年,随着公司改革的不断深化,班组的安全活动越来越显得重要。为此,我班在新形势下安全活动的管理方式和活动形式上,在继承以往好的作法和经验的同时,继续不断创新。通过多年来工作实践的摸索,我认为,班组安全活动要在以下三方面继承和创新。
1、继承和创新必须注重“三个率”。
要重视班组职工对安全知识和安全技能的掌握率,即公司对班组职工进行安全培训及受教育程度和职工对安全活动内容的理解程度;要重视班组职工对安全活动的重视率,即职工对安全活动的认同程度;要重视班组职工对安全活动的参与率,即职工直接参与安全活动的人数比例。
2、继承和创新必须注重“三个结合”。
班组安全活动应该而且必须具有多种活动形式和活动载体,以找准安全活动的切入点。首先,要把安全活动与班组达标创优活动结合起来。班组是企业最基层的“细胞”,公司的各项安全规定最终都得在班组体现,这也是班组职工开展安全活动的重要基础,把班组安全活动作为企业安全管理工作的重要内容,使班组安全活动的内涵得到了充实,也使安全活动在班组获得了有力的推动;其次,要把安全活动与提高班组职工的安全素质,增强责任心,不断规范自身安全行为结合起来。此外,要把安全活动与班组职工严格落实安全生产责任制、岗位安全职责、开展合理化建议活动,提高企业经济效益结合起来。
3、继承和创新必须注重“三个提高”。
通过班组安全活动,一是职工素质要有明显提高。这个素质的提高主要体现在职工的安全意识和业务素质上,职工通过班组安全活动了解了本公司、本专业、本岗位工作流程及其运维操作的注意事项;二是企业安全管理要有一个明显的提高;三是各级领导及安全管理人
员的工作水平要有明显提高。班组安全活动正是体现班组长的作用,增强职工安全学习的自觉性和实现企业安全创效的最佳结合点。同时,也为各级领导及安全管理人员的工作提供了良好的工作环境。有为才有位,有位才有责,有责才有创新。从而实现了企业长周期安全生产的目标。
二、自身综合素质的提升
班组和安全员作为基层班组的领头羊,在保证班组日常工作顺利开展的同时,还需时刻把握关键、监督全局,切实提高班组长综合素质也是班组管理必不可少的重要因素。要以培养提高防范事故、保证安全生产的综合能力为目标,坚持自身基本知识与实际操作技能提高并重,在加强安全业务知识和技能培训的同时,注重思想政治、职业道德、企业文化、日常管理等方面的培训,切实提高班组长乃至每一个班组成员的专业技能和综合素质,使每位员工真正做到不伤害自己、不伤害别人、不被别人伤害,实现班组安全生产,为公司的安全生产奠定坚实的基础。
三、员工培训与沟通
1. 制定培训措施。根据公司运维一体化的特点及目前转型后的工作重点制定出一些适合实际工作的职工培训措施和计划,内容详实并适用于岗位操作,以此加强员工对运维一体化目标的理解和适应能力,提高员工输电线路运行与检修技能的有机结合2. 树立班组模范。在班组里选择一位或几位素质强、业务精、人缘佳的员工作为模范,在班组管理中起表率作用。使员工工作有动力、抬头有方向、操作有标准、行动有目标。
3.做好“老娘舅”。要想让上级精神快速深入班组员工,及时成为员工的自觉行动,就必须了解员工的心态,与他们坦诚相待。这需要一个轻松、愉快的氛围。这就与我们输电线路工作的环境有本质的区别,班长必须经常性组织班组员工聚聚,通过聊天、娱乐等方式去发现员工生活中的一些困难和思想波动,及时地去安慰和解决,从而升华员工对班组建设的认识,凝聚智慧和力量,自然也会产生一种归属感、亲切感、责任感。班组也会有强大的凝聚力和战斗力。
4.吸收“金点子”。让员工自己来管理自己,为班组建设献计献策,提合理化建议,班长做好把关,实现“群策群力”和局面。
以上既是本人的一点经验,也是对自己工作的要求,更是本人今后持续努力工作的方向。
第四篇:变电运维一体化实施总结
变电运维一体化实施总结
按《四川省电力公司变电运维一体化实施指导意见(试行)》和《西昌电业局变电运维一体化实施细则》,抽调的两名运行人员进入二次系统检修班组,学习三个月。完成了二次班组交给我们的学习任务,现把具体学习情况总结如下。
一、培训内容
1.冷却系统指示灯、空开更换 2.保护及自动装置改定值 3.保护差流测试
4.二次设备红外测温:保护装置、二次回路
5.交流设备缺陷:加热器更换、灯泡更换、打印机工作不正常 6.电缆沟及屏柜封堵 7.后台监控系统装置除尘
二、能够完成的工作
我们经过三个月的学习,对以上培训内容基本掌握并且对二次系统有了一个基本的了解和认识,能够阅读二次回路图能清查回路走向及信号传递过程;而且能够比较熟练的使用一些试验工具,如保护校验工具加量和升流等等;同时在自动化专业的知识也有所了解即站端自动化包括保护测控装置、综合测控装置和后台机等设备信息传递过程及它们的基本使用。
三、在检修班的体会
在检修班组最大的体会就是,检修班和现如今的运行班值组人员在工作上的交流问题。检修班一般会认为运行人员不是太了解设备和系统运行原理,在某些设备验收就设备状态处理方面存在问题。比如设备出现小问题,检修人员能够在远程指挥使系统能尽快恢复正常。确实,我们的大多运行人员比较熟悉倒闸操作但确实不熟悉系统和设备,甚至不能够说清站上很多设备的用途,比如查找设备版本及型号等。在出现问题时,检修人员和运行人员的沟通上就出现了不少问题,就不能很方便的携带准确的工具及备品,常常需要携带多种备品,降低了处缺工作的效率。我想加强运行人员学习检修工作的重要性的认识比单纯的要求学习检修工作更加的重要,消除惰性,主动学习才能事半功倍。
四、对一体化方案意见及建议
现如今的培训模式采用和二次系统检修班组共同工作,在工作中学习的方式,必然能得到很多实践的机会,但是也存在一些问题。比如学习时间比较短,每次外出处缺可能会重复一些学过的内容,不是说多次学习不好,但在相对比较短的时间内,想尽量的多学东西就相对困难。
所以提出以下意见希望能采纳:能够提供一个培训的地方,能有一两件实习设备,这样能有更多的尝试机会,因为在实际工作中,大部分都是一些正在运行的设备或者是和正在运行的设备相关的设备进行处缺,所以不能够对设备和系统有个比较全面的了解和掌握。
供电公司
第五篇:IT运维监管控一体化解决方案
IT运维监管控一体化解决方案
IT运维管理闭环体系
2010-11-17
本文论述了IT运维监管控一体化趋势,建设要求、原则,方案整体设计和具体实现。
IT运维监管控一体化解决方案
目 录
1.2.3.4.IT运维服务管理概述......................................................................................................5 IT运维管理一体化管理解决之道..................................................................................6 IT运维一体化建设目标..................................................................................................6 系统设计原则...................................................................................................................7 4.1.4.2.4.3.4.4.4.5.4.6.4.7.4.8.5.系统的先进性.......................................................................................................7 系统的实用性.......................................................................................................7 系统的有效性.......................................................................................................7 系统的可行性.......................................................................................................7 系统的可靠性.......................................................................................................8 系统的开放性.......................................................................................................8 系统的扩展性.......................................................................................................8 系统的安全性.......................................................................................................8
IT运维一体化平台建设原则..........................................................................................8 5.1.5.2.5.3.5.4.5.5.5.6.统一规划...............................................................................................................8 转变观念...............................................................................................................9 分步实施...............................................................................................................9 可插拔模块化.......................................................................................................9 有所为,有所不为.............................................................................................10 不唯美,而唯实.................................................................................................10
6.IT运维一体化解决方案................................................................................................10 6.1.6.2.6.3.6.4.6.5.理解IT运维一体化...........................................................................................10 监视模块建设.....................................................................................................12 流程管理模块建设.............................................................................................12 自动化操作模块建设.........................................................................................13 CMDB建设........................................................................................................14 6.5.1.CMDB战略核心地位...............................................................................14
/ 28
IT运维监管控一体化解决方案
6.5.2.CMDB建设方法.......................................................................................15 6.5.3.CMDB建设保障.......................................................................................16 6.5.4.构建CMDB模型......................................................................................17 6.5.5.避免CMDB建设误区..............................................................................18 6.6.模块之间接口实现.............................................................................................18 6.6.1.监与管之间的接口....................................................................................18 6.6.2.管与控之间的接口....................................................................................19 6.7.7.报表系统.............................................................................................................19
IT运维一体化特点........................................................................................................20 7.1.7.2.7.3.7.4.7.5.7.6.7.7.监管控一体化整合.............................................................................................20 层级化展现平台.................................................................................................20 综合事件管理平台.............................................................................................20 全方位IT资源管理平台...................................................................................20 面向基础设施.....................................................................................................20 面向维护管理者.................................................................................................20 面向领导决策者.................................................................................................21
8.IT运维一体化系统功能................................................................................................21 8.1.8.2.8.3.8.4.8.5.8.6.8.7.8.8.8.9.信息门户.............................................................................................................21 事故管理.............................................................................................................21 问题管理.............................................................................................................22 变更管理:.........................................................................................................22 发布管理.............................................................................................................23 配置管理.............................................................................................................23 工单管理.............................................................................................................23 作业计划.............................................................................................................23 值班管理.............................................................................................................24
8.10.考核管理.............................................................................................................24 8.11.代维管理.............................................................................................................24 8.12.知识管理.............................................................................................................25 8.13.安全管理.............................................................................................................25
/ 28
IT运维监管控一体化解决方案
8.14.服务持续性管理.................................................................................................25 8.15.容量管理.............................................................................................................25 8.16.可用性管理.........................................................................................................26 9.总结.................................................................................................................................26 9.1.9.2.IT运维管理内容层面........................................................................................26 IT运维一体化优势............................................................................................27
/ 28
IT运维监管控一体化解决方案
1.IT运维服务管理概述
随着企业信息化程度的提高、IT环境规模的扩大和IT环境复杂度的增加、行业内服务竞争的加剧,如何保证IT系统安全稳定运行,为业务提供可持继性的支撑,最优化IT环境的性能,有效控制IT成本和计划IT投资,这些都对IT系统运行维护支持以及IT服务水平提出了新的要求和挑战。
面对的挑战:
越来越高的服务成本 以流程管理为驱动的转型阶段 从以“技术为中心”向“业务驱动”的转型 服务协议成为最佳成果的代名词
合作伙伴关系将替代“客户-供应商”的简单关系 服务成为应用的代名词
信息技术在业务中起着越来越重要的作用,越来越多的业务流程依赖IT技术。从技术和业务的双重视角对其进行有效管理,保障业务处理平台高效、安全、正常运行,为业务服务提供有力支撑成了运维人员和IT部门的常态工作。
如何在企业内部建立起一套有效的运维交互平台,理顺不同部门以及上下级之间的协作关系,规范工作流程,提高工作效率,实现故障处理、资源调度优化、系统割接、业务保障等运维工作的闭环流程监控和管理,是目前各IT运维部门关心的问题。
/ 28
IT运维监管控一体化解决方案
但是,由于业务快速变化、用户环境日益复杂、IT应用日益繁多等因素导致了IT服务与实际业务需求脱钩,IT服务与业务部门的实际要求出现鸿沟,由此催生了面向“IT服务”的管理挑战与需求―――IT服务管理。IT服务管理立足于服务,建立以客户为中心,以流程为导向,从业务角度出发的全新的IT管理模式,通过整合IT 服务与业务,提高了组织对外提供服务的能力,是真正实现这种服务管理的有效途径,能帮助用户最终实现IT与业务的融合。
2.IT运维管理一体化管理解决之道
受习惯、时间、财力等诸多因素的影响,在迈入IT服务管理过渡阶段过程中,大多数客户的IT服务部门管理的变革没能跟上技术的发展,未对IT服务管理进行整体规划,没有导入适合现阶段的管理机制,依然沿用“被动响应、救火队”服务支持管理模式,依然缺乏适用的自动化管理流程,导致IT服务管理能力低下。
IT运维一体化平台依靠对复杂异构的IT资源环境(网络设备、安全设备、服务器、存储、机房环境、操作系统、数据库、中间件、业务系统、IT资产、日常工作、外包管理......)的一体化监(面向业务服务的监视)、管(面向运维流程的管理)、控(面向日常运维的控制),最终达到保障IT基础架构稳定可靠运行、降低系统和业务应用宕机风险、提高运维支持和服务管理效率、优化运维流程、建立绩效体系、控制运维成本、改进决策过程的目标。
3.IT运维一体化建设目标
IT运维一体化平台的总体目标是建立一个稳定、高效、灵活的IT运行和维护管理体系,涵盖IT运维工作中的监、管、控三方面,为业务应用正常运行提供有力的支撑,提高信息系统运行效率,提高服务质量,降低运营的成本。
实时管理:及时发现故障与异常,并迅速定位,尽快解决;通过运行分析,调整运行策略;通过业务系统性能的测量和管理,优化系统性能,提高系统运行效率。 闭环管理:通过科学规范化的流程管理保证故障、异常、隐患由相应的人员采用必要的方式闭环处理;促进巡检、变更的工作标准化、规范化;通过流程运行的考核数据,促进运维质量和运维效率的提高。
精益管理:通过丰富完善的报表和图档资料,为运行维护工作提供直观准确基础数据;避免维护工作中的疏漏而带来的人力、资金浪费;分析信息基础设施的运行负荷,制定合理的资源调配方案。
/ 28
IT运维监管控一体化解决方案
战略管理:优化现有的IT基础设施的运行性能;提升系统性能;预测并计划信息基础设施的需求;考核并不断提升服务水平。
4.系统设计原则
4.1.系统的先进性
先进性是每一个IT系统建设不断追求的目标。随着IT技术的迅速发展,更新的、更先进的技术和思想总是在不断出现,因此,系统设计必须兼顾先进性。
系统规划的先进性是将系统看成一个有机的整体工程,不但在规划时要考虑到它的目前现状,还要考虑它的发展和未来。不论硬件或软件,在应用目前相对成熟的技术基础之上,系统必须能够不断完善、扩充,功能越来越丰富,尽可能小的代价来适应系统需求的不断增长和技术的不断发展,使现有系统能够与IT运维需求同步增长。
4.2.系统的实用性
IT运维一体化平台建设能否成功,实用性非常重要。系统设计必须以实用为出发点,而不是一味追求新技术、新理念和照搬国外模式。IT运维平台是为IT环境支撑提供运维管理的基础。要达到实用性的要求,必须设计时充分考虑到国内情况、本行业特点和本企业实际状况,充分明确:提高自身的IT运维管理水平和提供更好的业务服务能力才是IT运维管理平台建设的根本目标。
4.3.系统的有效性
IT运维管理系统是IT部门每天工作的基础和平台,是IT部门的根本。如果不具备有效性,华而不实,很难设想IT部门如何开展工作,如何实现有效的IT运维管理,更无法谈论提供高质和高效的IT服务。
4.4.系统的可行性
IT运维的理念和设计规划再好,如果不具备可行性,也只是空中楼阁。因此,必须考虑系统建设的可行性。可行性的考虑包括:目前技术上是否可以实现、自身人力、物力和财力上的支撑。
/ 28
IT运维监管控一体化解决方案
4.5.系统的可靠性
IT运维系统的重要性不言而喻。如果IT运维系统运行故障而停止工作,那么企业的IT环境犹如没有控制盘的汽车,处在无序、惯性行驶的状态。此时,IT环境对于IT运维人员而言,完全陌生,处于隔离、未知、失控的状态。
对于IT运维管理系统,监控的失败或瘫痪相当于人失聪、失明,流程管理的失败相当于大脑丧失了思考能力,自动化运维操作的失败相当于截肢瘫痪。因此,任何模块的失败,后果都是严重的。IT运维系统本身的健壮性、自身完善性、稳定性是至关重要的。
IT运维平台是企业IT环境中实现正常运维工作的基础和管理平台。因此,IT系统建设一定要考虑系统的可靠性。
4.6.系统的开放性
IT技术发展日新月异,IT系统的开放性和标准性越来越成为一种趋势。只有采用开放的系统,使用开放的技术,才能保证整个系统有持久的生命周期,才能长期保护企业在IT运维的有效投入。例如:接口之间采用Corba,xml,jdbc,ftp,jdbc等开放技术。
4.7.系统的扩展性
随着IT业务系统的增加和IT环境规模的扩大,随着时间的推移和情况的变化,无不需要考虑系统功能的变化和调整。因此,IT运维一体化平台系统需要具有很强的扩展能力和适应能力。
4.8.系统的安全性
基于IT运维管理系统的角色,IT运维系统的安全变得至为关键。很难想象,IT运维管理系统由于病毒或者安全入侵,导致IT运维平台瘫痪带来的后果。
5.IT运维一体化平台建设原则
5.1.统一规划
IT运维一体化建设中必须坚持统一的规划、明确的发展方向和思路,在全局、宏观上做到统筹安排,合理规划。实施对整体架构和数据模型的统一管控。
/ 28
IT运维监管控一体化解决方案
5.2.转变观念
任何生产活动都是人来主导的,IT运维管理体系的建设不单是一个软硬件系统的建设,还是一个运维团队和人文的建设。IT运维一体化平台的建设,是IT运维理念和管理上的一次划阶段的变革,它需要整个IT运维部门的文化、体制和思想也要作相应的转变和调整才能成功。根据以往情况,企业的IT部门往往都是技术至上的工程师文化,而这种源于研发企业的文化和现今IT管理部门作为业务支撑部门的定位严重不符。因此,完善IT服务管理的过程,也必然是部门文化和IT运维理念和体制转变的过程。在建设IT服务管理体系的过程中应遵循以下2个原则:
高起点,借鉴业界先进的管理模型和方法。
重执行,任何管理规范和流程的制定都要以可执行,可考核为前提。
5.3.分步实施
IT管理体系的建立和完善不可能一蹴而就,需要有长期的计划步骤实施,必须循序渐进,遵循分阶段和迭代实施的原则。
横向扩展:从个别的业务系统扩展到所有的业务系统,规模上逐步从小到大。 纵向加深:功能上逐步完善、丰富和细化,模块和子模块数量从少到多,从有到优。 制定计划,“有重点、分阶段”展开。
5.4.可插拔模块化
IT运维一体化平台涵盖了IT运维工作的各个方面,从全局到局部,从宏观到细节。系统架构设计必须以模块化为基础。
必须平衡考虑系统内部模块的松散性和耦合性。作为同一平台内部的模块,由于相互协作,模块和子系统之间必然存在着耦合性。另一方面,为了控制单点故障带来的对系统整体的影响,必须有效控制单点故障后所影响的范围并在此基础上才有可能提供快速恢复的能力。
模块化为可插拔性提供了可能,使得系统设计上可扩展性原则得以实现。 可插拔化:为模块的升级、优化和采用新技术,提供了实现的前提。不同组件、不同层面的模块的替换,对系统的其他模块是透明的。局部的调整和升级并不对系统的整体架构产生必要的调整。
/ 28
IT运维监管控一体化解决方案
5.5.有所为,有所不为
在一个阶段,不求大、不求全。求大求全,则难以有所为,必然陷于被动。必须明确,有所不为而后可以有为。
5.6.不唯美,而唯实
过分追求完美,会导致华而不实,会导致系统本身和建设上的虚、浮、躁。只有尊重实际情况,才能脚踏实地,步步为营,有效推进IT运维管理工作的建设并不断提高。
6.IT运维一体化解决方案
6.1.理解IT运维一体化
针对IT运维,我们划分为三个方面,监视、管理和控制。“监、管、控”三者紧密关联,逻辑上是一条龙过程,并形成闭合环路。
监控的结果作为依据来分析、决策和指导IT运维工作的进行;IT运维工作本身需要流程管理来进行规范和控制;自动化运维操作将运维工作中大量、重复的劳动来批量控制,自动完成,节省人力,并提高效率。运维工作的质量和结果需要监控来进一步实现观察和确认,以判断是否符合工作预期,必要时,再次调整和提高。
可以说,监视是我们的眼睛,帮助我们透视和认清网络、主机、应用等整个IT环境,是我们的情报来源;流程管理是我们的大脑,帮助我们思考、制定决策和完成流程控制和管
/ 28
IT运维监管控一体化解决方案
理,是我们的情报分析和决策中心;控制是我们的双手,完成自动化批量处理,是我们的实施力量和手段。由此,我们说,“监、管、控”,这是有序的一条龙过程。
双手完成运维处理和控制动作之后,我们需要眼睛再次监视,来查看控制结果。继而,需要大脑来审验:是否符合预期?是否需要进一步调整和控制?如是,进而开始新的“监管控”流转过程。由此,我们还可以说,“监、管、控”,这又是一个闭合的环路过程。
IT“监管控”一体化运维,就是真正实现上面的一条龙过程和达到闭合环路的目的。在IT“监管控”一体化运维模式下,当监控管理模块发现故障并产生告警后,如满足相应的过滤和触发条件,通过接口会自动触发运维流程管理模块生成相应的工单,运维流程管理模块依据工单信息和相应运维人员预先设置好的关联条件,自动寻找、识别和匹配自动化运维模块中的操作脚本,实现自动和快速的故障操作处理。由此实现从发现故障到解决故障的IT运维全自动化,并自动完成运维操作日志记录,以备事后回顾和审计。
IT运维自动化不是IT运维工作简单的维护过程的改变,而是IT运维管理工作的根本变革,是IT运维管理的发展趋势。
在IT“监管控”一体化的运维平台中,原来的网管监控、运维流程管理和自动化运维操作平台转化为对应的“监、管、控”三个模块。
IT运维一体化平台应在设计之始即充分遵循ITIL理论,并结合国内现状、行业特点与实践经验,建立以服务流程为驱动的管理平台,实现人员、流程、技术三方面的完美结合。唯此,才能够在帮助用户深耕基础架构、夯实基础之后,与用户一起建立遵循先进流程管理思想的ITIL理论、实现以服务流程驱动为导向的实用的“人管流程”。IT运维一体化平台为用户带来“IT管理理念+系统工具+过程方法”的全新的IT服务管理组合,为用户提供包括管理流程与规范、业务及实施方法在内的全方位IT运维服务管理一体化解决方案。
IT服务管理的最终目标是实现业务与技术的融合,IT运维一体化平台紧扣业务部门与IT部门融合要求,提供业务与技术沟通和连接的平台,将业务部门与IT部门紧密结合在一起,能够帮助用户持续提高业务部门和客户的满意度,为客户的IT服务管理做出贡献,提高用户的核心竞争能力。
实施IT运维管理一体化可以帮助企业将IT系统原来的混乱状态变到主动的管理状态,包括将技术导向变为流程/服务导向,将被动处理变为预防为主,将孤立、分散系统变为集成化的系统等等。
总之,IT运维管理一体化通过将人才、流程和工具技术进行有机结合,实现高质量、高可靠性的IT服务服务管理。
/ 28
IT运维监管控一体化解决方案
6.2.监视模块建设
IT监控内容:网络设备、链路、主机操作系统、数据库、存储、中间件、应用软件、业务服务、机房环境(温度、湿度)、机房门禁等。
通过IT网管监控,可以帮助运维部门和人员实现全天候自动检测,可以及时、快速发现故障,通过事件关联分析,并结合问题管理,实现快速定位故障根源、快速预防和恢复,从而提升IT运维响应能力,变被动式管理为主动式运维,使IT运维工作从事后“救火式”管理转变到事前预防型管理。
6.3.流程管理模块建设
IT运维管理涉及的对象包括设备、技术和人员。其中,人是IT运维生产力决定的因素。如何有效实现设备、技术和人员的统一管理,如何实现人的组织和行为的科学化和规范化,需要IT运维流程管理。
IT运维工作本身具有工作量大、全面、繁琐和复杂的特点,通过有效的IT运维流程管理平台,既可以梳理工作流程,又可以理顺部门之间和人员之间的职责关系,达到标准、规范、统一和科学的运维,保证IT运维工作无论是整体和全局,还是细节和局部,都能有效推进,避免IT运维工作的无序和混乱。
/ 28
IT运维监管控一体化解决方案
IT运维流程管理通过建模,提高流程的可控性。同时,IT运维流程管理提高IT运维管理和执行工作的透明度。传统手工运维流程的不可控性和不透明性给流程定制、管理和优化带来相当大的困难,而IT运维管流程管理可以帮助IT运维部门一目了然地看到整个流程的全局和各运维工作节点的状况。
通过标准化的IT运维流程管理,可以不断提高IT运维工作质量,提升企业内外的IT服务满意度。
电子运维流程管理系统定位于通过电子化手段来确保运维工作的流程化、工单化、自动化和信息化,实现对流程的实时监控与闭环管理。
6.4.自动化操作模块建设
在IT运维工作中,存在着大量和重复的劳动,如补丁安装、合规检查、配置收集、日常巡检等。计算机的一个重要特点,就是可以帮助人类完成大量的、重复的劳动。自动化运维,就是人类在IT运维工作中具体操作层面的计算机化。
通过自动化运维:
实现批量处理,高效、快速工作; 节省人力,降低人力成本;
/ 28
IT运维监管控一体化解决方案
将有限的IT运维人员解放出来,避免大部分时间和精力是处理简单的、大量的、重复的问题和工作,而是更多时间和精力关注如何提高和保障IT运维; 技术知识和操作脚本共享,运维操作精确化、同质化、优质化、规范化、统一化,避免运维工作中操作质量依赖于个体人员的知识、技术水平、工作责任心和态度等不可控因素;
实现转变:以前运维工作更多依赖于“运维英雄”和埋头苦干型员工,现在更多依赖于运维集体的力量;
交由计算机操作,可以避免人工误操作导致的逻辑错误;
实现运维操作简约化、透明化、规范化、标准化,有利于事前审核和事后检查。
6.5.CMDB建设
6.5.1.CMDB战略核心地位
作为ITIL/ITSM(IT服务管理)的核心,CMDB正从管理软件附属品的地位逐渐走入主流的战略核心地位。
企业的IT环境越来越复杂,数量庞大、品种繁多。信息散布在企业的不同地方、不同系统中,而且信息的格式、内容也是千差万别,难以统计、查询、利用这些信息,由此给使用、更新、维护、优化等管理工作造成了很大的麻烦,如何快速提供准确的配置信息是一个重大的挑战。
CMDB储存与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,一方面支持这些流程的流畅运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。
CMDB是描绘IT基础设施如何构建的一个蓝图,它记录了各种各样的配置项(即硬件、软件、事故、协议、服务级别、文档、部门、人员等资源)是如何相互关联的、以及各个系统是如何发挥作用的。
CMDB与传统的资产库有着根本的差别。资产库是一个存储企业所有资产的数据库,而CMDB不仅仅存储所有IT元素,更重要的是可以展示它们之间的相互关联,从而帮助企业了解IT资产的运行状态是什么样子,它对企业业务有什么影响等。
/ 28
IT运维监管控一体化解决方案
IT环境视图清晰地展现了各种IT设备、其属性以及相互关系;业务视图可以让每个人员明确,业务运作模式是什么样,不同业务关联到哪些设备,每个设备的故障影响到哪些业务等。
6.5.2.CMDB建设方法
CMDB是一个特殊的数据库,它必须拥有4个至关重要的功能:
联邦性:是指CMDB能直接获取多种数据源并与数据源联系在一起; 协调性:能够避免重复,并对来自不同数据源的配置项进行自动匹配; 同步性:即确保整个系统中的信息是同步更新的; 可视化:即可提供配置项(CIs)的端对端及层次化视图。
CMDB有两种,一种是物理的数据库,要求客户把全部配置项都拷贝到物理数据库里面去;另一种是虚拟的数据库,如MO的CMDB,不要求客户把全部配置项都拷贝到物理数据库里,只维持关联关系就可以。
物理型CMDB数据库:存在两个问题:其一,不同数据库中的数据要全部无冗余地拷入CMDB,存在一定困难;其二,不同数据库中的数据也是不断地更新,要想同时把变更之后的数据传递给物理型CMDB,会带来网络流量方面的问题,也很难做维护。
虚拟型CMDB:通过指针索引的方式去获得其他数据库里的配置项信息,不存在以上两个问题。但是,虚拟性CMDB需要人工梳理和比对大量的关联关系,并不断更新。
CMDB通常采用三种实施方法:自上而下、自中而上、自下而上。每种方法对现有配置数据的实施要求在范围和程度上都不一样。
自下而上的方法:也就是从底层开始,首先查找企业内的所有CI(配置项),着手建立一个大的数据库,然后查找CI之间的关联关系和对业务的影响。这种方法往往要花几年时间才能完成。
自上而下的方法:就是从小的局部系统开始实施,比如信贷核心系统,从这个业务开始着手,然后把底下与此业务相关的所有IT元素全都关联过来。这样的好处是可以在比较短的时间内即一个月做出一个完整的CMDB,而不需要花若干年。 自中而上的方法:就是采用折中方法建立CMDB,它是通过在企业建设过程中,将逐步形成的分散的、独立的、自身需要的信息资源库在CI层面上进行逻辑联邦和同步,建立起虚拟的CMDB。
/ 28
IT运维监管控一体化解决方案
自中而上的方法,可以帮助用户在短时间内建立起企业内需要的CMDB。CI信息全面,同时见效快,既避免大规模的CMDB建设的时间长、见效慢的缺点,也避免了单点突出建设CMDB的CI范围狭窄、完整度不足的缺点。
具体建设CMDB时,需要从两个层面来实施:
一是采集基础数据。要通过适配器把数据采集上来,然后放到一个大的数据库中。
二是建立业务视图和业务影响分析。业务视图反映业务流程运作的情况是不是正常,有没有问题等。这需要按照业务性质、业务流程等建立模型。
通过建模工具,建立描述业务流程的树状模型,模型上的每个结点上把每个配置项(CI)的影响以及相互影响放在上面,一旦某个配置项出现问题,图上就可以实时反映出来。为了建立业务视图,IT部门需要得到业务部门的大力支持。
6.5.3.CMDB建设保障
企业在实施ITIL项目的时候,配置管理常常被视为项目的软肋,费时费力,却事倍功半。究其原因主要是因为企业在建设CMDB(配置管理数据库)的时候,往往不知所措,耗费了大量的人力和时间收集各类IT基础架构信息,最后得到的却是一个极其复杂而难以维护的“IT基础架构信息库”。这与ITIL描绘的配置管理是企业实践IT服务管理的基础或核心,为ITIL其它流程提供基础信息的关键地位相去甚远。正确来构建CMDB,必须有如下保障:
制定配置管理政策
IT运维管理政策,是指导和规范IT运维管理的行动指南和共同纲领。它使企业在认识上形成统一,减少了不必要的沟通成本,并使企业在流程执行上事半功倍。对于构建CMDB而言,主要有以下两类政策:
宏观政策,主要是涉及公司或IT部门层面指导性、方向性的政策,其目标是在企业内部形成统一认识。如:企业IT内部应当使用统一的配置管理流程,并且使用标准的文档记录和汇报机制。
运营政策,主要涉及到流程目标、人员、输入、输出、活动以及KPI(关键绩效指标)等各要素以及流程之间相互协调、信息交互方面的指导原则,其目标是使流程能够在政策的指引下稳健、有效地执行。
确定配置管理的范围
/ 28
IT运维监管控一体化解决方案
政策的制订定为企业构建CMDB营造了良好的环境,配置管理范围的确定才是企业构建CMDB的真正开始。配置管理的范围主要指的是CI的宽度和深度,以及CI的生命周期。(注:ITIL所提到的配置管理范围主要指的是CI的宽度和深度,CI的生命周期ITIL认为是从CI的接收到最终的报废退出,但在实施过程中,由于流程管理主体的差异化,对CI管理的生命周期的划分也有所不同。)
6.5.4.构建CMDB模型
有了CMDB建设保障之后,可以来梳理配置项信息及其关系,从而设计出CMDB模型蓝图,主要包括以下步骤:
定义配置项的关系
配置项(CI)之间关系的定义也是配置管理建设和IT资产管理建设的区别点之一。可以采取两种方法进行具体的梳理工作,一种是“自上而下”;另一种是“自下而上”。
“自上而下”方法一般要求企业已经明确了对外提供的服务目录,然后基于服务目录按照“业务服务——》IT服务——》IT系统——》IT组件”的顺序进行梳理。
顾名思义,“自下而上”方法是“自上而下”方法的逆向过程,企业先从对内部IT组件关系进行梳理的过程开始,然后逐步将IT组件映射到IT服务。相对来说,当前“自下而上”的方法适用范围更广。
定义配置项的属性
在构建CMDB的过程中,除了构建配置项(CI)关系外,还需要为每个配置项(CI)定义属性。
设计IT服务模型蓝图
最后,构建一份IT服务模型蓝图。蓝图主要起到了两个作用,一方面它是对当前企业CMDB建设工作成果的验证;另一方面,它也是对将来企业改进和完善CMDB建设方向的一种指引。通常蓝图中应该包括以下内容:判断CI的标准;定义CI属性、关系的准则 ;持续改进方案和过程;当前的IT服务模型等。
CMDB旨在存储与管理企业IT架构中设备的各种配置信息,有别于传统的数据库。CMDB作为统一的配置管理库,必须全面、细致而准确地记录和保存各种软硬件配置信息,以便支撑事件、问题、变更、发布等各种ITSM流程,成为整个 IT运维管理的基础。
/ 28
IT运维监管控一体化解决方案
6.5.5.避免CMDB建设误区
CMDB建设是一项“意义大、投入大、见效缓”的地基工程。需要明确系统定位和理清功能的前提下,应该确立并坚持以下原则:
应用场景决定管理粒度和幅度; 数据维护紧密结合ITSM流程; 自动采集作为数据核查手段; 专题应用带动数据维护;
配置项关系呈现直观化作为系统特色。
基于了上述原则,才能避免CMBD建设陷入数据“维护难 – 消费少 – 不准确 – 消费更少”的恶性循环,才能把项目带到了实用、有效阶段。
在CMDB建设和应用中,必须注意基础数据准确性的问题。如果用户保存了基础资源配置数据,但是存在较大的不规范、不全面的问题:设备的厂家、型号不规范,不符合系统要求;资源之间的关联关系缺乏,无法有效支持IT运维管理。
必须认识到,系统功能加上基础数据等于系统能力,系统能力加上频繁使用等于业务成效。如何保证数据质量,使系统成效发挥出来,避免功亏一篑,是CMDB建设中不可忽略的问题。
6.6.模块之间接口实现 6.6.1.监与管之间的接口
网管监控模块与流程管理模块之间的接口,主要体现为某些满足预定条件的告警自动触发生成电子工单,进入流程管理模块。
因此,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确定触发条件,是设置此接口的关键之处。
如果未能正确设置触发条件,则会导致错误工单的产生,如工单类别错误。
如果未能准确设置触发条件,则会导致工单内容的不准确,如责任人或责任部门的错误。如果未能全面设置触发条件,则会导致漏派发工单。
工单中的信息与告警中包含的信息既有交集,又有转换和有所区别。工单的故障信息内容和描述来源于告警信息,但是告警信息应用于网管监控层面,是为了全面准确反映监控结
/ 28
IT运维监管控一体化解决方案
果,描述故障现象。工单信息是应用于流程管理平台,是为了描述故障、界定责任范围、规范工单流转、跟踪工单等目的。
6.6.2.管与控之间的接口
IT流程管理的最终目的和效果反映在对运维操作的指导上,而对于批量的、重复的运维工作,可以高效、优质和规范化地通过自动化运维操作来实现。借助于IT“监管控”一体化运维平台,其中的流程管理和自动化运维操作模块之间的接口,运维部门和人员可以预先设置过滤和触发条件,根据工单信息,关联个别的自动化运维操作脚本。
因此,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确定触发条件,是设置此接口的关键之处。
如果未能正确设置触发条件,则会启动不必要的自动化运维操作,造成严重后果。如果未能准确设置触发条件,则会导致非预期的自动化运维操作。如果未能全面设置触发条件,则会导致遗漏预期的自动化运维操作。
6.7.报表系统
专业的IT运维报表可以准确、系统地反应IT信息系统运行状况和IT运维管理状况。对IT基础架构、业务系统运行走势和IT运维工作本身进行分析,反应目前整体现状,发现趋势和潜在问题,采用科学的手段完成评估,指导现在和未来的IT环境建设,促进后续工作的展开。包括:
事件类报表 告警类报表 问题报表 配置报表 工单类报表 „„
报表提供订阅的功能,对于用户订阅的报表,将定期自动生成html文件发送到用户邮箱中,方便用户查看。
用户也可根据需要选择将报表转换为pdf等其他格式。
/ 28
IT运维监管控一体化解决方案
7.IT运维一体化特点
7.1.监管控一体化整合
采用portal技术架构,克服了基础架构监控、运维服务管理和自动化操作运维的人为分割,实现集中管理、统一展示、统一配置、随需定制、分权使用。
7.2.层级化展现平台
以业务监控为中心,以事件为基础,将基础资源监控与业务服务贯穿在一起,建立从整体到局部、从宏观到细节的不同颗粒细度的层级化IT运维视图,以满足不同部门、不同级别领导和运维人员的关注层面和工作需求。
7.3.综合事件管理平台
各类基础架构的故障、性能、配置事件汇总并通过规则策略库和服务依赖模型,提供全面、及时、准确的、高效灵活的事件压缩、过滤、关联能力。
7.4.全方位IT资源管理平台
自动发现的IT资源数据库(RDB)与流程管理配置管理库(CMDB)的定期同步,实现资源管理数据的整个生命周期的管理。
7.5.面向基础设施
全面的系统资源管理:提供对网络、主机、存储设备、安全设备、数据库、中间件及应用软件、机房环境等IT资源的全面监控管理。
智能化的故障管理:自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的快速定位和处理。
性能管理与优化:对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为IT环境性能优化提供科学依据。
7.6.面向维护管理者
运维服务管理:将人、技术与流程进行有效地融合,实现日常运维工作的自动化、信息化和标准化。
/ 28
IT运维监管控一体化解决方案
智能总控中心:实时展现当前企业IT系统的运行状态及趋势,帮助管理人员快速发现问题,分析和确定问题所在。
知识库:自动实现运维知识的积累、沉淀和共享,从而降低IT运维管理对个人的依赖。
7.7.面向领导决策者
综合报表:对系统运行状况的信息进行汇总,帮助领导更全面的了解网络系统的运行状况和趋势,为领导决策提供科学依据。
绩效评估依据解决:借助自动生成的各种工作记录,领导可对运维人员的绩效进行客观的评估
8.IT运维一体化系统功能
8.1.信息门户
IT运维一体化系统应该基于WEB实现,提供统一的portal信息门户平台,可以呈现各类发布信息,和各项IT运维工作的统一入口。同时提供个人工作室功能,不同用户可根据日常使用各项功能的频次自行定义工作桌面,为操作者迅速进入各项功能模块提供快捷手段。
个人桌面管理 待办事宜 已处理事宜 日程安排 工作计划及总结 个人收藏夹 任务管理 便笺管理 等
8.2.事故管理
事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。
/ 28
IT运维监管控一体化解决方案
8.3.问题管理
当事件在第一时间没得到及时解决,就进入问题管理程序。
问题管理的重要性:通常80%的服务品质下降都是因为20%的问题,所以专注与20%的问题解决可以大大的提升服务。
问题管理的目标:将 IT 基础设施内的错误引起的事故和问题对业务的负面影响减到最小,并防止与这些错误相关的事故再度发生。为了实现这个目标,“故障管理”力求找到引发事故的根源,然后才着手改善或纠正该情况。
问题管理流程具有被动和主动两个方面:
被动方面是作为对一个或多个事故的反应而解决问题。问题分析方法: 定义问题;
按个体、地点、时间以及范围大小描述问题;
建立可能的原因;
测试最有可能发生的原因;
验证真正的原因。
主动“故障管理”是指通过趋势分析和定期的事件统计表,在事故发生前确定并解决问题和已知错误。
8.4.变更管理:
变更管理流程的目标:确保利用标准化的方法和规程有效、及时地处理所有变更,以便将由变更引起的事故对服务质量的影响减到最小或将事件数减少,并因此改进日常运维。
最常见的是终端用户提出的请求,其中有些是系统改进或增加功能的请求,有些是常规变更(如帮新进人员建立新的账号),有的可能是系统出错,这在IT 中通常称为事件,如果是系统出错就要找出原因和解决步骤,才能进入到变更管理的第一步:RFC提出变更请求,变更请求应该包括(RFC编号、问题编号、那些配置项需要改变、变更的理由、如果不变更会造成的影响、变更人的联系方式);变更管理员负责监督变更从提出到解决的整个过程记录进CMDB、对变更请求进行过滤;同时提交变更到公司指定的变更管理委员会批准。变更管理需要有准确的CMDB配置管理数据库,对变更进行分析。
/ 28
IT运维监管控一体化解决方案
8.5.发布管理
发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发,它由变更管理流程控制。
8.6.配置管理
在上边的变更管理中,我们提到当一个RFC进入变更程序的时,管理员和CAB需要有一个方法评估变更可能造成的影响,而评估需要的相关信息需要一个机制来提供,这个机制就是配置管理。
配置管理的目标是:
a.对公司内部的所有 IT 资产和配置及其服务作出说明
b.提供有关配置及其记录的准确信息以支持所有其他的“服务管理”流程 c.为“事故管理”、“故障管理”、“变更管理”和“发布管理”提供坚实的基础 d.对照基础设施验证配置记录并纠正任何异常情况
8.7.工单管理
提供电子化工作流程和工作人员的考核依据,实现运维工作管理的科学化、规范化和自动化。支持工单流程的自定义,方便配置成适合特定用户需求的流程管理平台。
基于工单的流程管理是流程管理模块的核心功能。工单管理有三个来源入口: 监视模块:网管监控系统发出告警,满足预先设置的过滤等条件触发产生工单,送转到流程管理系统。
领导派单; 服务台报单。
8.8.作业计划
作业计划模块主要实现针对各类运维作业计划工作的电子化管理,包括作业计划大纲管理、作业计划管理、月度作业计划、周作业计划、日作业计划等管理等模块。用户根据下发的作业计划大纲,进行作业计划模板定制和模板管理,再使用作业计划管理模块制定计划、月度计划、周计划和日计划。本功能模块主要包括如下功能:
大纲的制定、查询、修改 计划的建立、查询和审核
/ 28
IT运维监管控一体化解决方案
月度计划的建立、查询和审核 基于模板的作业计划制定 待执行作业计划提醒 作业计划执行情况考核 作业计划执行情况统计分析
8.9.值班管理
值班管理功能模块主要实现统一的机房电子化值班管理,将排班安排、值班日志、交班记录、维护作业记录,以及由各项维护规程和管理办法中确定的周期性维护作业计划等任务集成至该系统中,使得当班人员能够准确、高效地完成各项维护任务。值班管理具有以下功能:
电子化排班:排班任务制定后值班人员直接收到排班结果; 值班机房配置:支持对所有机房值班相关数据的灵活配置;
值班信息管理:故障巡查、线路巡检、网管巡查等值班数据信息的自动记录; 交接班管理:交接班人员通过本系统进行交接班,并自动记录交接班日志; 值班日志管理:对值班日志提供查询统计功能。
8.10.考核管理
结合用户的运维考核制度和考核办法,根据系统对日常运维工作的自动记录,考核模块能够实现对作业计划、工单调度、值班、代维等工作的考核管理功能。
8.11.代维管理
代维管理:针对行业特点和企业实际,增加代维管理。很多企业为了更让自己关注自己的核心业务并提高IT运维水平,而将自己的IT运维工作或者部分IT运维工作外包给更专业的第三方。因此,有必要规范外包方与承包方之间的关系和管理,包括工作内容、工作量的考核。
代维管理通过电子化平台实现与代维公司之间的联系,将代维公司的日常工作与用户的管理流程结合起来。由此实现对代维工作的规范化和高效的管理,同时建立代维公司的考核机制,实现优胜劣汰。
代维项目管理
/ 28
IT运维监管控一体化解决方案
代维合同管理
代维公司、代维队、代维人员管理 代维工作计划 代维记录 代维报告 代维问题跟踪 代维考核
8.12.知识管理
经验库管理:保存故障分析、问题分析经验或分析系统问题产生的原因等知识,为操作人员在解决各类问题时提供必要的经验或知识支持的专家经验系统。 资料管理:运用电子化手段对包括备品备件、各专业日常操作维护资料、运维人员资料、相关部门资料等信息进行添加、修改、删除、分类、归档、查看等操作。
8.13.安全管理
多用户、分级别、分权限设置 用户登录日志 用户操作日志
用户数量、登录位置、密码等安全限制
8.14.服务持续性管理
IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务,从而支持组织的业务持续运作的能力。
8.15.容量管理
容量管理的目的:确保以最有效和实时的方式提供目前以及未来因业务需求而增长的IT容量。
容量管理分三步走:收集与容量有关的技术信息、SLA、业务规划、IT计划、业务的需求以及数量大小,和财务规划与预算;
/ 28
IT运维监管控一体化解决方案
容量管理是大多数 IT 部门一直面临的一个挑战,因为基础设施和服务需求每天都在发生变化。如果没有财务限制,“容量管理”就会很简单。但是,实际上财务限制以及合理利用旧系统中的投资这种需求将继续使容量管理成为一个挑战。
8.16.可用性管理
可用性管理流程的目标:优化 IT 基础设施的容量、服务和支持的公司,以便提供成本效益且使企业满足其业务目标的可用性级别,在成本和可用性之间取得平衡。
可用性管理是通过分析用户和业务方的可用性需求并据以优化和设计IT基础架构的可用性,从而确保以合理的成本满足不断增长的可用性需求的管理流程。可用性管理是一个前瞻性的管理流程,它通过对业务和用户可用性需求的定位,使得IT服务的设计建立在真实需求的基础上,从而避免IT服务运作中采用过度可用性级别,节约IT服务运作成本。
9.总结
9.1.IT运维管理内容层面
依据管理内容对IT管理阶段大致分为:对基础架构的管理和对业务服务的管理。基础架构管理是IT管理的基础和底层数据的来源,也是管理的基本元素和根基。业务服务的管理是建立在基础架构管理的基础上,从业务的视角来衡量IT运维,是面向业务服务的IT运维管理。
以上述管理内容为主旨的IT运维管理系统,在管理思路和功能展现上,需要体现以下两方面内容:
以基础设施管理为根本
这一块内容是管理的前提和保证。没有好的基础设施管理作为保证,其它管理都会成为空中楼阁。在基础设施管理中,首先要保证管理的范围适当齐全,其次要保证管理的设备类型要完整,最后要保证管理的深度适当足够,以保证获取的底层数据要充分和有效。
以业务为中心管理思想
以业务为中心是IT全面运维管理解决方案最根本的因素。今天,IT环境仅有“可用性”是不够的,只有为业务提供最优性能才能使之立足。可用性、性能测量和管理都是当今运维管理的组成部分。性能测量应当融入全面IT运维管理解决方案并与之紧密配合,提供前瞻性预测和管理,而不仅仅是做事后诸葛亮。
/ 28
IT运维监管控一体化解决方案
9.2.IT运维一体化优势
企业的生产活动对IT环境的依赖性越来越强,IT环境规模不断扩大,架构异构度和复杂度不断增加,这些无疑对IT运维工作提出了更大的挑战。尽管存在这样或那样的风险和难度,但是IT“监管控”运维一体化仍然是不可逃避的趋势。
有了IT“监管控”运维一体化的综合运维平台,可以有效实现: 单点登录; 统一安全管理;
统一资源管理,整合一致的CMDB; 统一用户管理和角色管理; 统一展现模式;
通过模块之间的接口,借助于合理配置的正确和准确的触发条件,基于统一的CMDB核心,数据流转可以在模块之间自由完成ETL(抽取、转换和载入),真正实现IT运维工作一条龙的自动化;
在一体化平台内部,以前相互隔离的监控、流程、自动化运维平台演变为一体化平台内部的模块,既相互独立,又密切关联,相互衔接,业务逻辑上形成闭合环路,代表了IT运维工作的发展趋势;
/ 28
IT运维监管控一体化解决方案
同时,借助于IT“监管控”运维一体化,可以完善我们IT运维工作中的PDCA(Plan-Do-Check-Action)管理循环,达到良性的PDCA循环式阶梯上升过程。我们在IT流程管理模块中根据监视结果完成情报分析,提出计划和具体步骤(完成PDCA中的Plan阶段),在自动化操作模块中完成执行动作(完成PDCA中的Do阶段),在进一步的监视结果中,检查确认Do的效果(完成PDCA中的Check阶段),然后依据最新的监视结果进行调整(完成PDCA中的Adjust阶段),即制定新的计划(Plan),从而开始进入下一个PDCA循环。由此,达到运维质量的不断改进和提高(Improve)。
/ 28