第一篇:一个基于ITIL的运维项目介绍总结
IT运维工作是自己工作的一个组成部分,这里就着一个项目的实施经验,谈谈ITIL是怎么和具体项目结合落地的。
一、项目介绍
这是一个跨地域的数据采集、传输与处理的运维项目,其特点为:
1、1、跨地域广。覆盖全国16个省会城市的数据采集点(托管在当地IDC机房),北京城东、西两个数据处理点,一个位于城中的业务处理与技术支持中心。
2、2、业务要求的稳定性高,7*24服务,RTO与RPO要求高。
3、3、设备种类多。有视频信号接入设备,机顶盒(由于属于民用设备,后期统计看该设备的故障最高),由工控机承担的采集机,PC机做的预处理机,还有存储服务器,阵列柜,数据库服务器以及其他网络设备和传输线路等。
4、4、牵扯人员多。包括IDC服务工程师,传输服务商,数据中心与业务中心的业务人员,技术人员和管理人员等。
5、5、沟通渠道复杂。每个环节都需要保证畅通的沟通渠道以保证和相关人员沟通信息。二、二、项目目标
在这个项目中本人承担的角色,对内是IT服务角色,对内部的业务部门提供IT运维支持,对外承担管理服务商的角色,按与服务商签订的SLA进行跟踪管理。
项目的目标是:建立一个运维体系和信息化平台,把所有业务环节、服务流程与人员纳入到这个平台中,有效合理的调配资源,及时发现处理重要事件,提高运维效率,提高运维质量从而提高IT服务支持能力,提高用户满意度。
结合公司实际运维需求与能力,最终把项目的实施范围锁定在“服务支持”流程上,包括服务台功能,事件管理、问题管理、配置管理、变更管理和发布管理上。不求做的多,但求实用与质量。
三、技术设计
因为是跨地域的使用系统,因此采用B/S系统架构,尽管可能再速度上和表现界面上有些缺陷,但对我们这个应用来说这两点都不是核心需求。在开发语言上选择的是.NTE,数据库选择是SQL Server,这也是和我们目前产品采用一致的技术路线,方便日后的维护和对接。
服务台
上次在1中说了项目的背景介绍,在这里开始介绍这个项目是如何实施的。
ITIL从哪里下手?听到不少人是从“服务台”来做的。如果按我的理想规划来说,从“配置管理”做起比较合理,因为配置管理是所有其他模块的支持核心,它不但对其他模块的有效执行起到信息支持的功能,同时其他模块也要及时的变更配置库以保证配置库的最新有效状态。但这个实施的顺序是有潜在的适应要求的,对一个从无到有全新的系统,这个顺序无疑是正确的方式也容易操作,但具体到我这个项目,因为已经在运行当中,是边运营边建设的特点,假如这个时候再教条的从“配置管理”做起,那我将面对的是花费很大精力建立的“配置库”无流程可以配合使用,因此也会导致无流程维护其内容有效性的境地,这样的话,等到最后体系都建立完成,就会发现以前建立的配置库信息都失真无效,还要重新来过的情况。同时,在这个项目上,先做“服务台”也能立刻对外显示成果,这个成果确实也是领导需要的,当然也是我需要的。因此最后还是确定从“服务台”开始了这个运营体系的建设。
在ITIL中,服务台是有别于其他流程的,它被ITIL定义为“职能”而非“流程”,这也就说明了在我们实现该模块的时候,是要和其他模块的实现有区别有不同的。我知道不少人在实际落实上并没有注意到这点,而是把“服务台”当成一般流程一样看待,设计有专门的岗位,人员和流程,这点上我个人有些不同看法。”服务台”的核心职能是“单点受理用户事件,提供一般问题的处理支持和跟进事件处理的全过程,及时反馈给用户”等,这些事情如果照搬普通call center的模式,安排几个人在接通用户后,把问题再反馈给后续人员处理,那这个设置是没什么意义的,也许他是提高了快速响应,但并没有达到快速处理的目的。有价值的服务台是能在最短时间内提供有效的方案解决用户出现的问题,而这需要有专业的知识,这不是普通热线人员能达到的水平。但假如为达到这个水平而设置一群技术人员专职从事这个事物,那必将导致成本的上升,对我们这个公司来说是没法支持这个模式的。
因此,在我们这个系统体系下,服务台就是直接由技术维护人员和具有一定技术能力的业务骨干来充当的,他们各自分管设备和流程的一部分,这些分工信息对用户是公开的,因此当各自分管的工作出现问题时,用户直接可以联系到这些人员以得到及时的帮助,这些人对该事件负责,也负责其他服务台的职责。在这里可以看出,我并没有拉出一个团队组建一个“服务台”这么一个组织,而是规划出一个虚拟的“服务台”团队,既是一线支持人员也是事件的管理者,当这些人员遇到不能解决的问题时,由他们负责后续的协调组织工作,直到事件处理接触。
所以,在我的这个运营体系中,“服务台”是被设计成嵌入在“事件管理”的流程中,成为了这个流程的一部分。对“服务台”的考核不是一天能受理多少客户电话,而是有多少客户需求被满足。只要流程、制度设计的完善,能完成“服务台”应该有的职责就可以了,而不必要一定建立一个专职的团队,尤其是在那些人力资源紧张的情况下。
事件管理 这个管理流程是整个系统最重要也是使用最多的,因此对它的严谨性,简洁性和标准性要求也就比较高。
结合实际项目的运营,我们把事件的起源分为两大类:主动事件和被动事件。主动事件是我们运维人员等通过内部的检查机制或者预警机制发现的问题或者发起的事件。被动事件是由系统使用的用户在使用过程中发现的问题事件和咨询等。这个分类主要是为了分析评估我们的检查机制和预警机制的功效。
事件类型被分为:“故障”、“咨询”、“新需求”和“维护通告”,基本上涵盖了所有重要的事件。而同时又从事件诊断角度对每个事件进行了分类,包括:电力、信号、网络传输、硬件设备、操作系统、应用软件、数据库和业务应用等,这样细分也是为了日后统计分析,有针对性的制定相关问题解决方案,充实知识库和CMDB。需要指出的是,这里的分类要考虑到与CMDB的同步,这样便于两种数据的互通。
不是所有的事件都要立马处理解决的,我们按照业务重要性(BIA)的特点和SLA的内容,根据事件的严重程度和紧急程度量化事件的严重等级。其中严重程度参考故障影响范围(频道数和流程数等),紧急程度参考RTO和RPO的需求。事件的严重等级最后确认为5级,并分别对每个级别做了行动预案,规定了流程、职责和批准关系等。
为了了解事件的实施进展,一个事件的全过程被区分为以下几个阶段:事件创建、事件等待、处理中、解决完毕,评审完毕,事件关闭。每个阶段都记录责任人,起止时间,用以评估每个环节和每个人的工作效率。各个阶段的切换必须由一定授权的人员完成,且受时间发起短的服务台人员的监控下。这里需要特点谈一下“评审完毕”的作用,有两个:一是确认项目当时的分类信息等是否正确,这样保证以后的统计正确性。二是确认事件是否引发“变更”流程,不论是知识库还是CMDB,都需要在这个阶段确认。一个事件真正意义的结束关闭不是简单的问题得到解决,一个完整的事件流程是所有对外问题,对内分类、变更的相关流程都完成结束以后。
问题、变更&发布管理
[问题管理] 问题管理是事件管理的后续与推进,这个阶段核心目标是把未知名问题转变为知名问题。问题管理的管理内容很大程度上是来自于事件的统计分析,问题管理的“关注度”其实就是继承了事件管理的“影响范围”和“严重程度”的结果。在规划问题管理的时候,其“等级度”这个属性是要和事件管理的相呼应,这样也是便于由事件管理到问题管理的平滑过度。不是所有的事件都要转化为问题来处理,到底该管理什么?一般关注的是“严重程度高的事件”和经过统计后“重复出现的事件”,严重程度高意味着严重度*影响范围的指标值就打,重复出现的事情的解决可以大大降低维护成本,减少资源,在这两类问题上花费资源是事半功倍的,别纠结在那些影响不大,或者偶尔才发生的事情上。
问题的创建不象事件,它还需要有个“审批”的过程,这也是确保资源的有效使用,避免过度反应。其次问题管理还和SLA、配置库、知识库等相关联,这在设计问题管理流程以及出入接口的时候应该注意的地方。总体来说问题管理不是ITIL的难点,关键要在实际中按设计的流程来执行。
[变更管理与发布管理] 尽管在ITIL中这两个是分开的独立流程,但在我们的业务流程中这两个环节是由一个部门先后顺序执行的,没有在部门这个角度上再区分。本来变更管理的核心并不是执行变更,而是变更需要在一定的授权和控制直下执行。发布的核心也是在一定授权的情况下实施的,以保证最新制定的变更能及时有效正确的部署到实际流程中,如果僵化的分开执行,不但加长了流程部门间的沟通协调工作,还可能导流程事件的延长,导致标准没有及时下达到实际生产流程中,形成不一致。因此只要在授权上和控制上设计的合适就没必要一定要两个流程来分别处理。但所有的变更都要保留历史和痕迹,这样有利于跟踪和职责管理。
变更管理中最重要的是配置库相关的变更,同时还有就是发布的版本控制问题,变更发布的时间点控制问题,目的是要避免影响正常业务环境。
第二篇:IT运维管理与ITIL
IT运维管理与ITIL
IT运维管理的由来
在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。NSM系统是对网络中的底层设备进行实时的,统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理,这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。
随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。同时,在国内IT管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。
因此,当前国内用户迫切需要一款能够对整个IT资源进行统一管理,解决IT资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。ITIL与IT运维管理的关系 ITIL诞生于国外,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。ITIL标准的底层是对IT基础设施的管理,最上层是对业务系统的流程化管理。
那么,ITIL和IT运维管理到底有什么关系?
就像文章开始说到的一样,企业最初设定IT部门进行IT管理的目的,就是希望通过IT部门能够发现和解决各种来自底层基础设施的问题,从而为保障网络的正常运转,为企业提供优质的IT服务。但随着企业IT系统和业务的不断发展,企业用户发现,单纯的通过对底层IT基础设施管理无法解决底层网络与上层业务系统之间的脱节问题。这也就是ITIL标准当初遇到的问题,最初主要是用来对IT部门的人员进行流程化和规范化的管理的,但它忽视了对底层平台的管理及对业务系统的保障,脱离了用户实际需要的ITIL,就像是空中楼阁,高不可及。近年来,为了更加贴近IT运维管理部门的工作需要,ITIL开始与企业的业务系统保障结合起来,形成了所谓BSM的管理模式,目的是使得ITIL能够更好的为企业的IT运维管理提供服务。
但问题在于,无论从哪个角度来讲,ITIL标准仅仅是一套方法论,没有告诉我们具体的流程该怎么做。而实际上这个流程是建立在对日常IT管理过程中,如何发现问题,如何解决问题的经验积累的基础上。但企业要实现ITIL需要的是结果,不会过多的关注这个过程怎么样。因此,这就需要IT管理的供应商来解决这个问题。那么,怎么发现问题,又怎么解决问题,这就需要通过IT管理供应商提供的IT运维管理系统来解决。通过IT运维管理系统来发现和解决各种来自IT系统的问题,保证企业的网络和运行在网络上的业务系统正常运转。在这个过程中,进行不断的经验积累,然后才能在此基础上实现ITIL的流程化管理。IT运维管理是ITIL标准体系的底层基础。只有将这个底层基础搭建完善,才能真正实现在此基础上流程化管理。当前国内IT运维管理现状
从IT运维管理的由来和两者的关系不难看出,当前国内大多数IT服务厂商强调的IT运维管理概念,其实就是在网络管理基础之上的拓展,包涵的范围不仅限于网络管理,是对整个IT系统和业务所涉及到的范围进行运维管理。但各IT服务供应商的产品对这个概念的体现不尽相同。至少在目前,实际上它还是网络管理(或者称之为IT基础架构管理)外加部分应用服务管理和业务管理的含义,只是说法不同而已。
国内企业经过多年的基础设施平台的搭建和完善,目前对于国内各行业的用户来说,首要保证的是业务系统的稳定运行,由业务的发展进而推进用户去进行全面的基于ITIL标准的流程化管理,这是一个循序渐进的过程,是需要分阶段分步骤来进行的。
第三篇:基于ITIL的IT运维管理系统概述
基于ITIL的IT运维管理系统概述
基于ITIL的流程框架的IT运维管理系统,能够快速适应企业业务流程及业务发展变化需求的IT运维管理最佳实践,能够帮助企业从人员、技术和流程三个方面提高IT运维管理能力,本文就来为大家介绍基于ITIL的IT运维管理系统。
基于ITIL的IT运维管理系统可以逐步建立并完善、达到以下目标:
标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维管理流程。
流程化——把大部分的IT运维管理工作流程化,确保这些工作都可重复,确保这些工作都能有质量完成。
自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。
基于ITIL的IT运维管理系统为用户解决了哪些问题:
运行维护管理—重要性
事前管理——通过监控系统,及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然,事前管理的目的。
迅即的故障报警—全天候自动检测与及时报警,通过多种告警方式实现网络的“全天候无人值守”,大大降低管理人员的工作负担。例:通过短消息告警和远程客户端管理的结合,用户可以在任何地方轻松的管理自己的网络,解决问题。
ITIL的标榜—IT服务最佳实践
提供灵活的、流程化的IT服务管理,帮助企业完成流程定义、流程执行、流程监控以及流程的优化。将日常操作全部流程化,并通过自动化工具对流程执行情况进行及时追踪。
业务流程化、流程自动化、服务规范化
通过流程管理来简化IT部门繁琐的业务,把维护人员从救火队员中解救出来,规范运营管理。本文叙述的IT运维管理系统以ITIL的流程框架,缔造一个流程化,自动化和规范化的IT运维管理系统。
以CMDB为运维核心,自动发现资源配置项
CMDB有两部分重要内容,一是CI,二是CI之间的关系,这两部分构成了CMDB比较核心的内容,在CMDB初始化方面,很多产品只是提供了手工输入的方式对CI 的初始化,用户需要面对大量的需要手工输入的信息,造成系统使用前的高门槛,而摩卡软件在这里提供了两种方式快速进行CMDB的初始化,第一种是自动发现CI,第二种是从Mocha BSM系统中导入,大大简化了用户管理员的工作,快速搭建ITIL最佳实践平台。
多种渠道新建故障处理请求 为了提交企业各部门所遇到的IT故障处理请求,用户可以通过自助服务台、电话通知服务台、监控系统自动触发等方式发起故障处理请求。通过自助服务台用户可快速新建故障处理请求,并随时追踪该故障请求的状态,如该故障请求是否已经在处理当中,或者已经转为变更流程,需要继续通过变更管理才能解决故障等。
知识库与 FAQ 的紧密结合,IT运维管理经验的积累,IT运维管理经验的积累转入到知识库中
符合ITIL框架,规范IT部门管理
用户实施ITIL的一个重要目的就是要规范IT 部门的管理,让日常运维更加规范化、流程化、自动化,在产品中是通过自动化和流程化来体现管理的规范化的。
客户化的IT运维管理流程,满足不同业务需求
流程必须客户化,产品如何做到呢?两个层面,第一个层面就是可以方便的在用户所需要的范围内进行不同版本流程的切换,第二个层面就是用户可以方便的通过可视化工具对流程进行定制,不需要二次开发的代码,只需要简单的鼠标拖动即可完成流程自定义。
可定制的KPI报表,度量流程执行绩效
系统中提供了很多和报表,来度量各个流程执行的绩效,报表是用来做统计用的,一般用来做各类别数量的统计或者是变化趋势的统计,KPI 是经过计算的,衡量各个模块执行绩效的,在首页上点击后下面列出的黄色边框的是报表,而绿色边框的是KPI。
基于ITIL的IT运维管理系统的相关描述就为大家介绍完了,希望为欲了解此方面信息的读者提供了参考信息。
第四篇:基于ITIL的医院IT运维管理实践
基于ITIL的医院IT运维管理实践
标签: itil 运维 it服务管理 信息系统 流程
摘要:
医院信息系统的规模日益庞大,复杂程度也越来越高,传统的、作坊式的医院IT运维模式已不适应时代的发展。改变原有被动处理问题的工作方式,建立主动服务的管理体系是IT服务组织发展的必然趋势。本文结合作者的实际工作经历,围绕着ITIL实施的核心要素:人员、流程和工具,对传统医院IT运维模式的弊端进行了分析,记述了基于ITIL理念对医院IT部门进行改造、建立全新IT服务体系的方法和步骤,最后对实施效果进行了总结。关键词: ITIL、IT运维 正文:
一、前言
随着医院信息化建设逐年深入,医院信息系统的规模日益庞大,复杂程度也越来越高。医疗业务在享受信息系统提供便利的同时,对信息系统的依赖度也越来越高。信息系统故障不但可能导致医疗业务的中断,甚至有造成医疗事故的可能。IT部门在日常运维工作中遇到的问题也越来越多样化,涵盖了从软件到硬件、从服务器到桌面PC机、从网络管理到机房管理、以及信息系统安全等方方面面。因为故障原因复杂,又缺乏有效地IT运维管理方法,不能及时解决问题,常会引起用户的不满。所以如何有效的管理IT资源,保障信息系统的可靠运行,提高用户的满意度,是医院IT部门必须面对的问题。
二、传统的医院IT运维模式的弊端
传统的医院IT运维模式是在信息系统功能单
一、规模较小的环境下形成的,IT部门的员工就像“救火队员”一样被动的处理故障,常常存在如下弊端:
1、分工不清
“信息中心的电话没人愿意接,谁接电话谁倒霉。”这是一个医院IT圈里流传很广的段子,也是许多医院IT部门的真实写照。因为电话里多半是这里或那里又有故障报修,无论是硬件故障、网络不通、还是软件宕机,对于用户来说都是“电脑坏了”,故障描述不清,而解决起来也是千头万绪,搞不好就要花上半天的时间。大家都忙着做项目,运维工作貌似都要管,其实就是都不管,多一事不如少一事,接电话就成了烫手的山芋。
2、人员短缺
信息中心的工作繁杂且琐碎,大家除了有新项目要推进,每天处理日常故障还要花上很多时间。IT部门是医院的辅助部门,又是成本中心,既非主营业务,又不直接产生效益,琐碎的工作无法量化,就很难在人员录用上得到上级领导的支持。随着信息系统一个接一个的上线,IT设备也越来越多,但人员还是那几个。不但工作压力越来越大,工作价值还得不到认可,人员短缺问题严重制约了信息化的持续发展。
3、重建设轻运维 由于医院信息化建设逐年深入,业务部门对信息化建设的需求十分迫切,支持新的信息系统上线投用通常是医院IT部门工作的重点。而上线后的系统运维工作通常仍由原项目实施人员兼顾。在这种运维模式下,一是解决问题完全依赖工程师个人经验,对问题发生的原因、处理过程,排查分析都没有记录,不但没有避免同类事件再次发生的机制,甚至在同类事件再次发生时,也无法为其他工程师提供解决问题的参照依据;二是没有监督和跟踪机制,在繁杂的日常工作中,比较困难的问题常常经过几次转手之后就被束之高阁、不了了之了。
4、系统变更风险大
信息系统运行过程中仍需随着业务的变化做出调整与修改,既包括软件功能的完善,服务器数据库的调优,也包括新增网点、添置新的IT设备。在缺少配置信息和文档管理的情况下,规模较小的系统,问题还容易控制和解决。随着系统越来越复杂,集成度越来越高,任何一点小的调整都可能牵一发而动全身,造成整个信息系统体系的不稳定。工程师们常说“本来改了个小问题,没想到改出个大毛病”“需求不改是等死,改了就是找死”
5、IT部门没有IT系统
医院的财务部门有收费管理系统、临床部门有医护工作站,检查检验科室有LIS、PACS,然而在IT部门不遗余力的推动医院信息化建设的同时,自身却还停留在“口耳相传”的作坊时代:IT设备报警靠人工巡检、运维工作量无法统计、人员能力没有考核依据、纸质配置文档常与实际不符、无法形成有效的知识传承等,常被医院IT部门员工们戏称为“灯下黑”。
由上可见,传统的医院IT运维模式已无法支持日益庞大的医院信息系统。结果就是上线的信息系统越多,出现的问题就越多,解决问题越来越困难,用户满意度越来越差。
三、建立基于ITIL理念的IT服务管理体系
ITIL(Information Technology Infrastructure Library,信息技术基础架构库)是英国中央计算机和电信局CCTA于80年代中期开发的一套针对IT行业的服务管理标准库[1],其核心是通过服务台和10大管理流程,支持IT基础架构和组织业务的持续运作,通过主动的IT服务管理,保证IT资源的有效利用和业务运作的高可用性、高持续性和高安全性。ITIL是公认的IT服务管理的最佳实践,在世界范围内被广泛应用。
ITIL实施的三要素是人员、流程和工具。10大管理流程包括:事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、持续性管理、可用性管理、能力管理、财务管理,涵盖了IT服务中的各种场景。人员不仅仅指IT运维人员,还包括管理层和最终用户,强调人的能力、意识和执行力是决定项目成败的关键。工具是指将ITIL流程落地的软件系统,通过IT服务管理软件可以使流程的处理步骤更清晰、提高人员的执行力;除此之外,该软件还应包括IT运行监控系统,将IT设备的运行状况纳入IT服务管理。
围绕这三个核心要素,根据院区实际情况,我们按照以下思路进行了ITIL实施:
1、以甲方为主的IT运维人员外包
由于医院是事业单位,人员录用受编制限制,人员短缺的问题就只能借助外部力量解决了。人员外包虽然有机制灵活、人员技术能力强的好处,但外包人员只是按甲方要求提供被动的服务,缺少对组织的了解和认同感,还需要甲方进行主动管理。因此,我们确立了以甲方为主的外包策略,制定了“与业务关系紧密的岗位不外包”、“只外包工作,不外包责任”的方针,要求外包厂商与原有IT部门工程师按AB角配置,即在各个专业上都有甲乙双方工程师共同工作:甲方工程师以管理为主,侧重方案审核和沟通协调;乙方以解决具体技术问题为主,若现场工程师不能解决,协调二线专家解决。按此原则,经过公开招标,最终与某知名IT服务厂商签订了合同,在网络、主机和桌面运维方面进行了人员外包。
2、从服务台开始的ITIL流程实施策略
服务台是整个IT运维体系的核心节点,是用户与IT部门联系的统一门户,所以我们首先设立了统一的IT技术支持电话,在全院范围内进行了“IT报障打XXXX电话,由服务台统一跟踪解决”的宣教,还将IT技术支持电话制作成标签,贴到每一台客户端计算机上,以便用户拨打。
在工作职责上,要求服务台人员按照《IT技术支持电话接听规范》进行电话应答,首先做“过滤器”,对问题进行初步判断,并尝试自己解决问题;再做“路由器”,不能解决的再转到二线;最后做“司令部”,全体人员均须听从服务台指令,服务台当值人员具有绝对权威,可根据自己的判断要求二线工程师优先处理运维事件。桌面运维岗位由初级工程师担任,负责处理现场问题。服务台岗位与桌面运维岗位不定期轮岗,以保证服务台人员了解现场情况,并具有解决具体问题的能力。二线岗位由资深工程师担任,分为应用系统、网络、主机等不同专业方向。对于服务台和桌面工程师不能解决的问题,由二线工程师跟进研究,并给出解决方案。
3、以事件管理和问题管理为流程驱动
在ITIL的10个管理流程中,事件管理和问题管理是与服务台关系最密切的,所有的用户故障报修都通过这两个流程进行处理的。事件管理的目标是帮助用户快速恢复业务,为此我们设定了24小时的默认处理时限,若事件不能在规定的时间内处理完成,就需要升级为问题,重点关注解决。事件处理实行首问负责制,第一个接到用户报修的人,即使将事件派转出去了,也必须一直跟进该事件单,直至关闭。
问题管理的目标是找到事件发生的潜在原因,我们通过每周工作例会的方式,对尚未解决的问题进行多专业会诊,明确责任人和预计解决时间,每周跟进,直到问题处理完毕。对于重点问题,我们还会通过OA系统向相关用户通报进展,以获得用户的理解和支持。
4、以流程的建立和制度的落实来降低风险。
既然信息系统变更是信息系统生命周期中不可避免的环节,那么通过规范化IT管理可以将IT运维过程中系统变更的风险降到最低。配置管理是IT运维管理的数据基础。其核心是建立CMDB(Configuration Management Database,配置管理数据库),我们将原来分散在各个项目手中、手工管理的资源,统一录入了数据库,既方便运维人员查阅,又能保证信息及时更新。
在此基础上,我们制定了一系列的制度和流程,保证所有的变更操作都在可控范围内进行。如:所有服务器操作要求“方案先订、试验回退、通知用户、双人执行、操作记录、检查应用”,所有软件升级要求事先提出申请,按照《软件发布及变更操作指导书》进行,保证每次软件升级都经过了充分的测试,并当发生问题时可以回退。
5、通过工具软件落地流程的执行
ITIL的实施不但需要流程的设计,还需要工具软件来落地,为此我们采购了一套ITSM(IT Services Management,IT服务管理)管理软件,IT部门也借助信息系统提高了工作效率。
首先实施了IT运行监控系统,将机房环境、网络、服务器、数据库、客户端都纳入了IT运行监控体系,既减轻了信息中心运维人员的巡检压力,又可实时及时全面的掌握信息系统各个环节的运行状况。然后开始逐步上线IT服务管理系统,针对运维团队规模较小,紧急事件多的现状,进行了如下调整:一是在工单填写项目上进行了精简,只要描述清楚“什么人、在什么地方、报修什么问题、如何解决”即可,多设置选择项,少做填空,既提高填写速度,又便于后期统计分析。二是简化工单流转流程,事件执行不做事前审批,而在完成后由事件经理进行审核;紧急事件可不填写工单立即处理,但应在24小时内补填工单,记录事件处理过程。
四、效果与思考
通过以上的工作,我院的IT运维工作正逐步走上正轨。通过统一的技术支持电话,大家从繁杂的日常事务中解放了出来;通过明确的分工,使每个人的专长得到了发挥;通过有效的工作组织,IT部门不再单兵作战,更多的依靠团队合作解决问题;更重要的是,通过流程的落实,实现了闭环管理,从而在制度上保障了信息系统可靠性。然而我们也意识到,ITIL的落实不是一蹴而就的,特别是对于中小规模的IT组织而言,更不能教条的照搬ITIL的全部流程,而应根据自己工作中遇到的问题,有选择的实施某些流程或者流程中的某些部分。比如我们在事件处理流程中就减少了大量的审批环节,而进行事后审查。这样既保证了闭环管理,又提高了工作效率。
在ITIL实施的过程中,改变了大家原有的工作习惯,总会让人有些不适应,这不但需要实施的技巧,更需要逐步磨合完善;通过一段时间的积累,在ITSM系统中已经积累了大量的事件和问题的处理记录,通过对这些数据进行分析,不但可以考核每个运维人员工作量,还可以将个体的经验汇总为知识库,建立学习型组织,从而实现知识的有效传承。
通过ITIL的实施,提高了IT部门自身的管理能力,保障了信息系统运行的可靠运行,并提高了用户的满意度。但如何量化的评价这些的收益,是深化IT管理的基础,也是需要进一步思考的问题。
第五篇:基于ITIL的运维管理创新实践案例
基于ITIL的运维管理创新实践浅析
——云南电网有限责任公司瑞丽供电局-岳赵君
本期博文主题是关于IT运维管理的实践应用,博主今天要和大家分享的是云南电网瑞丽供电局的岳赵君发表在2016年第8期《现代工业和信息化》杂志的文章《基于ITIL的运维管理创新实践浅析》(下文为主要文章内容节选)。
保障系统安全、稳定、高效的运行是信息部门的首要责任。随着电力企业信息化的发展和完善,应用系统涵盖了电力企业正常运转的各个方面。业务系统软硬件平台复杂性高、建设及维护周期长、数据备份需求日益增长、IT系统信息安全不容忽视,这些问题都成为了电力信息化发展面前必须解决的问题。因此,创新电力信息化运维管理显得尤为重要。
一、运维管理现状
IT系统运维工作一般由技术、人员、流程三个基本元素组成。三个要素之问相互影响、相互制约,共同作用于运维管理工作。目前云南电网有限公司采用集中式的IT运营支撑模式,即:
1)系统集中:随着CSGII系统已在全省范围内广泛使用,实施绝大部分核心IT系统都由省公司CSGII系统来进行建设维护。
2)人员集中:信息部、信息中心负责运维支撑的部门也是公司信息化建设和支撑的核心部门,对全省地市供电局信息化建设提供支撑。
3)流程集中:通过ITSM,IT呼叫中心等系统的实施,建立了全省统一的故障保修、工单审批流程等。
随着IT集中化运营的发展,以及企业运营对IT系统广泛应用,运维管理的问题也逐步显露。如:集中技术维护工作量大、技术难度大、响应时问拖长等,从而造成服务质量下降、用户满意度下滑,服务人员往往疲于应付各种问题。显而易见,在IT集中化运营模式中,服务管理流程的变更已成为目前最需要关注和解决的问题。
二、ITIL的创新实践
ITIL(IT Infrastructure Library, IT基础架构库)是以流程作为导向,服务客户为中心内容,整合IT服务与企业的业务为手段,提高企业的IT服务能力和水平的一种运维管理方法论。
ITIL的服务管理主要分为两大部分:一是IT服务支持管理。是基础性的管理流程,涵盖了日常运营层面的内容,目的是让用户可以顺利得到相关的IT服务。同时地是本次实践创新重要研究的部分,主要有:服务台、突发实践管理、问题管理、配置管理、变更与发布管理。二是IT服务提供管理。主要围绕IT策略过程,更多体现在ITIL在企业运营决策层面的 IT部署,是提高性的管理流程。
ITIL管理理论的创建,有效帮助整合了IT运维管理流程和体系,为IT服务管理建立运营框架。根据ITIL理论,IT服务系统是技术设施、流程和人员等诸多参与因素相互作用的结果。目前我们需要落地理论的关键所在是结合企业运维管理的实际状况,找出IT集中运维模式所面临的各类问题,进而改进IT服务的输出质量和流程绩效。
结合公司实际情况,建设了一、二、三线技术支撑维护体系。2.1一线运维工程师职责 结合IT呼叫中心建设,组建一线运维工程师团队,负责ITIL的帮助台和突发事件管理。提供7*24小时服务热线电话,全年不间断接收供电局的需求信息。碰到任何问题和疑问时,立即通知专门服务小组项目经理,由责任人立即启动一系列预警反应机制,指导和协调下一步的处理工作。
2.2二线工程师职责
组建技术能力强、工作经验丰富的二线技术支持工程师团队,负责ITIL的问题管理、配置管理,由于系统的应用复杂性、设备维护的专业性,二线支撑团队按系统组建,负责分析系统参数、数据、信息,必要时现场收集并处理信息,进行优化的实质性工作。
2.3二线工程师职责
三线工程师主要负责ITIL的变更/发布管理,由于技术专业性要求高,三线的支撑体系主要协调省公司及系统建设集成商、第三方厂商资源进行支持。在结合ITIL和公司自身情况建立起来的三线服务支持体系,需要在合理的需求分析前提下,响应的问题及时的流转到响应的工程师,这样问题的响应时时间大幅减少,同时又能做到专业对口、能力匹配,事件处理的效率自然就能大幅度提升。
三、基于ITIL组织框架的运维管理实践 结合公司信息化建设集中化的建设原则,在供电局成立之日起各种专业的集中式信息系统逐步实施,供电局面临人员短缺,技术能力跟不上,处理系统事件不及时等问题。
为了解决运维管理中的问题,2013年起供电局在省公司的帮助下开始结合ITIL开始进行运维管理实践探索,从运维团队ITIL培训,三线运维体系建设,ITIL工单化流程梳理等方面进行了深入的探讨和全面实施。
2013年初,为了解决事件反映不及时的问题,公司建立了一站式的IT呼叫中心和事件管理流程,安排一线运维工程师7*24小时在线接受问题,并持续培训用户,养成用户有事件拨打IT呼叫中心帮忙电话,通过这一支撑服务前移的项目,取得了明显效果: 1)接受流程::建立基于ITIL的一线服务平台、事件管理流程的IT呼叫中心,确定一站式统一事件管理的目标;
2)梳理流程:对维护资源进行了整合调整,创建基于ITIL的一、二、三线的支撑体系; 3)总结流程:对流程关键点进行量化,建立了统一的对外服务标准,以及一、二、三线的内部考核指标;
4)从2013年起,经过近2年的实施,已经取得明显的成效,目前供电局系统可用率、客户满意率一直保持在99%以上,显著提升了供电局的运维管理能力。
四、结语
IT集中化运营模式,是未来信息化发展的趋势,结合ITIL打造的快速、高效的一、二、三线运维支撑体系是我们为追求高效卓越的运维管理的初次探索,我们也将不断探索、不断实践,全面提升公司的信息化运维管理能力。
如果您在阅读这篇博文之前,还未认识过ITIL,请来电咨询上海信息化培训中心,我们有专门的老师详细为您答疑解惑;
如果您在阅读这篇博文时候,已经了解过ITIL,如果想深入实践,请来电咨询上海信息化培训中心,这里不仅有一系列的ITIL课程,而且可以为公司专门定制个性化课程和团训;
如果您在阅读这篇博文的时候,已经学习过部分ITIL课程,请来电咨询上海信息化培训中心,这里有专门的老师为您解答ITIL高阶课程信息!
上海信息化培训中心(www.xiexiebang.com)好课ITIL每月定期开班,咨询021-62126633-6021.还可以关注微信微博了解最新ITIL发展前沿。
上海信息化培训中心SITC是中国领先的信息化促进机构,是ITIL的最好殿堂。