第一篇:ITIL能够形象地描述IT运维的工作内容
引言
目前,我国电力企业IT运维管理还处在应用尝试的阶段,主要停留在IT管理软件的深化应用、管理流程的梳理和优化、管理制度的制定和完善的阶段。企业日益增长的个性化服务需求,要求IT运维服务部门提供日趋专业化的服务战略和精细化的解决方案。运维模式正在逐步从“以应用为中心”向“以服务为中心”转变,从“被动运维”向“主动服务”转变,要求服务创新与技术创新并重。公司IT运维服务管理概念与内容
所谓1T运维管理,是指单位1T部门采用相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(如软硬件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。IT运维管理主要包括以下几个方面的内容:
(1)设备管理:对网络设备、服务器设备、PC电脑、计算机外设的运行状况进行监控和管理;
(2)应用管理:对各种应用软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统,DNS,DHCP,Web等的监控与管理;
(3)数据管理:对系统和业务数据进行统一存储、备份和恢复;
(4)业务管理:对单位各类业务系统运行状况的监控与管理,包括业务流程的有效性,业务功能的完整性和业务实施的可控性等;
(5)资源管理:单位各类1T资产资源的管理,如:IT物资采购、装配运行方式、时间、编号、折旧和报废等,这些资源均能够与单位的财务部门进行数据交互和统一;
(6)安全管理:安全管理主要是针对单位的安全组织方式、行业特点、人员安全、环境安全、信息安全、保密控制管理等;
(7)事务管理:规范和明确IT运维人员的岗位职责和工作安排、提供绩效考核量化依据。IT运维管理系统(ITSM)是指针对IT运行维护的技术服务支持和为满足领导IT决策支持管理的软件系统。主要实现“以客户为中心,服务可量化,高质量、低成本服务”三大IT运维管理目标。运维过程中产生的问题与状况
(1)人员问题。运维部门在日常运维中经常会碰到一些现象,如用户没有故障申报意识,常常直接打电话找相应的工程师或管理人员甚至领导解决有关问题;工作分配不合理,没有准确的量化数据来进行绩效考核,导致技术人员忙、闲不均,人员无法动态流动,有的系统人手不够有的系统人力资源又没有得到充分利用;部门内部缺乏梯队建设机制,技术储备欠缺,新员工成长周期长,导致系统对人员有很强的依赖性;缺乏对第三方服务的质量控制,长期对第三方服务的依赖影响了自身团队的提高,增加了运维成本的投入等。如果负责研发的技术人员同时还要负责日常运维支持,技术人员就不能投入更多的时间和精力去进行更深层次的工作。如,改进、完善系统自身的某些缺陷;构建支持新业务流程的IT系统的需求分析,解决方案设计,新系统的测试及相关培训等。这就会直接导致技术人员缺乏对故障发生的预知能力,IT运维部门缺乏可操作的应急预案,IT系统缺乏有效的灾难恢复工具。
(2)流程问题。以前的运维工作模式中,在对事件的处理上没有规范的流程,导致很多弊端发生。部门接到故障申告后,对突发事件只有简单的归类,没有确切的事件升级标准,没有事件的优先级定义标准,通常是哪个用户叫得紧、喊得急就先处理哪个用户的申告,在突发事件数量激增的情况下不能保证事件解决的时效性和IT资源的有效利用;突发事件产生后,在处理事件时,没有统一的事件受理平台,许多时候用户的故障和需求都不知道向谁提出,也不知道向谁询问故障处理的进度及结果,极大影响了用户对IT服务的满意度;当重大事件发生时,没有针对重大或紧急事件的处理流程,不能对事件进行及时、有效的处理,不能对事件处理的进度进行监控和跟踪,对事件的处理过程也没有完整的记录,事件的处理质量得不到有效控制,经常是各个环节的技术人员一齐上阵,最后也不知道是那个环节起的作用,也不知道什么时候类似事件又会再次发生。此外,传统的运维工作模式对配置管理的认识也十分欠缺,没有统一完整的配置管理流程及管理范围,也没有规范的配置管理数据库,因此也就没有相应的信息提供给其他流程进行故障分析、风险评估等工作,往往是相类似的问题再次发生在相类似的事件中。
(3)技术问题。理流程没有一个强大的技术平台做支撑,ITIL的实施也就无从谈起。这里所说的技术平台指的就是一套基于ITIL的网管系统解决方案(即网管工具)。没有一套功能强大的网管工具,就不能对突发事件进行及时的监控和正确的诊断,事件就不能在工具的支持下得到主动而快速的处理;技术人员不能借助有效工具对事件处理情况进行完整的记录,这不利于知识的积累和知识库的完善,也不利于处理过程的跟踪;没有工具进行精确的数据分析,就没有系统可用率/故障及时解决率/故障发生率等系统性能指标的产生,也就不能科学分析运维事件的趋势和规律,不能有效预防相同事件的再次发生。改进的措施及方法
(1)搭建层级化的人员组织架构,对服务支持人员和系统管理人员间的角色和职责进行清晰的定义和划分。在人员组织架构设计上,IT运维中心可采用ITIL提供的层级化组织架构,把所有人员划分为一线、二线、三线:一线指服务台的服务支持人员,其职责是接收问题、跟踪问题,处理大量简单、重复并已经记录在配置管理数据库中的各类问题;
二、三线人员负责研究解决技术难度相对较大,对业务影响较严重的问题,并将这些问题的处理方法和解决方案记录到配置管理数据库中,使问题再次出现时,一线人员能够根据配置管理数据库中的内容向用户提供解决方案。
通过搭建层级化的人员组织结构,用户的请求可以在第一时间找到合适的人,并可及时获知事件的处理进度;用户可以得到统一标准的、规范化的服务;IT部门内部也能够更合理地配置服务组织的人员结构,提高效率,降低成本。ITIL的核心理念是降低系统对特定人员的依赖。通过对配置管理数据库的严格管理,系统中任何一点微小的变更都会记录在配置管理数据库中。其确保对一切技术人员的思维创新及行为进行准确的跟踪、控制和记录。配置管理数据库的应用改变了传统服务体系中“谁看到,谁知道。”的知识分裂体系模式,构建了一个“一人拥有,全员皆知”的高性能体系模式,极大提升了一线人员解决用户问题的能力,提高了问题的首次解决率,降低了比一线支持成本高4~6倍的二、三线支持的工作量,保证80%的问题在一线得以解决,消除了过程对个人的依赖,实现IT服务的“工程化”。
(2)流程管理是ITIL的核心内容。在基于ITIL的IT运维中心工作模式中,IT运维中心可将所有IT系统的日常运维操作全部流程化,并通过自动化工具对流程执行情况进行监控与跟踪。同时,基于ITIL的IT运维中心还可针对不同的流程设置相应的流程管理员,以此来推动和优化每个业务流程的实现。笔者所在的单位还不是一个以赢得市场的竞争为主要目标的机构,所以在建立基于ITIL的IT运维中心模式时,我们可以先考虑服务台、事件管理流程、问题管理流程、配置管理流程、变更管理流程、可用性管理流程的建立。根据业务发展情况,再随时增加新的流程。
服务台:服务台作为IT运维中心和用户的单一接口,所有需要解决的事件都通过服务台向IT运维中心提交。所有用户的服务请求统一由服务台记录在案,并依据各个岗位的职责进行工作分派。利用服务台这个唯一的接入点充当过滤器,并协调后续的所有流程。
事件管理:记录所有IT系统软、硬件的日常故障处理情况,所有软、硬件的备件库存情况及使用情况。记录各类突发事件的处理过程,以便能够权衡并改进处理流程,给其他的服务管理流程提供合适的信息,以及正确事件处理进展情况报告。
问题管理:对所有IT系统软、硬件发生的故障进行归类,对归类后的问题进行研究、诊断,找出引起问题的潜在原因,制定解决方案,并将解决方案记入问题数据库,当有类似问题再次发生时可极大提升服务台人员的事件解决率。
配置管理:建立配置管理数据库,完整记录本部门所有IT资产的基本情况和所属情况,记录所有在运行IT系统的基本情况(包括软件的定期更新版本,系统的维护经验和实施技巧,各类文档资料),记录一段时期内各类技术变更情况,记录所有IT运维人员的基本资料(包括职责范围、联系方式等),记录各类与本部门IT系统相关的规定、制度。对配置数据库中各类配置项的正确性和完整性进行校验。
变更管理:完整记录所有的变更资源,对变更请求进行审查、归类、批准并提交;安排变更进度并进行测试,对实施后的变更进行评审。记录因故障处理引起的备件变更情况及对IT系统定期巡检的所有情况。
可用性管理:记录硬件及IT系统保修期限及生命周期,定期对设备的运行及使用情况进行可用性分析,优化IT基础设施,确保IT基础架构实施能够得到最佳利用。
(3)
如何选择一套合适的网管工具将复杂的IT服务管理流程固化下来是ITIL实施中一个重要的环节。好的网络管理工具首先应能提供丰富的图形操作界面,能动态反映网络的拓扑结构,包括网络各种资源变化的自动监测,方便操作人员的网络运行状况监控。能提供用户灵活的设置功能,如阀值设定,以监测网络故障的发生。能提供丰富的用户程序接口,方便用户二次开发自己的网络管理软件。能提供灵活的配置管理可对配置数据库的各类数据进行快速而准确的导入、导出,并确保同步其他管理流程对配置数据库的改动,发现和防止各类配置数据的随意修改。采用开放的、模块化的体系结构,方便用户根据实际需要选择自己的管理流程模块。此外,好的网络管理工具支持领域广泛,可涉及到系统资源和资产管理,数据库管理,存储管理,用户帐号管理,安全管理,软件分发管理等IT运维的方方面面。
目前,比较成熟的基于ITIL的网络管理工具主要有HP公司的Openview系列,IBM公司的Tivoli系列,CA公司的Unicenter系列以及BMC公司的Remedy系列等。我们在选择管理工具时,一定要从实际情况和实际需要出发,先对IT运维工作规划出一定阶段内的目标,并在一定程度上做好流程设计,再结合现有的管理水平和成本投入能力选择合适的工具,确保所建立的IT运维管理系统能够根据IT服务管理水平的不断提高而持续改进与优化。
随着企业对于IT管理和运营的要求越来越高,ITIL作为IT服务管理的国际标准已经被广泛的接受和应用。通过建立基于ITIL的IT运维中心工作模式,企业建立了服务提供和服务支持的流程管理体系,将人员、流程、技术有机的结合起来,并通过操作规范和制度体系的保障,IT服务得以有效提供,企业管理水平得以明显提高。结束语
ITIL能够形象地描述IT运维的工作内容。在ITIL框架下,一项IT服务已经像工业化流水线上的商品一样,体验着IT运维流程化带来的高效率和高质量。对于IT部门,实施ITIL可以清晰梳理日常IT运维管理过程中遇到的各类事件,对IT组织中的各个角色的职责进行明确定义,避免了很多重复劳动,IT管理环境越来越透明,使IT运维过程变得有序而连贯,对于IT设备的生命周期和第三方服务提供商的费用支出也更加可控。在提高效率、降低运维成本的同时,更关键的是流程化的工作方式在慢慢改变着员工的工作思路。技术服务人员逐渐从 “消防员”的角色向“保健医生”的角色转变。IT运维体系逐渐从被动、低效的管理向主动、高效的服务转变。基于ITIL的IT运维中心工作模式实现了IT服务支持的标准化、规范化、自动化,提升了IT系统的运维管理水平,实现了知识经验的积累和共享。同时,还实现了计算机运行维护工作量化,为IT部门对技术人员的绩效考核提供了依据
第二篇:IT运维管理与ITIL
IT运维管理与ITIL
IT运维管理的由来
在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。NSM系统是对网络中的底层设备进行实时的,统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理,这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。
随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理,降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。同时,在国内IT管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。
因此,当前国内用户迫切需要一款能够对整个IT资源进行统一管理,解决IT资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。ITIL与IT运维管理的关系 ITIL诞生于国外,当时是需要针对部门人数众多,对业务保障要求高的电信、金融等行业的IT和业务进行有序化,透明化的管理,所以诞生了ITIL标准。ITIL标准的核心思想是通过将IT管理流程化,提高工作人员的工作效率,提高IT服务质量,更好的让IT系统为业务提供服务,从而为业务系统的稳定运行保驾护航。ITIL标准的底层是对IT基础设施的管理,最上层是对业务系统的流程化管理。
那么,ITIL和IT运维管理到底有什么关系?
就像文章开始说到的一样,企业最初设定IT部门进行IT管理的目的,就是希望通过IT部门能够发现和解决各种来自底层基础设施的问题,从而为保障网络的正常运转,为企业提供优质的IT服务。但随着企业IT系统和业务的不断发展,企业用户发现,单纯的通过对底层IT基础设施管理无法解决底层网络与上层业务系统之间的脱节问题。这也就是ITIL标准当初遇到的问题,最初主要是用来对IT部门的人员进行流程化和规范化的管理的,但它忽视了对底层平台的管理及对业务系统的保障,脱离了用户实际需要的ITIL,就像是空中楼阁,高不可及。近年来,为了更加贴近IT运维管理部门的工作需要,ITIL开始与企业的业务系统保障结合起来,形成了所谓BSM的管理模式,目的是使得ITIL能够更好的为企业的IT运维管理提供服务。
但问题在于,无论从哪个角度来讲,ITIL标准仅仅是一套方法论,没有告诉我们具体的流程该怎么做。而实际上这个流程是建立在对日常IT管理过程中,如何发现问题,如何解决问题的经验积累的基础上。但企业要实现ITIL需要的是结果,不会过多的关注这个过程怎么样。因此,这就需要IT管理的供应商来解决这个问题。那么,怎么发现问题,又怎么解决问题,这就需要通过IT管理供应商提供的IT运维管理系统来解决。通过IT运维管理系统来发现和解决各种来自IT系统的问题,保证企业的网络和运行在网络上的业务系统正常运转。在这个过程中,进行不断的经验积累,然后才能在此基础上实现ITIL的流程化管理。IT运维管理是ITIL标准体系的底层基础。只有将这个底层基础搭建完善,才能真正实现在此基础上流程化管理。当前国内IT运维管理现状
从IT运维管理的由来和两者的关系不难看出,当前国内大多数IT服务厂商强调的IT运维管理概念,其实就是在网络管理基础之上的拓展,包涵的范围不仅限于网络管理,是对整个IT系统和业务所涉及到的范围进行运维管理。但各IT服务供应商的产品对这个概念的体现不尽相同。至少在目前,实际上它还是网络管理(或者称之为IT基础架构管理)外加部分应用服务管理和业务管理的含义,只是说法不同而已。
国内企业经过多年的基础设施平台的搭建和完善,目前对于国内各行业的用户来说,首要保证的是业务系统的稳定运行,由业务的发展进而推进用户去进行全面的基于ITIL标准的流程化管理,这是一个循序渐进的过程,是需要分阶段分步骤来进行的。
第三篇:基于ITIL的IT运维管理系统概述
基于ITIL的IT运维管理系统概述
基于ITIL的流程框架的IT运维管理系统,能够快速适应企业业务流程及业务发展变化需求的IT运维管理最佳实践,能够帮助企业从人员、技术和流程三个方面提高IT运维管理能力,本文就来为大家介绍基于ITIL的IT运维管理系统。
基于ITIL的IT运维管理系统可以逐步建立并完善、达到以下目标:
标准化——通过ITIL的流程框架,构建最佳实践经验的IT运维管理流程。
流程化——把大部分的IT运维管理工作流程化,确保这些工作都可重复,确保这些工作都能有质量完成。
自动化——替企业有效无误地完成一些日常工作,比如备份,杀毒等。
基于ITIL的IT运维管理系统为用户解决了哪些问题:
运行维护管理—重要性
事前管理——通过监控系统,及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然,事前管理的目的。
迅即的故障报警—全天候自动检测与及时报警,通过多种告警方式实现网络的“全天候无人值守”,大大降低管理人员的工作负担。例:通过短消息告警和远程客户端管理的结合,用户可以在任何地方轻松的管理自己的网络,解决问题。
ITIL的标榜—IT服务最佳实践
提供灵活的、流程化的IT服务管理,帮助企业完成流程定义、流程执行、流程监控以及流程的优化。将日常操作全部流程化,并通过自动化工具对流程执行情况进行及时追踪。
业务流程化、流程自动化、服务规范化
通过流程管理来简化IT部门繁琐的业务,把维护人员从救火队员中解救出来,规范运营管理。本文叙述的IT运维管理系统以ITIL的流程框架,缔造一个流程化,自动化和规范化的IT运维管理系统。
以CMDB为运维核心,自动发现资源配置项
CMDB有两部分重要内容,一是CI,二是CI之间的关系,这两部分构成了CMDB比较核心的内容,在CMDB初始化方面,很多产品只是提供了手工输入的方式对CI 的初始化,用户需要面对大量的需要手工输入的信息,造成系统使用前的高门槛,而摩卡软件在这里提供了两种方式快速进行CMDB的初始化,第一种是自动发现CI,第二种是从Mocha BSM系统中导入,大大简化了用户管理员的工作,快速搭建ITIL最佳实践平台。
多种渠道新建故障处理请求 为了提交企业各部门所遇到的IT故障处理请求,用户可以通过自助服务台、电话通知服务台、监控系统自动触发等方式发起故障处理请求。通过自助服务台用户可快速新建故障处理请求,并随时追踪该故障请求的状态,如该故障请求是否已经在处理当中,或者已经转为变更流程,需要继续通过变更管理才能解决故障等。
知识库与 FAQ 的紧密结合,IT运维管理经验的积累,IT运维管理经验的积累转入到知识库中
符合ITIL框架,规范IT部门管理
用户实施ITIL的一个重要目的就是要规范IT 部门的管理,让日常运维更加规范化、流程化、自动化,在产品中是通过自动化和流程化来体现管理的规范化的。
客户化的IT运维管理流程,满足不同业务需求
流程必须客户化,产品如何做到呢?两个层面,第一个层面就是可以方便的在用户所需要的范围内进行不同版本流程的切换,第二个层面就是用户可以方便的通过可视化工具对流程进行定制,不需要二次开发的代码,只需要简单的鼠标拖动即可完成流程自定义。
可定制的KPI报表,度量流程执行绩效
系统中提供了很多和报表,来度量各个流程执行的绩效,报表是用来做统计用的,一般用来做各类别数量的统计或者是变化趋势的统计,KPI 是经过计算的,衡量各个模块执行绩效的,在首页上点击后下面列出的黄色边框的是报表,而绿色边框的是KPI。
基于ITIL的IT运维管理系统的相关描述就为大家介绍完了,希望为欲了解此方面信息的读者提供了参考信息。
第四篇:基于ITIL的医院IT运维管理实践
基于ITIL的医院IT运维管理实践
标签: itil 运维 it服务管理 信息系统 流程
摘要:
医院信息系统的规模日益庞大,复杂程度也越来越高,传统的、作坊式的医院IT运维模式已不适应时代的发展。改变原有被动处理问题的工作方式,建立主动服务的管理体系是IT服务组织发展的必然趋势。本文结合作者的实际工作经历,围绕着ITIL实施的核心要素:人员、流程和工具,对传统医院IT运维模式的弊端进行了分析,记述了基于ITIL理念对医院IT部门进行改造、建立全新IT服务体系的方法和步骤,最后对实施效果进行了总结。关键词: ITIL、IT运维 正文:
一、前言
随着医院信息化建设逐年深入,医院信息系统的规模日益庞大,复杂程度也越来越高。医疗业务在享受信息系统提供便利的同时,对信息系统的依赖度也越来越高。信息系统故障不但可能导致医疗业务的中断,甚至有造成医疗事故的可能。IT部门在日常运维工作中遇到的问题也越来越多样化,涵盖了从软件到硬件、从服务器到桌面PC机、从网络管理到机房管理、以及信息系统安全等方方面面。因为故障原因复杂,又缺乏有效地IT运维管理方法,不能及时解决问题,常会引起用户的不满。所以如何有效的管理IT资源,保障信息系统的可靠运行,提高用户的满意度,是医院IT部门必须面对的问题。
二、传统的医院IT运维模式的弊端
传统的医院IT运维模式是在信息系统功能单
一、规模较小的环境下形成的,IT部门的员工就像“救火队员”一样被动的处理故障,常常存在如下弊端:
1、分工不清
“信息中心的电话没人愿意接,谁接电话谁倒霉。”这是一个医院IT圈里流传很广的段子,也是许多医院IT部门的真实写照。因为电话里多半是这里或那里又有故障报修,无论是硬件故障、网络不通、还是软件宕机,对于用户来说都是“电脑坏了”,故障描述不清,而解决起来也是千头万绪,搞不好就要花上半天的时间。大家都忙着做项目,运维工作貌似都要管,其实就是都不管,多一事不如少一事,接电话就成了烫手的山芋。
2、人员短缺
信息中心的工作繁杂且琐碎,大家除了有新项目要推进,每天处理日常故障还要花上很多时间。IT部门是医院的辅助部门,又是成本中心,既非主营业务,又不直接产生效益,琐碎的工作无法量化,就很难在人员录用上得到上级领导的支持。随着信息系统一个接一个的上线,IT设备也越来越多,但人员还是那几个。不但工作压力越来越大,工作价值还得不到认可,人员短缺问题严重制约了信息化的持续发展。
3、重建设轻运维 由于医院信息化建设逐年深入,业务部门对信息化建设的需求十分迫切,支持新的信息系统上线投用通常是医院IT部门工作的重点。而上线后的系统运维工作通常仍由原项目实施人员兼顾。在这种运维模式下,一是解决问题完全依赖工程师个人经验,对问题发生的原因、处理过程,排查分析都没有记录,不但没有避免同类事件再次发生的机制,甚至在同类事件再次发生时,也无法为其他工程师提供解决问题的参照依据;二是没有监督和跟踪机制,在繁杂的日常工作中,比较困难的问题常常经过几次转手之后就被束之高阁、不了了之了。
4、系统变更风险大
信息系统运行过程中仍需随着业务的变化做出调整与修改,既包括软件功能的完善,服务器数据库的调优,也包括新增网点、添置新的IT设备。在缺少配置信息和文档管理的情况下,规模较小的系统,问题还容易控制和解决。随着系统越来越复杂,集成度越来越高,任何一点小的调整都可能牵一发而动全身,造成整个信息系统体系的不稳定。工程师们常说“本来改了个小问题,没想到改出个大毛病”“需求不改是等死,改了就是找死”
5、IT部门没有IT系统
医院的财务部门有收费管理系统、临床部门有医护工作站,检查检验科室有LIS、PACS,然而在IT部门不遗余力的推动医院信息化建设的同时,自身却还停留在“口耳相传”的作坊时代:IT设备报警靠人工巡检、运维工作量无法统计、人员能力没有考核依据、纸质配置文档常与实际不符、无法形成有效的知识传承等,常被医院IT部门员工们戏称为“灯下黑”。
由上可见,传统的医院IT运维模式已无法支持日益庞大的医院信息系统。结果就是上线的信息系统越多,出现的问题就越多,解决问题越来越困难,用户满意度越来越差。
三、建立基于ITIL理念的IT服务管理体系
ITIL(Information Technology Infrastructure Library,信息技术基础架构库)是英国中央计算机和电信局CCTA于80年代中期开发的一套针对IT行业的服务管理标准库[1],其核心是通过服务台和10大管理流程,支持IT基础架构和组织业务的持续运作,通过主动的IT服务管理,保证IT资源的有效利用和业务运作的高可用性、高持续性和高安全性。ITIL是公认的IT服务管理的最佳实践,在世界范围内被广泛应用。
ITIL实施的三要素是人员、流程和工具。10大管理流程包括:事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、持续性管理、可用性管理、能力管理、财务管理,涵盖了IT服务中的各种场景。人员不仅仅指IT运维人员,还包括管理层和最终用户,强调人的能力、意识和执行力是决定项目成败的关键。工具是指将ITIL流程落地的软件系统,通过IT服务管理软件可以使流程的处理步骤更清晰、提高人员的执行力;除此之外,该软件还应包括IT运行监控系统,将IT设备的运行状况纳入IT服务管理。
围绕这三个核心要素,根据院区实际情况,我们按照以下思路进行了ITIL实施:
1、以甲方为主的IT运维人员外包
由于医院是事业单位,人员录用受编制限制,人员短缺的问题就只能借助外部力量解决了。人员外包虽然有机制灵活、人员技术能力强的好处,但外包人员只是按甲方要求提供被动的服务,缺少对组织的了解和认同感,还需要甲方进行主动管理。因此,我们确立了以甲方为主的外包策略,制定了“与业务关系紧密的岗位不外包”、“只外包工作,不外包责任”的方针,要求外包厂商与原有IT部门工程师按AB角配置,即在各个专业上都有甲乙双方工程师共同工作:甲方工程师以管理为主,侧重方案审核和沟通协调;乙方以解决具体技术问题为主,若现场工程师不能解决,协调二线专家解决。按此原则,经过公开招标,最终与某知名IT服务厂商签订了合同,在网络、主机和桌面运维方面进行了人员外包。
2、从服务台开始的ITIL流程实施策略
服务台是整个IT运维体系的核心节点,是用户与IT部门联系的统一门户,所以我们首先设立了统一的IT技术支持电话,在全院范围内进行了“IT报障打XXXX电话,由服务台统一跟踪解决”的宣教,还将IT技术支持电话制作成标签,贴到每一台客户端计算机上,以便用户拨打。
在工作职责上,要求服务台人员按照《IT技术支持电话接听规范》进行电话应答,首先做“过滤器”,对问题进行初步判断,并尝试自己解决问题;再做“路由器”,不能解决的再转到二线;最后做“司令部”,全体人员均须听从服务台指令,服务台当值人员具有绝对权威,可根据自己的判断要求二线工程师优先处理运维事件。桌面运维岗位由初级工程师担任,负责处理现场问题。服务台岗位与桌面运维岗位不定期轮岗,以保证服务台人员了解现场情况,并具有解决具体问题的能力。二线岗位由资深工程师担任,分为应用系统、网络、主机等不同专业方向。对于服务台和桌面工程师不能解决的问题,由二线工程师跟进研究,并给出解决方案。
3、以事件管理和问题管理为流程驱动
在ITIL的10个管理流程中,事件管理和问题管理是与服务台关系最密切的,所有的用户故障报修都通过这两个流程进行处理的。事件管理的目标是帮助用户快速恢复业务,为此我们设定了24小时的默认处理时限,若事件不能在规定的时间内处理完成,就需要升级为问题,重点关注解决。事件处理实行首问负责制,第一个接到用户报修的人,即使将事件派转出去了,也必须一直跟进该事件单,直至关闭。
问题管理的目标是找到事件发生的潜在原因,我们通过每周工作例会的方式,对尚未解决的问题进行多专业会诊,明确责任人和预计解决时间,每周跟进,直到问题处理完毕。对于重点问题,我们还会通过OA系统向相关用户通报进展,以获得用户的理解和支持。
4、以流程的建立和制度的落实来降低风险。
既然信息系统变更是信息系统生命周期中不可避免的环节,那么通过规范化IT管理可以将IT运维过程中系统变更的风险降到最低。配置管理是IT运维管理的数据基础。其核心是建立CMDB(Configuration Management Database,配置管理数据库),我们将原来分散在各个项目手中、手工管理的资源,统一录入了数据库,既方便运维人员查阅,又能保证信息及时更新。
在此基础上,我们制定了一系列的制度和流程,保证所有的变更操作都在可控范围内进行。如:所有服务器操作要求“方案先订、试验回退、通知用户、双人执行、操作记录、检查应用”,所有软件升级要求事先提出申请,按照《软件发布及变更操作指导书》进行,保证每次软件升级都经过了充分的测试,并当发生问题时可以回退。
5、通过工具软件落地流程的执行
ITIL的实施不但需要流程的设计,还需要工具软件来落地,为此我们采购了一套ITSM(IT Services Management,IT服务管理)管理软件,IT部门也借助信息系统提高了工作效率。
首先实施了IT运行监控系统,将机房环境、网络、服务器、数据库、客户端都纳入了IT运行监控体系,既减轻了信息中心运维人员的巡检压力,又可实时及时全面的掌握信息系统各个环节的运行状况。然后开始逐步上线IT服务管理系统,针对运维团队规模较小,紧急事件多的现状,进行了如下调整:一是在工单填写项目上进行了精简,只要描述清楚“什么人、在什么地方、报修什么问题、如何解决”即可,多设置选择项,少做填空,既提高填写速度,又便于后期统计分析。二是简化工单流转流程,事件执行不做事前审批,而在完成后由事件经理进行审核;紧急事件可不填写工单立即处理,但应在24小时内补填工单,记录事件处理过程。
四、效果与思考
通过以上的工作,我院的IT运维工作正逐步走上正轨。通过统一的技术支持电话,大家从繁杂的日常事务中解放了出来;通过明确的分工,使每个人的专长得到了发挥;通过有效的工作组织,IT部门不再单兵作战,更多的依靠团队合作解决问题;更重要的是,通过流程的落实,实现了闭环管理,从而在制度上保障了信息系统可靠性。然而我们也意识到,ITIL的落实不是一蹴而就的,特别是对于中小规模的IT组织而言,更不能教条的照搬ITIL的全部流程,而应根据自己工作中遇到的问题,有选择的实施某些流程或者流程中的某些部分。比如我们在事件处理流程中就减少了大量的审批环节,而进行事后审查。这样既保证了闭环管理,又提高了工作效率。
在ITIL实施的过程中,改变了大家原有的工作习惯,总会让人有些不适应,这不但需要实施的技巧,更需要逐步磨合完善;通过一段时间的积累,在ITSM系统中已经积累了大量的事件和问题的处理记录,通过对这些数据进行分析,不但可以考核每个运维人员工作量,还可以将个体的经验汇总为知识库,建立学习型组织,从而实现知识的有效传承。
通过ITIL的实施,提高了IT部门自身的管理能力,保障了信息系统运行的可靠运行,并提高了用户的满意度。但如何量化的评价这些的收益,是深化IT管理的基础,也是需要进一步思考的问题。
第五篇:基于ITIL的运维管理创新实践案例
基于ITIL的运维管理创新实践浅析
——云南电网有限责任公司瑞丽供电局-岳赵君
本期博文主题是关于IT运维管理的实践应用,博主今天要和大家分享的是云南电网瑞丽供电局的岳赵君发表在2016年第8期《现代工业和信息化》杂志的文章《基于ITIL的运维管理创新实践浅析》(下文为主要文章内容节选)。
保障系统安全、稳定、高效的运行是信息部门的首要责任。随着电力企业信息化的发展和完善,应用系统涵盖了电力企业正常运转的各个方面。业务系统软硬件平台复杂性高、建设及维护周期长、数据备份需求日益增长、IT系统信息安全不容忽视,这些问题都成为了电力信息化发展面前必须解决的问题。因此,创新电力信息化运维管理显得尤为重要。
一、运维管理现状
IT系统运维工作一般由技术、人员、流程三个基本元素组成。三个要素之问相互影响、相互制约,共同作用于运维管理工作。目前云南电网有限公司采用集中式的IT运营支撑模式,即:
1)系统集中:随着CSGII系统已在全省范围内广泛使用,实施绝大部分核心IT系统都由省公司CSGII系统来进行建设维护。
2)人员集中:信息部、信息中心负责运维支撑的部门也是公司信息化建设和支撑的核心部门,对全省地市供电局信息化建设提供支撑。
3)流程集中:通过ITSM,IT呼叫中心等系统的实施,建立了全省统一的故障保修、工单审批流程等。
随着IT集中化运营的发展,以及企业运营对IT系统广泛应用,运维管理的问题也逐步显露。如:集中技术维护工作量大、技术难度大、响应时问拖长等,从而造成服务质量下降、用户满意度下滑,服务人员往往疲于应付各种问题。显而易见,在IT集中化运营模式中,服务管理流程的变更已成为目前最需要关注和解决的问题。
二、ITIL的创新实践
ITIL(IT Infrastructure Library, IT基础架构库)是以流程作为导向,服务客户为中心内容,整合IT服务与企业的业务为手段,提高企业的IT服务能力和水平的一种运维管理方法论。
ITIL的服务管理主要分为两大部分:一是IT服务支持管理。是基础性的管理流程,涵盖了日常运营层面的内容,目的是让用户可以顺利得到相关的IT服务。同时地是本次实践创新重要研究的部分,主要有:服务台、突发实践管理、问题管理、配置管理、变更与发布管理。二是IT服务提供管理。主要围绕IT策略过程,更多体现在ITIL在企业运营决策层面的 IT部署,是提高性的管理流程。
ITIL管理理论的创建,有效帮助整合了IT运维管理流程和体系,为IT服务管理建立运营框架。根据ITIL理论,IT服务系统是技术设施、流程和人员等诸多参与因素相互作用的结果。目前我们需要落地理论的关键所在是结合企业运维管理的实际状况,找出IT集中运维模式所面临的各类问题,进而改进IT服务的输出质量和流程绩效。
结合公司实际情况,建设了一、二、三线技术支撑维护体系。2.1一线运维工程师职责 结合IT呼叫中心建设,组建一线运维工程师团队,负责ITIL的帮助台和突发事件管理。提供7*24小时服务热线电话,全年不间断接收供电局的需求信息。碰到任何问题和疑问时,立即通知专门服务小组项目经理,由责任人立即启动一系列预警反应机制,指导和协调下一步的处理工作。
2.2二线工程师职责
组建技术能力强、工作经验丰富的二线技术支持工程师团队,负责ITIL的问题管理、配置管理,由于系统的应用复杂性、设备维护的专业性,二线支撑团队按系统组建,负责分析系统参数、数据、信息,必要时现场收集并处理信息,进行优化的实质性工作。
2.3二线工程师职责
三线工程师主要负责ITIL的变更/发布管理,由于技术专业性要求高,三线的支撑体系主要协调省公司及系统建设集成商、第三方厂商资源进行支持。在结合ITIL和公司自身情况建立起来的三线服务支持体系,需要在合理的需求分析前提下,响应的问题及时的流转到响应的工程师,这样问题的响应时时间大幅减少,同时又能做到专业对口、能力匹配,事件处理的效率自然就能大幅度提升。
三、基于ITIL组织框架的运维管理实践 结合公司信息化建设集中化的建设原则,在供电局成立之日起各种专业的集中式信息系统逐步实施,供电局面临人员短缺,技术能力跟不上,处理系统事件不及时等问题。
为了解决运维管理中的问题,2013年起供电局在省公司的帮助下开始结合ITIL开始进行运维管理实践探索,从运维团队ITIL培训,三线运维体系建设,ITIL工单化流程梳理等方面进行了深入的探讨和全面实施。
2013年初,为了解决事件反映不及时的问题,公司建立了一站式的IT呼叫中心和事件管理流程,安排一线运维工程师7*24小时在线接受问题,并持续培训用户,养成用户有事件拨打IT呼叫中心帮忙电话,通过这一支撑服务前移的项目,取得了明显效果: 1)接受流程::建立基于ITIL的一线服务平台、事件管理流程的IT呼叫中心,确定一站式统一事件管理的目标;
2)梳理流程:对维护资源进行了整合调整,创建基于ITIL的一、二、三线的支撑体系; 3)总结流程:对流程关键点进行量化,建立了统一的对外服务标准,以及一、二、三线的内部考核指标;
4)从2013年起,经过近2年的实施,已经取得明显的成效,目前供电局系统可用率、客户满意率一直保持在99%以上,显著提升了供电局的运维管理能力。
四、结语
IT集中化运营模式,是未来信息化发展的趋势,结合ITIL打造的快速、高效的一、二、三线运维支撑体系是我们为追求高效卓越的运维管理的初次探索,我们也将不断探索、不断实践,全面提升公司的信息化运维管理能力。
如果您在阅读这篇博文之前,还未认识过ITIL,请来电咨询上海信息化培训中心,我们有专门的老师详细为您答疑解惑;
如果您在阅读这篇博文时候,已经了解过ITIL,如果想深入实践,请来电咨询上海信息化培训中心,这里不仅有一系列的ITIL课程,而且可以为公司专门定制个性化课程和团训;
如果您在阅读这篇博文的时候,已经学习过部分ITIL课程,请来电咨询上海信息化培训中心,这里有专门的老师为您解答ITIL高阶课程信息!
上海信息化培训中心(www.xiexiebang.com)好课ITIL每月定期开班,咨询021-62126633-6021.还可以关注微信微博了解最新ITIL发展前沿。
上海信息化培训中心SITC是中国领先的信息化促进机构,是ITIL的最好殿堂。