第一篇:运维2.0理论体系之三大重点
运维2.0之三大重点
一、业务驱动运维
IT的使命是向业务交付价值,为了高效地服务于业务,运维2.0强调以一种新的途径来管理运维,即业务驱动运维。业务驱动运维的本质强调无论服务源自何处,IT运维总能主动规避、发现或解决问题,向业务提供统一标准地端到端交付,并以确保持续改进的最佳服务级别的目标加以管理。业务驱动运维可以从如下两个层面来解读。(一)自上而下 —— 业务战略指导IT运维规划
运维规划从企业的业务战略入手,逐步将业务战略转化为运维管理系统与工具的功能目标和系统架构,通过分析业务战略识别运维目标、运维的交付过程和数据,对数据进行分析,自上而下地指导运维规划,并形成一体化运维平台。支撑企业业务战略的实现,满足企业管理层次的要求,引领企业业务创新。业务战略与愿景给IT运维体系和一体化运维平台提供总体架构与演进方向,同时也明确运维体系与相应落地工具组成与开发的先后顺序。
(二)自下而上 —— 智能运维提升业务的敏捷性
业务的发展瞬息万变,移动化、虚拟化和云计算等技术使IT运维环境错综复杂,IT运维要想跨越分散独立的异构IT领域,深入分析业务服务并实现模块化。就需要将业务服务级别提高到一个全新的智能级别。利用历史数据优化资源的使用情况,并规划未来业务发展。服务智能化旨在将各种IT数据转化为切实可行的知识,引领规划和指导实践。运维2.0工具体系提供能够提前预见IT问题和预判未来业务需求的分析引擎,支持IT部门更智能化地为业务交付价值。自下而上地将存储、监控、分析、展示、管理和规划全面整合在一起,提供全新的一站式和一体化服务,保证业务的敏捷性以及频繁变动时业务决策的科学化和智能化,减少耗时粗犷的手动操作。
运维2.0所提倡的业务驱动运维使得IT运维主动和业务建立强相关,运维愿景与规划来源于业务战略,运维活动反作用于业务创新与规划,IT的任何问题或故障都能量化成业务影响,业务不必了解复杂的IT技术仅需要了解和自身相关的服务。通过规范SLA评估服务质量,从而达到IT运维和部门之间相互依存、互利共赢的目的。
图示:业务驱动运维
二、架构驱动运维
所谓架构驱动运维是指利用架构的优化达到运维管理效率的提升,在应用发生变化或故障发生时,可以触发架构本身可伸缩和可调度能力,做到自我修复,节省对运维成本与能力的依赖。运维2.0的架构规划原则包括:(一)分层多级且单元化服务——拆分迭代灵活
大系统拆分成多层多级,如应用架构上分服务提供层、接入调度层、中间计算层、数据存储层。层级模块内高内聚,层级模块间低耦合。每一层级划分若干模块,低耦合系统易于扩展,足够小的模块易于复用。在保持功能模型完整的基础上,要保持高性能与高负载,需要不同功能特点的模块再拆分,比如静态与动态部分分离。此外,考虑到服务的性能和成本,核心服务的主服务提供体系可以考虑架构单元化,即服务虽然分层划分,但每个单元自成一体,单元中的上层节点会访问指定的下层节点。这样不仅保证了更高性能更低成本的目标,在资源隔离,系统灰度发布,对高峰扩容的应对方式上也提供了权宜之策。
图示:服务单元化
(二)服务模块化,兼顾分区容忍性——纵向可伸缩
根据目标客户群、增长模型、访问量模型、峰值分析等来推导和设计服务的架构、规模、资源,每个服务由多模块组成,如接入层主服务器集群、中间层备服务器集群。根据功能模型和用户规模推导出模块数量,每个模块支撑的容量,每个模块的服务器数量,每个服务器支撑的容量以及模块在多IDC、多ISP间的分布。当出现故障时,通过故障梯度服务柔性将故障对服务提供的影响消化掉,借助可伸缩的服务设计不影响服务调用者的体验。根据功能模型的需要,一部分类似一致性的商务需要可以通过其他手段完成。
图示:服务模块化
(三)多ISP、多IDC分布——横向可调度
为防范网络、硬件的故障,规避硬件层、系统层、通过全局负载均衡解析服务的访问,引导服务到最优的ISP、IDC、模块、服务器。当出现故障时,可以通过全局负载均衡将故障对应的ISP、IDC的服务器IP地址从全局负载均衡中摘除,服务访问被解析到其他正常的模块、服务器,从而使故障不影响自服务的提供。架构上多ISP、多IDC的分布和调度策略是重点。
(四)分布式云化部署——海量运维可支持
运维最大的挑战是基础架构环境规模越来越大,服务支持趋于海量,海量导致技术选型取向趋于分布式架构和产品。如分布式文件系统、分布式缓存、分布式存储和分布式数据库、IDC分布式部署。每套服务独占物理环境,交付慢且调整难度大导致运维日益云化,底层架构实现虚拟化资源池、上层架构实现运维流程服务调用,以达到有效提高资源利用率,全面提升系统运维管理能力的目的。
三、数据驱动运维
在云计算和大数据时代,集群规模和数据爆发式海量增长,给运维带来了巨大的挑战。运维2.0理论提出用数据说话、用数据预见运维活动、借助全量的数据提及评价运维过程,简言之,就是数据驱动运维。运维2.0的数据驱动运维关注两个重点。
(一)构建全量的数据体系
构建全量的数据体系包括构建数据全生命周期管理和数据架构体系,做好数据分类、数据标准、数据质量和数据安全的把控,作为数据驱动体系的基础数据采集与规范平台,发挥数据价值,为运维决策和运维服务的衡量提供科学依据。
数据全生命周期管理包括数据创建、存储、清洗、迁移、归档及销毁数据从产生到灭亡的六个阶段的标准、规范和流程。
数据架构体系则从流程、人员和技术三个层面,对所采集的面向资源的、面向技术指标的、面向服务的、面向用户的以及面向产品的结构化数据和非结构化日志或文件,在数据管控、数据归属、数据架构、数据质量和数据安全方面提出要求。具体落地方式可通过如下方式在实现。1.建立主数据系统,对主数据进行一致性管理和调用; 2.建立数据质量规范与策略、数据清理标准、数据合规性标准,并将上述规则嵌入到应用系统与工具中;
3.将数据分类,落实不同类型数据的归属者与责任人,并建立相应的逻辑数据模型和物理数据模型;
4.建立《数据质量考核办法和实施细则》,定期对数据进行合规和安全性的审计,确保数据质量的持久可控; 5.完善操作及分析数据的工具与技术,如数据提取、加载与转换工具、数据同步与整合工具、数据清洗工具、数据建模与分析工具等。
图示:全量数据体系(二)构建价值驱动体系
在建立全量数据体系,保证数据的准确性和完整性基础上,为体现数据价值,运维2.0提出价值驱动的四个方面。1.建立与业务战略相结合的数据战略,为数据化能力建立明确方向和目标。运维2.0提出将数据领域的管理与应用提升至企业战略层面,建立与业务战略相结合的数据战略,为数据化能力明确方向和目标。数据战略应充分消化业务战略中的数据需求,明确企业所应具备支撑业务的数据使用和处理的高阶能力要求,完整的数据体系应包含数据治理、数据管理和数据应用与服务三个高阶能力。数据战略用以强化企业基于数据的精细化管理和决策的意识。2.建立数据管理组织,坚持数据运维的文化,用数据认责法激活数据治理机制。在运维规划和运维活动中坚持用数据说话,坚持以定量的方法描述运维过程、定位运维故障、预见运维事件。数据驱动的运维理念反映到KPI中,确保团队成员对运维数据足够重视。建立企业数据管理组织,通过数据认责管理机制将数据资产分配到相关责任人,在数据生命周期中承担数据管理责任,与管理流程和制度结合,逐步建立数据资产人人有责的数据文化。
3.关注不同角色的数据需求。数据的反馈需要及时准确,但并非所有人员都需要实时数据,过多实时的数据一则成本高,其则干扰大。此时,需区分不同角色的数据需求“投其所好”,一线监控人员更多的是看服务状态,因此需要实时告警的信息;上层的运维管理人员希望看到的是服务周期性的状态、趋势和对比;工具研发人员需要看到数据的关联;产品人员关注的是产品的趋势和用户体验等。4.沉淀业务元数据。将业务元数据存储在配置管理数据库,建立底层数据关联。使用公共基准的元数据规则,更好的整合数据。
5.“以用带治”,建立持续滚动反馈的数据体系。让数据和运维目标相关联,通过目标驱动,自上而下的重视衡量运维服务的价值、评估目标的达成度和影响度。进而完善数据源及数据分析和展现的方法,提升运维活动的精细化管理,有效评估与衡量运维服务的质量,量化运维活动的价值。
第二篇:变电运维班2012年重点管理工作
2012年“亮剑”管理工作
为进一步贯彻落实公司年初“三会”精神,注重过程控制,强化末端治理,推进管理创新,提升队伍素质,凝心聚力,确保高质量完成工区全年工作任务,变电运维工区提出并实施“亮剑”管理工作。
一、严肃工作计划管理
根据省、市公司下达的年、月、周生产计划和工作任务,变电运维工区结合季节性特点和工作实际,工区和运维班组开展“月有活动主题、周有工作重点、日有具体安排”的工作计划法。工作计划法包括班组生产性、管理性和培训类等各项工作。工区严肃工作计划管理,每月的活动主题,既要符合上级要求,也要紧密联系工作;每周工作重点既要围绕月活动主题,又要求工区、管理人员和班组长应高度关注的工作;周计划要求全面细致,涉及生产安全工作的,还应有危险源点识别与预控措施,每项任务落实到人,具体到日。
二、强化人员责任管理
过程控制旨在落实人员责任,落实人员责任重在防范风险。工区首先明确各级人员的职责。工区主要领导与班组长、设备安全运行第一责任人签订安全生产和运维管理责任状,工区领导、专职每人挂钩一个运维班组,班组的每项工作落实到人头。形成工区自上而下的责任网络体系。其次是明确各级人员的工作计划和措施。专职和班组长每天明确工作内容和具体措施,专职和班组长每周在工区例会上汇报上周工作完成情况,并明确本周工作计划和要求。形成工区上下统筹安排、统一指挥,明晰工作任务和措施的执行体系。三是对各项工作进展情况进行定时检查与考核。班组长每天对当值人员和工作情况进行检查与考核;班组挂钩责任人定期检查并考核班组工作和作业现场;工区按月、季进行检查并考核设备安全运行第一责任人的业绩。形成工区自下而上的责任考核体系。
三、推进科技创新管理
今年以来,工区十分重视科技创新和科技成果应用工作。年初,要求各运维班结合本班组的工作实际,确立QC技术攻关课题,并认真实施,力争年底至少两个QC课题获市公司表彰,至少一个QC课题获省公司荣誉。工区积极引导员工在平时工作中,多观察、多思考,想点子、出主意,主动参与群众性科技创新活动。工区积极与有关科研单位和厂家合作,共同谋求解决生产运行、生产安全等方面的技术难题,其中一项科技项目正在实施当中,有3项科技项目已报省公司,待批复后抓紧实施。工区积极应用新技术、新成果,一是请专业厂家对工区管辖的变电站设备进行精确测温,并建立各变电站设备测温软件档案,为掌握和跟踪设备热故障,提供第一手资料;二是请专业厂家安装变电站智能钥匙管理系统,用智能技术解决变电站钥匙多、管理不规范、有安全隐患的问题;三是请专业厂家对污染较重的变电站瓷瓶进行带电清洗,解决设备污脏、停电难,有效预防设备污闪的问题。
四、加强变电运维精益化管理
变电运维工作,就是要坚持以设备缺陷管理为中心,坚持以“两票三制”为抓手,着力加强变电运维精益化管理。
1、规范设备巡视检查工作
工区要求运维班组按照“江苏省电力公司变电站管理规定”中巡视检查制度,认真开展变电站设备正常巡视、全面巡视、熄灯巡视和特殊巡视。变电运维人员要按照“变电站现场巡视标准化作业指导书”要求,开展巡视项目的标准化巡视检查,巡视工作要到点到位,巡视项目齐全无遗漏。每次巡视均应对照“变电站巡视标准化作业指导卡”,逐项打“√”。巡视中发现缺陷及异常时,应准确分析、判断缺陷类别和原因,及时汇报,并做好相关记录。设备安全运行第一责任人,每月不少于2次对所辖变电站设备的巡查。工区领导按照制定的巡视计划,定期参与变电站设备的巡视。
2、重视设备红外测温工作
工区要求运维班组严格执行“江苏省电力公司变电运行管理规定”中红外测温制度,开展变电设备计划普测与重点测温,针对冬季高峰负荷、部分重载超载设备,淮阴变220kV构支架改造期间淮阴变区域110kV电网接线方式薄弱,迎峰度夏和重大保电活动期间缩短测温周期。变电运维人员要按照“红外测温标准化作业指导书”要求,认真开展红外测温工作,做到测温项目的齐全与完整。设备安全运行第一责任人除定期进行变电站设备红外测温外,还要求与运维人员一起跟踪监测热故障设备,定期上报监测结果,直至设备热故障消除。工区十分重视设备测温记录的管理,每次测温后要求及时将红外检测记录与结果录入生产管理信息系统,不允许弄虚作假的记录。另外,工区请红外测温专业厂家,对所有变电站进行红外精确测温,并建立变电站设备红外测温软件档案,为设备状态评估提供技术支持。
3、严格变电站钥匙管理
责任事故警示我们,变电站钥匙管理是否得力,将直接影响人身和设备安全。工区根据“江苏省电力公司变电站钥匙管理规定”,对每座变电站都配置了常用钥匙箱、备用钥匙箱、解锁钥匙箱。要求运维班组加强变电站钥匙的定置管理和使用管理。变电站大门、开关室、主控室、机构箱、端子箱、汇控箱、屏柜及各类切换开关等钥匙应集中存放在钥匙箱内中,变电站常规钥匙由变电运维人员保管并纳入交接班内容;防误解锁钥匙由工区公布的防误专责人负责封存管理。检修或其它工作人员需借用钥匙,变电运维班当值人员按要求认真履行借用手续;当防误装置及设备出现异常或特殊方式需要解锁操作时,严格执行解锁程序,并填写解锁钥匙使用记录,解锁钥匙使用后应及时封存管理。
4、严明“两票”执行纪律
操作票和工作票是变电运维人员和检修人员的“生命票”。要求变电运维人员严明执行工区提炼并用PPT形式制作出来,关于操作票的操作前、操作中、操作后“三检查、三核对”操作法和关于工作票的“十问五查”法,尤其是操作票的“审查、唱票、复诵、打勾、检查”和工作票的“审查、安措落实、危险点交底、工作许可”等关键点要管控、在控。针对危险性、复杂性和难度较大的作业任务,班长、专职、工区领导要认真制定方案,协调人员力量,做好充分准备,并深入现场进行检查、指导、把关,坚决杜绝人员伤亡、误操作事故的发生。
5、严密作业现场安全管理
工区要求运维班组应认真执行工作票审核、安措票填写与执行、工作许可、工作间断、转移和终结制度。现场一、二次设备安全措施的布置按照省公司《一次设备现场围栏和标示牌设置规范》、《变电二次设备作业现场安全措施设置规范》执行到位,基建、技改工程的一次设备必须用1。7米高的硬遮栏布置。在工作许可前,变电运维人员(工作许可人)要对施工(检修)单位的工作负责人进行安全交底,详细交代工作地点及安全注意事项。要加强工作现场的巡查,重点检查现场安全措施有无被变更或破坏的情况,发现问题时,要及时纠正。要高度重视安监部、调控中心颁发的高危作业预警通知涉及的工作现场,深入开展现场作业危险点的分析,落实安全防范措施和管理人员到岗到位制度,确保特殊运行方式和施工检修期间的设备安全稳定运行。
2012年2月10日
第三篇:烟草行业运维情况
IT运维:烟草业下一轮信息化的重点
畅享网
在国家局“做大做强”、“两个十多个”战略的指导下,国内烟草大市场、大品牌的格局将越来越明显,竞争亦将越发激烈。在这轮竞争中信息化手段将扮演重要的角色,企业对信息化的依赖起来越强,对IT服务水平的要求将越来越高。在信息系统的生命周期中,一般系统建设的时间大约为一年,而系统使用运维的时间大约四到七年或更长,因此,业界提出了“三分建设,七分管理”的说法。经过大致两轮的信息化建设后,烟草工业企业信息化将逐步趋于成熟,走向稳定,后续信息化工作的重点之一便是做好系统的运维工作,保障系统平稳运行,支撑业务发展。烟草工业企业IT运维工作面临如下主要的问题:
1、IT部门已经发布了运维的制度与流程,但业务部门对运维工作还是不满意。运维管理效率低下,相似问题屡屡发生,IT运维人员疲于奔命。
2、随着信息化硬件、网络建设、应用系统建设的不断完成和交付使用,如何整合运维人员,不同系统如何建立一致的服务流程
3、系统越来越多,技术越来越复杂,但部门人员却增长不多,哪些业务应该外包,哪些业务应该自己做
4、公司想上一套运维软件,市面都有哪些软件,各有什么优劣。
除了本部信息中心外,遍布全国的各生产厂部也有信息部门,系统建设都是由总部统一规划进行了,但在运维方面,是否应该有所不同,各厂部信息科在运维方面承担哪些职责?
一、烟草工业企业信息化发展态势
在2008年中国信息化500强排名中,烟草行业有23家企业入围,18家中烟公司中,除2家未能入选外(分别是湖北中烟、陕西中烟),其余均入围。排名靠前的有上海烟草,红塔、山东中烟、浙江中烟等。说明烟草工业企业整体信息化水平在国内企业界来讲处于较高的水平。
1、烟草工业企业信息建设历程回顾
烟草行业自2003年实施工商分离以来,工业企业方面经历了联合重组、两个“十多个”、工商协同、按订单组织货源、跨省重组等战略举措,逐步形成了18家中烟公司。配合企业变革的进程,烟草工业企业信息化已大致经历了两个阶段。第一个阶段从2003年到2006年,其主要内容是围绕联合重组的要求,为了满足中烟工公司成立,卷烟生产厂兼并重组的初步公司化管理的需要进行,主要工作有:基础设施建设、OA平台建设、统一的财务系统的建设等。此阶段信息化建设的特点是以基础建设为主,应急,缺乏总体规划。
第二阶段从2006年到现在。随着联合重组的逐步完成,如何整合资源,实现中烟公司对下属卷烟厂的管理管控需要,如何落实国家局“四个中心”建设的要求,烟草工业企业开始整体思考信息化建设的方向与路径。此阶段信息化建设的特点是整体规划,分布实施,稳步推进,以求全面支撑企业的发展。代表企业包括山东中烟、广东中烟、江苏中烟、浙江中烟等。
2、烟草工业企业信息化建设现状
现阶段主要工业企业第二波信息化建设接受尾声。多数企业已逐步进行ERP、MES系统的建设或已完成,形成了支撑企业运营的统一的信息化平台,构建了企业信息框架的核心。
接下来第三波信息化建设将逐步向供应链的两端及企业指挥系统的上下两端拓展,向专业化软件的引近过渡。如客户关系管理系统的建设,面向商业会员的工商协同系统的建设,面向供应商的SRM系统的建设,面向企业决策层的BI系统的建设,面向操作层面的自动化识别技术的应用等等。而系统之间的集成整合也将受到企业的重视。
与其同时,IT运维工作被提上烟草工业企业信息化工作的重要议事日程。IT运维与信息化建设相辅相存,信息化建设有赖IT运维的保障。信息化建设为企业业务运营搭建了支撑平台,但这个平台用得好不好,到底能不能产生预期的效果,除了用户的积极使用外,主要依靠IT运维。通过IT运维,一方面保障了信息系统的平稳运行,另一方面可以不断对信息进行优化与提升。
二、几家重点烟草工业企业IT运维现状
1、红塔集团
红塔集团作为烟草工业领头羊,其IT建设走在了行业的前列,早在2001年便实施了SAP ERP系统,并在2007年进行了系统的优化。同时部署了综合统计与经济运行分析系统。因此其较早的面临了大规模的系统化的IT系统运维工作。红塔集团建立了自己的IT服务软件系统,并从网络信息安全角度,从物理环境安全、计算机网络安全、计算机系统安全、网络信息安全制度等方面,建立红塔综合网络信息安全体系。采用先进的安全技术,构建了防火墙系统、防病毒系统、入侵检测系统、内部审计系统,建立起了一套完整的网络监督、控制和记录的系统,从技术上保证了系统的安全性和保密性;同时参照ISO17799标准,制定了《公司国际互联网安全管理规定》、《公司国际互联网保密管理规定》、《公司国际互联网保密管理实施细则》、《公司国际互联网用户守则》、《公司局域网安全及保密管理规定》等一系列规定,从管理上杜绝了滥用网络的情况,既保障员工既开放又规范地使用网络。2009,借助IBM Power Systems纵深拓展ERP平台,提高IT资源管理及服务管理水平。,并选择IBM的ERP业务系统灾备方案,在原有主机热备基础上采用IBM服务器及存储设备,构建全新的远程容灾备份系统。
2、上海烟草
上海烟草很早就开始重视系统运维工作,从2005年开始,信息中心对运行维护现状进行了深入地分析,确定了“产品与自主研发相结合”的策略,并开始着手建设信息系统运维平台。2006年基本完成了运维平台建设。
运维平台主要包括运维服务管理系统、监控管理系统,这两个系统之间相互联系、协调运作。同时,两个系统也可分离,根据企业的需要独立实施某个系统。其中,运维服务管理系统包含服务台、事件管理、变更管理、问题管理、发放管理、配置管理,并且以配置管理数据库及知识数据库为信息支撑;监控平台主要包括硬件平台监控管理模块、软件平台监控管理模块、应用系统监控管理模块和机房环境监控管理模块,系统管理员可以方便地通过这四个平台对企业内部的网络设备、主机、存储、数据库、中间件、业务系统和机房环境进行全面的管理。运维服务平台的建设并投入使用让上海烟草IT运维管理变“被动维护”为“主动维护”;维护服务标准化、产品化;以ITIL为基础实现主动管理。
3、浙江中烟
浙江中烟信息化建设近年来取得了较快发展,随着ERP系统的一期的上线使用及MES、营销相关系统的建设,浙江中烟亟需建立统一的IT运维管理平台。2009年,浙江中烟在ERP建设过程中,开始着手进行运维管理平台的选型,并最终选择了广通信达的Broadview产品,计划分两期进行建设和优化,目前正在进行中。与此同时,浙江中烟还进行信息安全体系规划与建设,选择了启明星辰进行信息系统风险评估、网络改造规划以及整体信息安全管理体系建设,目前已通过验收。
三、烟草工业企业IT运维的三个关注点
通过分析烟草工业企业信息化建设的发展历程及IT运维现状,并观察电信、金融、能源等IT运维发展,可以看到运维组织、制度、流程的建设和完善、统一运维平台的建设、运维外包及服务质量的管理将即下来大部分烟草工业IT运维工作的主要关注点:
1、运维组织、制度、流程制定与完善
伴随着系统的建设和逐渐投入使用,烟草工业企业陆续发布了运维方面的政策、流程,并安排不同人员进行跟进落实,但进入后建设时期存在如下问题: 运维制度、流程往往从单个系统去考虑,存在遗漏,缺乏统一性;运维工作尚处于事件、问题触发型,处于被动地位,缺乏主动运维的制度、流程支撑 随着系统使用的深入,部分运维政策、制度、流程未及时更新,已经不能适应需要,用户抱怨增加
运维政策、流程的落实不力,缺乏对运维质量的有效的监控措施
后建设时期,如何调整信息部门人员分工;信息化建设期间由本部统一规划实施,但在运维方面,本部信息中心与各卷烟厂(部)信息科如何分工,是否涉及运维力量配置的进一步优化空间
烟草工业企业已意识到采用IT治理框架所提供的最佳实践标准来对提升服务管理、信息安全、法规遵从等方面的重要性,如ITIL(ISO20000)、COBIT、CMMI以及ISO/IEC 27001等。部分企业已开始尝试用这些框架。
ITIL(ISO20000)侧重于对IT运维管理实践的指导。在国内目前的IT运维领域,ITIL已经在实践中被广泛采用。2007年,英国商务部(OGC)正式发布了ITILV3版本,提出了服务生命周期的框架,ITIL v3定义了服务生命周期的5个阶段:服务战略(Service Strategies)、服务设计(Service Design)、服务转化(Service Transition)、服务运营(Service Operation)、持续改进(Continual Service Improvement),它包含了生命周期内管理服务需要的流程
烟草工业企业可参照ITIL的有关内容设计企业后建设时间的IT运维管理的组织、制度、流程。
2、统一的运维平台建设
(1)国内外常见的IT运维软件平台
目前常见的IT运维软件,国外的有CA Unicenter、IBM Tivoli、HP BTO(整合了OpenView、Peregrine、Mercury、Opsware等软件资产)、BMC Remedy、FrontRange等 BMC BMC Remedy ITSM Suite;BMC Magic Service Desk Suite。Remedy解决方案包括事件、问题、变更和资产管理模块。最新版本7.0 优点:底层开发平台的灵活性是其最大优势。流程方面功能强大、灵活;基础定制比较简单。Remedy的数据的报表能力很强,可以基于Crystal报表工具自由定制
缺点:系统在界面上处理得很不好,不够人性化;对配置管理特别是资产管理的成功案例说服力不是很强,相关的配套软件如网络管理软件没有像其ITSM产品一样著名。CA 管理解决方案、桌面管理、作业调度管理解决方案、eTrust 安全管理解决方案、BrightStor存储管理解决方案等,产品非常全面。
ServicePlus Service Desk解决方案可以与Unicenter解决方案集成,共同管理基础设施,也可以独立实施。
优点:技术上有很多优点的;其Service Desk解决方案(ServicePlus Service Desk)可以与其他品牌解决方案集成,共同管理企业的IT基础架构,也可以灵活与第三方厂商的解决方案进行集成;ServiceDesk有着简洁的界面,流程工单的相关关联信息也非常方便查看。
缺点:二次开发相对比较繁琐,自定义的表单和新流程的开发效率相对较低 HP HP BTO(business technology optimization)在战略、应用和运营三个层面惠普共提供了12个被称为“中心”的软件产品和方案。包含下述三个层面: 一是战略层面工具,包括项目和产品组合中心和SOA 中心;二是应用层面工具,包括性能中心、质量中心和应用安全中心;三是运营层面的工具,包括业务可用性中心、运营中心、网络管理中心、服务管理中心、客户端自动化中心、数据中心自动化中心和身份认证中心等。
在运营层面的HP Automated Operations 1.0组合中包括了IT Service Management(ITSM)、Business Service Management(BSM)和Business Service Automation(BSA)等解决方案
其中,业务服务自动化(HP Business Service Automation,HP BSA)软件解决方案,打造了单一平台实现跨应用程序、服务器、网络、存储设备和客户端的所有IT流程以及设备变更的自动化。该解决方案还提供了用于汇报的集中配置管理数据库(CMDB),并降低了变更带来的成本和风险,确保了全面的审计和合规能力;升级的IT服务管理(IT Service Management,ITSM)软件增加了相关的服务,通过蓝图、培训和评估的形式提供了最佳实践。HP ITSM软件可以帮助企业从开始到终止的整个周期内,定义、交付和管理业务服务 IBM IBM Tivoli包括业务应用管理、存储管理、安全管理、资产管理、服务可用性和性能管理、服务交付和流程自动化、能效管理、SOA管理、虚拟化管理、云计算等类别系列产品和服务,如Tivoli 流程集成、Tivoli变更和配置管理数据库(CCMDB)、Tivoli流程管理软件、Tivoli的技术平台;Tivoli License Manager。优点:Tivoli软件的配置管理数据库领引了ITSM的热点,同时,Tivoli技术平台上针对各个具体领域(比如监控)的软件工具正日益完善。缺点: 国内主要的IT运维软件与服务厂商有广通信达、神州泰岳、游龙科技、摩卡、北塔软件等。
广通信达。广通信达最早从政府行业的运维起步,现在已发展成国内IT运维的主要品牌。其BroadviewIT运维管理平台已在浙江中烟,内蒙古烟草、云南烟草部署;
神州泰岳。神州泰岳立足于方案提供商,有自己的ULTRA系列软件,也是BMC Remedy的全国总代。
游龙科技专精于产品研发,从桌面管理、网络设备管理,到上网行为管理、系统管理和IT服务管理,都是一个集成化的产品,具有很强的可扩展性。其 SiteView软系列件已有江西烟草、河南中烟新郑卷烟厂等案例、摩卡,摩卡来自新加坡,最初为IBM分销商,目前已推出Mocha BSM、Mocha ITAM、Mocha ITOM、Mocha NTA、Mocha E2E等多项产品和服务,在电信、政府、金融、能源、制造等行业拥有众多案例
北塔。北塔早期以电力为主,逐渐向其他行业渗透,目前已推出BTIM、BTNM、BTDM等产品和服务,在多个行业拥有成功案例。烟草行业已有商洛烟草、江苏烟草、红河卷烟厂客户。
(2)IT运维软件平台选型的关注点
烟草工业企业信息化环境具有多平台、多厂商设备、多业务系统、地理布局分散等特点,IT运维管理环境趋向复杂多变,因此对IT运维平台的选择关注: 产品适用性:是否能监控到不同的厂商设备,不同的平台和业务系统等 方案成熟度(成功案例、同行案例):是否有同行或类似行业的的实施案例、应用效果 定制活性。
其他:价格、实施人员的素质、售后服务等
3、外包的选择和服务质量的管理
据国外知名资讯机构的调查表明,全球90%的公司中至少有一项主要IT业务职能已进行了外包,IT运维外包服务在国外很多国家得到了充分肯定和广泛的应用。2005年,全球运维外包服务市场整体规模已达到726.37亿美元,市场增长率为9.5%。外资企业用户市场需求的不断发展和本土用户行业需求的不断深入,催生了中国运维外包服务市场的进一步发展。据统计,中国运维外包服务市场规模2005年达到38.69亿元,同比增长了20.2%。近两年来,中国IT运维外包服务市场仍将保持快速发展趋势,并极有望在2010年达到百亿元的规模。烟草工业企业受人员编制的限制,很早就开始尝试IT运维外包服务。如某南方中烟公司,其本部IT部门目前合作的运维服务商超过五家,包括桌面支持、网络维护、应用系统维护等,并专门提供几间办公室给外包人员办公。在此过程中,企业不断思考以下问题:哪些运维服务可以外包,哪些不能外包?如何管理外包服务的质量?
第一个问题涉及外包策略问题,需要在企业内部就外包的目的达成共识:是为了节省人力、降低成本、提高服务质量、变革创新,还是希望综合改进。并在此基础上明确梳理IT运维外包服务内容。一般来讲重复性的、事务性的、专业性的工作可以考虑外包,而涉及权限、数据、信息安全等应由企业自行负责维护。在外包供应商的选择上,应慎之又慎,方法之一是建立一套完善的外包服务商的选择标准,全方位考察外包供应商,包括技术能力、资金能力、人力资源、持续发展能力、经营策略、管理思维、企业文化、团队精神。在外包供应商的考核上,烟草工业企业可以通过部署ITIL的服务目录和服务水平协议,企业可以把整个外包内容细致化、量化,明确提出IT外包商该做些什么,并把这些服务项目放进服务合同。在上述外包协议中约定的内容基础上,企业应建立一套日常对外包商的监督检查机制。
企业应保持对外包商的更换能力。同时应注意,工作外包并不意味着责任外包,运维服务最终责任仍然要企业IT部门承担,要避免IT部门员工“外包给你们了,所有的事就应该都由你们来处理”思想的出现。
第四篇:运维工作计划
篇一:2015年运维部工作计划.修改 2015年工作计划
结合公司今年运营发展的思路,我部门今年将重点提升网络服务质量,提高运维人员综合业务素质。
一 运维部基本情况: 运维部主要维护十二师辖区和乌鲁木齐市区两部分,其中十二师辖区内有五大团场片区,共有用户44126(穿线用户)实际使用用户为35525,三网用户2237户,现有维护员13人。市区维护26个小区,共有用户22570, 现有维护员2 人.二 2014年运维部维修故障分析
2013年全年故障发生共10657起,占总用户数的2.5% ,故障率为,主要分为:马赛克,装修改线,公用电停电,用户光纤损坏,拆迁,机顶盒坏等。
1小区共用电停电造成的故障占运维故障的50%,主要原因是:不能及时补电,交纳电费受小区物业的控制.2 用户光纤损坏(人为和自然、工程)占10%,加强日常线路维护。
3老机顶盒损坏5%,主要原因,大部分用户是2009年左右的用户,使用寿命已到,造成故障.4 用户装修改线15%造成线路不通,和用户光纤的损坏造成二次熔接。5 拆迁用户的维修10%.6 其他原因占10%.三 2014年机房维护情况说明 现有机房10个,计划新增机房1个,存在的问题,分机房停电不能及时供电第一时间到现场解决故障,存在很大的安全隐患。四2015年的工作计划
1、重点解快因用电造成的故障,与小区物业部协商取得供电支持,计划在今年年初对辖区内的共用电改造工作。
2、抢修组已做到责任制到片区及时处理光纤故障,做好对用户禁止装修改线的宣传工作。
3、为了提高机房安全运行传输质量,加快建设网路机房监控设施,预计建设现有分机房11个。
4、维护人员的综合业务素质 ,加强培训,年初针对运维网络技术和公司考核管理的培训计划一周一次上半年,下半年两周一次和对新进员工的资质培训,月度考试与工资挂钩,提升运维人员的服务统一标准,5、完善安全生产制度,搞好安全生产工作。(1)每月定期对机房进行寻查、巡检工作。(2)对运维人员不定期抽检技术性工作流程。
6、加强运维人员的市场营销意识,新业务推介与提成.7、今年需建设好主干线的环路(列如:师机房至104团,104团至西山等)和网管系统,做好网络运行质量.。
8、今年运维部计划分5个大片区其中城区26个小区,用户22570户其中现有三网用户1509户,3人一辆车维护,西山、104团三网用户6211户,3个人维护,头屯河农场三网用户7421户2人维护,三平农场三网用户11360户2人维护,五一农场三网用户7090户,2人维护,抢修组4人一辆车负责5个大片区光缆用户光纤、主干光缆的维修维护,9、今年工程部改造老校区的光纤到户的同时改造维修量较大的老有线电视小区。(列如:五一农场诒心园小区一期,楼兰酒厂,光华学校等)。
10、由于公司的网路不只是传输有线电视还传输了数据业务而且用户不断增加,光缆全部是寄挂或借用在别人的管道和木杆抢修查找断点耽误时间,不能及时修复,由其晚上对运行维修带来很大困难,今年计划建设好主干线的环路(列如:师机房至104团,104团至西山等)和网管系统,做好网络运行质量。
11、积极配合工程部做好城郊主干网、本地传输网、及弱点管道和各团场分机房建设,竣工验收工作及维护等其他工作任务。
12、落实运维部的各项管理制度,明确目标管理,理顺工作流程,为了更好地为用户服务,从而提高用户满意度建立良好的天娱传媒口碑。
运维部
2015年11月8日篇二:运维部下半年工作计划 运维部下半年工作计划
为了使运维工作顺利进行,运营部下半年工作计划如下:
1、进一步推进服务器的规划部署、搭建,以及对服务器构架、网络进行优化和调整。
2、利用监控平台nagios实时监控服务器、网络设备及业务系统的运行状态、性能。根据监控和处理结果,及时记录相关信息,定期汇总运营信息。
3、优化公司网络、邮件服务器、语音系统以及解决常见的操作系统、网络和应用故障。
4、负责突发性事件的快速响应和处理,解决服务器和网络故障。
5、与开发人员配合沟通,解决运行过程中的相关问题。
6、对日常运营数据的整理分析,然后对服务器状态监测,游戏出现问题的解决。
7、配合商务及市场部做好相关工作。篇三:2009运维服务能力管理计划 2009运维服务能力管理工作计划
根据公司本的工作计划,运维部结合本部门的工作实际,及相关的it运维服务工作的改进需求,特制定本工作计划,内容共分为四部分,包括:
1、运维管理组织结构
2、运维服务流程
3、应急服务响应措施
4、服务管理制度规范。现具体阐述如下:
一、运维管理组织结构
本运维项目的运维管理结构位三层模式,具体如下图所示。由项目负责人与甲方进行业务范围接洽,并将沟通结果向下传递。项目经理负责项目的整体运维工作,包括各种制度的制定和实施。运维工程师则在项目经理的指导下开展维护工作。1.项目负责人职责:负责项目商务、整体协调事宜。职位描述: 1)、整体负责建设单位运维项目服务计划的制定,领导项目经理并安排项目工作,指导项目经理完成具体维护工作,每周听取项目经理的工作汇报,负责考核项目经理工作完成情况。2)、协助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体实施。2.项目经理
职责:规划、执行、完善信息化项目的运维工作,指导网络、数据库维护工程师开展工作。职位描述:
1)根据公司战略目标,指导下属工程师开展客户服务工作,确保运维工作能够满足客户的实际需要;
2)建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中出现的特殊问题; 3)规划并提升运维工程师专业服务能力,在整体上提高客户满意度; 4)制定和持续完善绩效考核体系;
5)制定整理运维项目的应急预案系统,并指导运维工程师实施;
6)提高自身专业技能,在业务方面给予网络管理员和数据库管理员指导。
3.技术主管职责:应用、数据库管理,oracle性能调优,实现应用负载均衡。职位描述: 1)技术主管非项目常驻人员,根据项目需要进行专业方面 指导;
2)负责数据库性能分析与调优,数据库运行状态监控,及 时发现异常并快速处理。
2)熟练掌握oracle10g的rac技术,能够实现部署及调优。3)掌握was、weblogic、tomcat、websphere等中间件的工 作原理,能够实现部署调优及故障解决。
4)熟练掌握red-flag、redhat等linux操作系统,部署 oracle10g、mysql数据库。熟练掌握dataguard技术,保 证oracle数据库冗灾、数据保护、故障恢复。5)负责应用负载均衡的部署和调试。
6)负责指导数据库工程师管理员开展工作。4.服务台
职责:故障电话受理,文档管理。职位描述
1)负责it业务的救助电话的受理工作;
2)故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态; 3)进行维护故障统计、用户满意度统计、工作报表输出等工作; 4)协助项目经理,进行文档整理、归类、保存等工作。5.网络管理员
职责:维护建设单位网络系统正常,解决网络相关故障。职位描述: 1)对现有服务器、局域网络及机房、配线间的日常管理维护; 2)对信息安全建设提出相关建议,确保网络的安全; 3)保证外网光纤线路正常,保证局域网运行正常; 4)对网络系统和网络设备的运行状态进行监控;
5)熟练掌握域策略设置、dhcp、dns、ftp服务器、ntfs权限设置等; 6)编写网络部分的应用处理预案并实施。
7)工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神.6.应用、数据库管理员
职责:维护建设单位业务系统运行正常,解决应用和数据库故障。职位描述: 1)监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整;
2)规划不同数据的生命周期,制订备份、恢复、迁移和灾备策略,根据业务的需要执行数据转换及迁移等操作;
3)保证应用和数据库系统的安全性、完整性和运行效率。4)负责数据库平台的整体架构及解决方案的制定和实施;
5)工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神.7.终端管理员职责:维护建设单位桌面系统运行正常,解决终端、外设故障。职位描述: 1)各部门电脑、打印机、传真机的维护;
2)对各部门职员进行电脑相关的技术支持及培训工作; 3)精通windows xp及office的使用,能够熟练使用excel2003、excel2007及以上版本,能够制作相应教程对其他部门员工进行培训
二、运维服务流程
it运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程可能会逐步独立并规范。
三、应急服务响应措施
运维项目组制定了详尽的应急处理预案,整个流程严谨而有序。但在服务维护过程中,意外情况将难以完全避免。我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。1.应急预案实施基本流程
第五篇:运维岗位职责
运维部门经理 岗位职责:
1、负责部门规划和管理,包括完善内部运维团队,技术规划,团队建设等;
2、负责运维制度的制定,包括运维制度的细化和监督执行;
3、根据公司及部门总体目标,制定团队发展的中长期计划;
4、负责公司的电商平台资源管理:分配、实施、采购申请;
5、负责各个系统及网络架构的规划、管理和维护;
6、安排并实施相关业务的第三方技术服务合作;
7、负责整体把握运维服务质量,数据分析质量,资源规划等。
8、负责软件质量检测:流程测试,代码测试,bug提交等;
高级系统运维工程师 岗位职责:
1、参与设计、审核、优化公司电商系统以及各应用系统的体系架构;
2、全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台;
3、负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化;
4、建立面向开发部门,业务部门的服务流程和服务标准;
5、负责电商平台运维相关流程的规划、设计、推行、实施和持续改进;
6、负责日常系统维护,及监控,提供电商平台软硬件方面的服务和支持,保证系统的稳定,负责内部分派下发,对实施结果负责。
运维工程师 岗位职责:
1.负责日常网络及各子系统管理维护;
2.负责设计并部署相关应用平台,并提出平台的实施、运行报告;
3.负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进;
4.负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告; 5.负责网络监控和应急反应,以确保网络系统有7*24小时的持续运作能力;
6、负责日常系统维护,及监控,提供电商平台软硬件方面的服务和支持,保证系统的稳定。
测试工程师 主要职责说明:
1.编写测试计划:仔细阅读项目规格说明、设计文档、使用说明书等,充分掌握软件的性能、特点、使用方法、业务流程等,协助测试经理制定项目的测试计划,保证产品测试工作的计划性与规范性
2.编写测试用例:按照测试流程、计划以及对产品特性的把握,沟通确认测试的范围、重点,考虑逻辑、数据完整性等要求,详细规定测试的要求,策划、编写测试用例,设计3.4.5.6.测试用数据及预期结果,做好测试前的准备工作,确保测试目的的达成
执行测试,根据测试计划及测试案例,执行测试,并根据产品特点及测试要求,实施集成测试、系统测试等,及时发现软件缺陷,评估软件的特性与缺陷,确保测试目的的达成。
进行BUG验证根据测试结果,与开发部门反复沟通测试情况,督促开发部门解决问题,修正测试中发现的缺陷,完善软件功能 进行测试记录和相应文档编写。
编写测试报告和对测试结果分析,通过测试,掌握软件具有的能力、缺陷、局限等,对软件质量给出评价性的结论与意见,整理测试文档,填写软件测试报告,编写测试总结,为软件开发成果提供总结性意见
数据
岗位职责:
1、活动数据收集:收集每个活动所引发的数据,并反馈给活动负责人。
2、平台数据收集:自动化监控平台各项服务和收集数据。通过数据了解平台运行状况。
3、每日数据报表:根据公司领导需求,定制各式数据报表,每天定期整理数据,并发送给领导。
4、信息分析反馈:通过收集活动或运维数据,分析数据。针对关键数据进行反馈,供其他部门参考。另外,对平台运维数据进行分析整理,以调整和优化平台。