第一篇:关于ERP系统运维中的安全管理
关于ERP系统运维中的安全管理
2014-04-21 任焕萍
随着信息化建设的快速发展,信息系统面临的安全威胁越来越多。对企业而言,以ERP为核心的信息化管理系统,在企业经营和发展中的作用越来越重要,ERP作为企业资源计划管理系统,涉及企业人、财、物、销、生产、成本和设备管理等诸多业务,企业的核心业务、流程和管控都要在ERP系统中处理完成,因此,ERP系统的安全性就尤为重要。那么,如何做好ERP系统的安全工作呢?其实,信息系统的安全与其他行业的安全方面有很多共通之处,安全管理的思路、体系、方法都是相同的,信息化安全管理要借鉴,借鉴传统行业的安全管理模式,学习其他行业、单位安全工作的经验,不断提升,才能做好ERP运维安全工作。
通常安全事故隐患发生的原因,主要分为三类,包括:人的不安全行为,物的不安全状态,管理上的缺陷。针对这三类,预防安全隐患、做好安全工作需要从认识、技术和管理三方面为抓手,如果本质安全和防范措施无力或失效,事故的发生是必然的。信息化系统也不例外。因此,信息系统的安全要从源头抓,从安全认识和安全管理入手。具体主要从以下几个方面开展:
一、增强安全意识
要增强ERP运维人员安全意识,增加对运维工作的危机感。在ERP实施和运维中,对于系统环境有严格的分类管理要求,系统环境一般分为开发环境、测试环境、培训环境、生产环境,正式的运行系统就叫生产系统,信息化系统的安全就像煤炭生产的安全一样也很重要,ERP运维安全重点是生产系统的安全。生产系统的业务数据所有权属于企业,只有客户才能有权限访问生产系统。运维工作的安全红线是“决不能以操作业务为代价来做运维”,红线碰不得,事故出不得。现在一般企业都做了很多信息化系统,信息系统的安全问题日益凸显,信息系统的运维人员很多还不能很清晰地明确自身的角色定位,存在很多安全隐患。系统运维人员是技术支持者,不管有任何理由都不能有操作权限,也不能以客户的权限操作系统,更不能泄露客户数据和业务。要把握好尺度,严格规范和执行关于系统访问权限和数据安全保密的要求,明确哪些是运维人员能做的,哪些是不能做的,杜绝超越权限范畴越权访问。总之,要通过加强安全的培训、宣贯和督查,强化安全意识,在潜移默化中树立新的安全价值理念,把运维安全意识贯穿到每个人,贯穿到工作的每个环节,引导每个人从“要我安全”向“我要安全、我会安全”转变。
二、加强安全体系化管理
没有事故发生不等于足够安全。侥幸心理要不得,有个别人认为我做了多次违章操作,都没有发生事故,就不会发生,殊不知表面的风平浪静不等于真正的安全。更有一些人,当发生事故时,认为是一时疏忽,是偶然,却不知偶然中存在着必然。1941年美国的海因里希统计了55万件机械事故之后,得出一个重要数据结论,即当一个企业有300个隐患或违章,必然要发生29起轻伤或故障,在这29起轻伤事故或故障当中,有一起重伤、死亡或重大事故。对于不同的生产过程,不同类型的事故,上述比例关系不一定完全相同,但这个统计规律说明,在进行同一项活动中,无数个隐患或违章,必然导致意外故障的发生,而无数个意外故障,必然导致重大事故的发生。
可见,及时做好防御工作才能保证信息安全。在ERP系统包括其他套装软件系统的安全方面,借鉴传统行业成熟的安全管理经验,实现安全管理的制度化、规范化、标准化、专业化,是预防和管控安全风险的关键。制度化是要建立管控体系,建立变更管理、需求管理、事件管理、问题处理的流程制度。规范化是要实现规范管理,我们在ERP运维中要形成三线支持运维体系,一线作为热线支持,解决基本问题,要求支持人员完全熟练掌握支持手册,能辨识问题类别,对于无法处理的问题和不能快速处理(比如5分钟内不能解决)的问题,要转给二线运维人员;二线责任是根据业务场景,定位问题,分析问题原因,直接解决问题,对于需要经过配置和开发等改变系统后才能解决的问题,要提交到三线支持;三线支持要按照项目管理的方法论和规范要求解决,特别是要经过严格的测试和发布流程,确保生产系统稳定运行。复杂的疑难问题、产品问题,提交产品厂商和专家解决。每一级需要规定内容范围、问题处理和级间交互衔接的规范化要求。标准化是指运维人员的日常操作,要有明确的操作动作标准,比如:不能同时打开系统的多个窗口,特殊情况下进入生产系统跟踪问题不能同时打开测试系统,离开座位时要关闭所有系统界面窗口,一人不能同时拥有多个单位的系统权限,顾问间权限不能互相提供,不能将密码泄露他人等。专业化是针对运维人员,要提升自身技术水平和业务能力,从专业化角度提供更高质量的服务。
建立安全责任体系,按照制度制定者、管理者、执行者、检查者分类管理各类人员,各负其责,协调配合,做好安全管理和落实。按照操作隐患、权限隐患、数据隐患、系统隐患四类分类建立和管理隐患源,定期检查,排除安全隐患,设定隐患整改办法。制订管理细则,形成安全管理责任体系,明确属地责任、监管责任,确定每类人员所负的安全职责。管理者主要负责安全管理和计划安排,组员要贯彻执行,另外设立检查组定期巡检,对于执行、检查中发现的问题要积极整改,同时要提交制度制定者,在实践中不断完善安全管理制度和预控体系。
三、安全第一原则
大家都知道安全第一,但为什么还是不时有安全事故发生?说到底是一落实在行动上,就忽视安全,或者不愿受约束,在信息化领域,特别是个别技术人员,认为技术水平高,自己为客户直接处理,比客户解决更快速便捷。以安全第一为原则,要落实在具体措施中,包括: 要处理好安全与效率的关系:平衡好运维工作中的安全与效率,不能为了一味追求效率忽视安全,比如不按照规范走个捷径,而一旦发生安全事故,那需要花费几倍乃至百倍的力量去处理,有时甚至是推翻重新做,反而是大大降低了效率。有些操作或问题,技术人员觉得很复杂,代替用户做比教他快多了,殊不知这样不仅违规,而且一次代替不能永远代替,以后每当遇到这类问题,都要反复,而如果教用户掌握了,以后使用就顺利了。
不论源头:严格按照安全规范和要求执行,无论问题产生的背景和原因是什么,更不能继续他人做过的不当处理方式。比如有些问题是实施阶段造成的或者实施过程是这么做的,如果有错就要改正,前面做的方式方法不对,要及时调整修正,避免影响扩大。
不计代价:如果发生安全事故,可能损失和代价难以估算,甚至不可弥补。要把安全当做头等大事来抓。
一票否决:一旦发生安全事故,就是大问题,造成的损失不可避免,再讲其他的辛苦、讲成绩都没有意义。把安全纳入考核体系。
不存侥幸心理:就像开车要遵守交通规则一样,系统运维也要遵守安全管理要求,照章办事,坚决杜绝习惯性违章。有的人觉得我多次这样做了,都没有出过事,不会有事、不会万一。但事故往往就是在不规范、违章操作中发生。信息系统发生的数据泄露事件,大多数都是因为不遵守安全规则导致的。
四、安全常态化
ERP运维安全管理要学习煤矿安全管理经验,采取常态化、闭环式管理方式,做好计划、执行、检查、整改,持续改进。一些煤矿生产单位安全检查每周或每旬一次,安监局每月一次安全夜查,对于ERP运维安全也要设置安全检查组,各业务支持组要设定专人进行安全管理,按照逐层上报方式,对安全工作有计划安排,层层把关。业务支持组每月检查,安全检查组定期抽查,每两个月一次巡查,对照隐患源清单逐项检查,特别是隐蔽性危险源隐患,确保无违规权限、违章操作。检查发现的问题,要限期整改,宣贯总结,使安全管理落实到位。
同时,要定期开展安全培训工作,组织安全经验讨论会,与业内先进单位交流,做好阶段性安全总结,不断提升安全管理意识和水平。要把这些工作常态化,不能一抓就紧,不抓就放。
总之,“安全第一,预防为主”是信息安全的基本方针。随着IT技术和应用的快速发展,随着信息化应用系统的普及,信息安全的重要性日益突显,过去对于信息化系统工作重建设轻运维,现在越来越多的企业和单位认识到了运维的重要性,特别是应用系统运维中的信息安全和数据安全,更是摆在重要位置。对于ERP这样的大型应用系统,其中的数据集中体现了企业的核心业务、经营指标和管理诉求,因此,ERP系统的安全管理尤为重要,需要我们信息系统的维护人员,树立“安全第一”的安全观念和“预防为主”的管理思想,建立系统化、科学化的安全管理体系和规范,把安全工作纳入到日常运维工作中,常抓不懈,持续改进,保障ERP等信息化应用系统的安全、稳定运行,支撑和助力企业不断发展和提升。
第二篇:ERP系统运维管理制度
ERP系统运行维护管理制度
为了规范工作流程、明确责任、保证ERP系统的顺利运行,特拟定以下系统运行管理制度,要求各单位操作人员和系统管理人员自觉遵守。
一、系统管理员配置
总部安排一名系统管理员,对系统运行全权负责;斜胶胎和子午胎分厂分别指定一名熟悉业务,具备一定计算机应用基础、接受能力强的人员为本单位的系统管理员,负责本核算单位下属所有账套的设置工作。
二、管理员职责
1.核算单位财务负责人
规范本单位的业务,制止不规范业务的发生。
负责本单位反结账的处理,此操作只能由负责人或本单位管理员进行。根据本核算单位的需求,组织相关人员编制非公司下发的报表格式和公式。1_ 2_ 3_
2.核算单位普通操作人员(各岗位)
1_
2_
3_ 严格按照有关规定进行操作、不越权操作、不做违规业务。保证自己的密码不泄密(所有财务人员都应遵守),定期更换密码。依照及时性和准确性原则,当天发生的经济事项当天录入单据,需要审核的单据录入后必须进行审核。
4_
5_
6_
7_
8_ 及时核对自己所属业务的单据、列表和报表,确保业务的正确性。不允许库存数为负数,不允许零出库。在公司规定的时间内将正确的报表传送到上级单位。每月按时打印相关帐表。需要协调其他部门修改或者更改某些业务,首先和其他部门沟通完毕,由有权限的操作人员进行相关修改。
三、基础数据维护制度
1、存货和物料清单资料的维护制度
1)在开发进入正常生产阶段,开发部门要及时将所开发的产品的清单输入计
算机系统中,其中包括:所有自制和外购件的存货编码、名称及物料清单等相关信息;
2)如果各个部门在运行过程中,发现未存在的料品代码,需要进行增加料品代
号的,要填写《存货编码增加申请表》,把表格及时传递给开发部门的存货及清单负责人,进行存货及相关信息的增加;
2、供应商和客户资料的维护制度
为了使公司的供应商和客户的资料在系统中保持一致,要求所有的供应商资料有采购部门进行维护,客户的资料应由市场部的应收会计负责进行添加。
3、生产制造业务处理方面的基础数据的维护制度
其他的涉及生产制造系统的资料由系统管理员和财务管理人员进行负责进行维护,前提是在经过公司的授权(指所有的添加数据应该由公司的书面认可)后进行输入。
4、财务方面的资料维护制度
涉及财务方面的基础资料和需要进行输入U8-ERP的基础资料,由财务部门的人员进行输入,输入要经过本部门的领导批准授权后进行。
四、客户端配置要求
客户端操作系统用WINXP,256M内存以上。
办公软件要求统一使用office2000或者更高版本。
防杀毒软件统一应用:Norton 软件或者瑞星等其他知名品牌杀毒软件。。。
不允许安装以下与工作无关的软件、不允许安装使用盗版软件:
。。
五、用户权限分配和变更
由业务部门相关系统操作人员提出申请,报送业务部门主管,主管同意签字,然后报财务处处长处审核,然后由系统管理人员进行添加。见《用户权限分配变更申请单》。
六、系统安全管理制度:
建立系统维护制度,在计算机人员和系统管理员进行ERP的维护工作,并及时做好数据备份和维护工作,要求每天做一个数据库备份。并对系统的运行状况进行监控。
。。
七、账套设置制度
1、总公司统一制定的账套设置
以下内容属于全局性的设置,斜胶胎分厂和子午胎分厂必须遵守总部统一制定的编码体系,不允许私自修改、增加内容和结构。需要增加和修改内容时,由总公司统一制定并发布。
1)
2)
3)
4)
5)
6)
7)
8)
9)基础科目; 项目分类及编号; 部门的一级编码; 人员档案; 存货大类; 存货档案 仓库档案; 收发类别; 工作中心;
2、需要上报批准的账套设置
以下账套设置可以根据本单位实际情况自行设置,但必须上报,经过总公司系统管理员认可后才能进行设置:
2)
3)
4)
5)
6)
7)
8)总账参数设置; 应收应付参数设置; 固定资产参数设置; 采购管理参数设置; 销售管理参数设置; 库存管理参数设置; 存货核算参数设置; 生产制造参数设置;
3、账套设置责任人
账套设置采取系统管理员负责制,各核算单位的系统管理员是唯一负责账套设置和调整的责任人,承担设置的所有责任。
4、系统管理员的权限
斜胶胎分厂和子午胎分厂系统管理员在本单位账套拥有以下账套设置权限:可以对相关数据权限进行设置。
1)
2)
3)
4)
5)
6)
7)基本信息设置中的客户供应商分类及目录; 基础信息设置中的系统人员表; 总账模块中的参数设置、会计科目、凭证类别、汇率设置、科目调整; 应收管理中的参数设置、单据类型设置、格式设置、控制科目设置; 应付管理中的参数设置、单据类型设置、格式设置、控制科目设置; 项目类别定义和项目内容定义; 固定资产的基础信息、系统基本设置和卡片样式定义;
9)成本管理中的参数设置、基础档案的设置; 采购模块中参数设置、单据类型、格式设置、自定义项目设置,单据编码
设置;
10)销售模块中参数设置、单据类型、格式设置、自定义项目设置,单据编码
设置;
11)库存模块中参数设置、单据类型、格式设置、自定义项目设置,单据编码
设置;
12)存货核算模块中参数设置、单据类型、格式设置、自定义项目设置,单据
编码设置;
13)
14)
15)物料清单模块的单据、格式设置; 生产订单模块的单据、格式设置; 质量和设备相关模块的单据、格式设置;
八、记账结账控制制度
总部对两个分厂的记账和结账进行控制,对各单位的“取消结账”参数全部置为“否”,“取消结账”参数全部置为“是”;同时各单位在本账套的总账系统参数中设置“上月结账本月记账”为“是”。
记账和结账功能完全由总部财务处和系统管理人员进行操作控制,如果分厂有需要恢复结账前状态,需要提交申请到总部财务处和系统管理人员,财务处经过了解相关原因后,由系统管理员对模块进行取消结账操作。等待分厂处理完毕后,通报财务处,财务处在进行记账和结账。
第三篇:运维管理系统建设
ITIL提升中国电信运维管理系统建设
ZDNet CIO频道 更新时间:2008-01-25 作者: 来源:CSDN 本文关键词: 中国电信 ITIL 运维管理
运维管理是电信运营商主要的生产和管理活动之一。运维管理系统建设和运营的好坏直接影响到电信运营的整体成本、管理水平和服务水平。因此,近两年来,各大电信运营商纷纷对现有的运维系统进行改造。
中国在电信领域的增长速度超过了其GDP增长的速度。正是电信快速的增长,推动了运维系统的发展。如何更有效地利用现有的资源,提高运营维护的工作效率,提高整体服务质量是目前各大运营商面临的普遍问题。毫无疑问,中国电信在运营维护方面,也面临相同的问题。建设新一代中国电信运维管理系统,成为解决目前运维管理问题的唯一方案。
根据我们长期在电信领域的实践,下面的几点经验,值得我们在中国电信运维系统的建设中更加关注。
一、采用ITIL作为运维系统的方法论
IT基础架构库(ITIL-ITInfrastructureLibrary),被誉为IT服务管理的圣经,其中包含了总结国际大公司在IT服务管理中的经验并得到证明的IT服务计划和运营的最佳实践框架。
ITIL已经为《财富》500强的一些企业所采用,并取得了预期的效果。加特纳(Gartner)和国际数据集团(IDC)等世界权威研究机构的调查研究表明,企业通过在IT部门实施最佳服务管理实践,将因重复呼叫、不当的变更等引起的延误时间减少了79%,每年每个终端用户平均节约800美元的成本,同时每项新服务推出的时间也缩短一半。
要成为国际一流的企业,就要吸取国际一流企业的成功管理经验,借鉴其管理手段。因此,中国电信在运维管理系统的建设,也应确立ITIL在系统建设过程中的方法论地位,吸取ITIL中的成功经验。
作为众多国际大型企业成功实践的积累,ITIL使我们找到了解决运维流程规范的方式和方法。可是,如何更好地运用ITIL这一经典的方法论呢?我们认为应该注意两点:
1)ITIL是从实践中得来的精髓,不是僵化的教条,应该结合实际情况去运用ITIL,建立更加适合中国电信的流程规范,而不是照抄照搬。
2)由于ITIL理论博大精深,不可能在短期内在企业中全面实施。应该根据实际情况,选取实施重点,逐步实施,逐步完善。
在中国电信运维系统建设中,应该深入理解ITIL的核心理念,结合电信运维的现状,解决核心和关键问题,逐步实现对运维的科学管理。
二、ITIL理论与实际情况相结合,注重工作流程细节的设计和优化,是系统建设的关键
理顺工作流程、提高服务效率是新运维系统建设的主要内容之一。
在工作流程的制定过程中,容易陷入以下两个极端。
1.盲目照搬流程。作为方法论的ITIL,本身含有大量的成功实践框架。但是,正如前面所说的,ITIL是从实践中得来的精髓,不是僵化的教条,盲目照搬,只能使得工作流程不切合实际,并流于形式,对系统的贯彻和执行产生不好的影响。
2.完全遵照现有流程,实现其电子化。虽然这样更符合目前的工作习惯,可能容易为运维人员所接受,但是,仍然解决不了目前运维所存在的一些问题。例如,我们在项目实施中曾遇到“工单在部门之间的重派”的问题。在当前手工作业的工作模式中,各单位将不属于本单位处理范围的工单,或部门需要其他部门配合的工单,均提交给故障处理的负责人,由该负责人向其他单位进行转派和重派。这种处理方式,主要便于手工作业条件下负责人及时了解项目处理状况。在建立运维系统后,负责人可以通过运维系统随时了解到故障的处理状况,每次重派和转派之前,对负责人的回复变成了一种无效的工作,大大降低了事件的处理效率。如果仅仅将目前的手工作业电子化,那么故障处理的效率仍然没有得到有效的提高。
因此,将ITIL理论与实际情况相结合,注重工作流程细节的设计和优化,是系统建设的关键。
三、树立主动服务观念
在现行的运维工作中,我们经常遇到这样的情况:一方面是运维部门疲于应付各种突发事件,加班加点处理各种重复事件,工作繁重,身心疲惫;一方面是客户代表不断抱怨和投诉“技术人员服务水平太低”。二者不可调和的矛盾,是新运维系统要解决的重要问题。
传统的运维方式给人的印象是:故障发生前,维护人员似乎无所事事;故障发生后,则是手忙脚乱。这就是被动服务给人们留下的印象,运维人员是在被动地等待故障的发生。在新的运维系统中,我们必须改变原有的运维方式,变被动服务为主动服务。
在主动服务模式下,运维人员主动地监控系统的变化,对日常工作及故障处理完成后主动进行问题分析,对系统的变更风险进行评估。在新系统中,可以通过种种技术措施,使得运维工作从被动服务转移到主动服务,如:增加变更管理流程以防范变更风险。
在日常运维工作中,变更工作是在所难免的。例如,新的系统安全漏洞被公布,为了保证系统安全,就需要安全系统补丁,而这种变更给系统带来的风险则是难以估计的。例如在安装补丁后,有时会产生大量莫名其妙的问题。这么一个简单的例子已经可以说明,如果没有很好的风险防范手段,系统变更将给我们的日常运维工作带来大量的问题,后果往往是难以想象的。在新系统中,我们可增加变更管理流程。在变更管理流程中,变更方案需提交变更经理,由变更经理组织由专家组成的变更顾问委员会(CAB)对变更进行风险评估,在评估通过后才能够进入变更的实施过程。变更管理是防范变更风险的最好办法。
当然,主动服务是一种理念,在这种理念下,我们可以定义更多的流程,如问题管理流程,对系统中存在的隐患问题进行挖掘,防患于未然。总之,我们应该树立这样一个理念,在各流程的定义中进行运用,主动地提早发现系统存在的风险和隐患,减少突发事件的发生。
四、从平台到业务的全面管理
网络管理是运维系统的组成部分。对系统的监控也是运维的主要业务之一。以往网管系统实现了对平台的监控,可是在实际运维工作中,平台往往只有少数的几个系统管理员负责,大多数业务人员更多地是面对业务系统。对于业务的监控和管理,是业务人员更加关心的问题。因此,在网管系统中,应加入业务监控的内容。
需要注意的是,业务是建立在平台的基础之上的,而不是孤立存在的。因此,监控中,应强调业务监控与平台监控密不可分的联系,从业务的角度出发,建立平台与业务的关联关系。在故障发生时,应能够即时描述对业务的影响程度,能够描述故障的影响范围。
例如:采集源的某台交换机产生异常,除了可以看到交换机告警外,我们还应该能够在业务拓扑图中直观看到,采集系统受到影响,同时采集、预处理、分拣等相关业务也不同程度受到影响。其影响程度,能够通过不同的颜色直观地展示出来。
只有这样才能够更加直观而全面地反映系统的运行状态,反映业务的运行情况。能够帮助运维人员在故障发生时,快速修复关键部件,减少故障带来的损失。
五、建立科学的激励与监督机制
多年来,系统的使用和推广问题成为系统能否得到良好运用的一个重要问题。
假设:我们制定了变更管理流程,但是,变更管理没有被很好地执行,而只是流于形式,则风险的防范也只能是停留在理论上的空谈。
在运维系统建设过程中,建立了一整套科学的考核制度,以激励运维人员更有效地提高服务质量和服务水平,是至关重要的。
对运维人员的考核,并不能就管理论管理,应该从客户服务的角度出发,以客户满意为前提,进行考核。例如,根据每个部门的服务水平,制定了服务时限。假设,某个用户投诉,需要多个部门协同进行处理。在处理过程中,各部门互相推托,虽然工单在各部门的停留时间没有超过部门承诺的时限,而整体处理时间已经超过了运营商对该用户承诺的处理时间。为了杜绝这种现象的出现,我们应该从用户的角度出发,进行各部门处理时间的分段计算。计算结果将反映在每月故障处理情况的统计报告中,而这些报告直接与各部门、各单位的绩效考核挂钩。
通过这样的考核机制,形成对员工日常工作的科学评价,既调动了员工积极性,又提高了工作效率和服务质量。
第四篇:运维管理系统方案
运维管理系统方案
概述
伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要?
因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。
运维管理系统的功能:
故障发现与警报;
记录日常运维日志信息; 服务器故障统计;
服务器软硬件信息统计; 服务进程管理;
将数据信息存储到数据库,并使用图形方式直观的展示出来; 权限、密码管理; 将数据生成报表。运维管理系统的特点: 邮件和短信实时故障报警;
B/S结构,能够通过web对远程服务器下达指令;
监控服务器和被监控服务器之间通过python socket来发送信息; 统计日常故障处理,以便下次出现同样故障时能够更快的解决问题; 实现自动化管理和自动化监控; 安全管理服务器性能; 操作流程统计与管理。
第五篇:系统运维管理-IT基础设施运维管理规范
IT 基础设施运维管理规范 文件编号:运维-002-V1.0
目录
运维管理规范--------------4 1.目的------------------------4 2.适用范围------------------4 3.规范性引用及参考-----4 4.本文术语,定义和缩略语---------------------------5 5.基本要求------------------6
5.1运维管理原则-----6 5.2制度和流程管理6 5.5供应商管理--------7 5.6督促检查-----------7 6.运行维护------------------8
6.1日常操作及监控分析--------------------------8 6.2 数据与介质管理-8 6.3机房管理-----------9 6.4 网络管理----------9 6.5 弱电管理---------10 6.6桌面维护----------10 6.7服务器及系统变更----------------------------11
6.8 配置管理---------12 6.9 事件与问题管理 12 7.应急管理-----------------12
7.1应急准备----------12 7.2应急处置----------13
运维管理规范
1.目的
为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。
2.适用范围
本规范规定了运维管理工作的要求。
本规范适用于维信理财集团(中国)总部,包括全国各分部及门店。
3.规范性引用及参考
◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library)◆ IT 服务质量管理原则
◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求
◆ ISO 31000:2009 风险管理 原则和指南(Risk management--Principles and guidelines)
◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)
4.本文术语,定义和缩略语
1、IT: Information Technology 信息技术
2、DNS: Domain Name Service 域名服务
3、DHCP: Dynamic Host Configuration Protocol 动态主机配置协议
4、VPN: Virtual Private Network 虚拟专用网
5、OA: Office Automation 办公自动化系统
6、ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:
7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。
8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。
9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。
10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。
5.基本要求
5.1运维管理原则
公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。
计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。
5.2制度和流程管理
运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。
运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。
5.3 文档管理
对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。5.3.2 对文档的版本应当进行控制。
文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。
5.4设备和软件管理
建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。
规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。
对外送设备的维修进行严格管理,防止数据泄露。
对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。
5.5供应商管理
对供应商支持运维服务的相关活动进行统一管理。
在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。
应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:
a)明确外包公司应当承担的责任及追究方式;
b)明确界定外包人员的工作职责、活动范围、操作权限; c)对外包人员工作情况进行监督和检查,并留存相应记录; d)对驻场外包人员的入场和离场进行管理; e)定期评估外包的服务质量; f)制定外包服务意外终止的应急措施。
5.6督促检查
定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。
指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。
6.运行维护
6.1日常操作及监控分析
未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。
电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT,非专业管理人员不得擅自拆开机箱或调换设备配件。
计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。
运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。
主要监控指标具体如下:
a)机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;
b)网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络
延时、丢包率等;
c)主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;
d)存储:设备运行状态、数据交换延时、存储电池状态等;
e)安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;
6.2 数据与介质管理
配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。
对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。
6.3机房管理
对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。
应指定机房管理负责人。确保机房环境整洁和安全,包括:
a)应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;
b)应保持机房环境卫生,设备摆放合理,归类; c)不得随意出入机房。
d)未经审批不得接入其它用电设备。
6.4 网络管理
确保网络、系统的正常运行。网络管理应包括: a)绘制网络拓扑图,并保持更新;
b)应保持网络设备的可用性,及时维修、更换故障设备; c)应负责网络系统的参数配置、调优; d)应定期对系统容量进行检查和评估;
e)应定期检查网络设备的用户、口令及权限设置的正确性;
f)应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g)应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计
算机网络跳线应整齐干净,跳线标识清晰;
h)应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。
权限管理应包括如下要求:
a)权限分配应履行审批手续,权限设置后应复核; b)应按照最小安全访问原则分配用户权限; c)应在用户账户变化时,同时变更或撤销其权限; d)应定期检查权限设置的有效性。
6.5 弱电管理
严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。
6.6桌面维护
日常数据注意事项:
a.个人文件(Excel、Word、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。
b.工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。
c.未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。
重装系统前注意事项:
a.询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b.用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。
关于账号、权限、密码
a.必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。b.禁止私自把个人管理员权限借给他人或告知他人。
c.禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。
d.更改任何类型用户权限时需得到相关审批层级确认才可执行。e.如电脑无特殊应用需求,则一律为“user”普通权限。
f.人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。
g.妥善保管自己所知的密码。
6.7服务器及系统变更
不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。
使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。
管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。
任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。
严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。
除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。
6.8 配置管理
明确配置管理负责人。
建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。
定期对配置进行备份及文档库归类。
及时检查并定期审计,对发现的不一致情况及时纠正修改。
6.9 事件与问题管理
对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。
对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。
7.应急管理
7.1应急准备
明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。
网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密
切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。
应急准备应符合如下要求:
a)系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;
b)在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包
括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;
c)应建立有效的应急通讯联络系统,确保信息畅通;
7.2应急处置
在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。
暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。