第一篇:运维规范
运维规范
一、关于网络的管理、维护、响应、制度为保证企业内网的正常运行及时发现、处理故障、现制定如下制度:
1、故障登记制度、运维人员对测试开发人员反映的问题应进行登记并根据现象能进行初步判断问题所在,及时进行解决。
2、故障响应与反馈制度运维人员在接到维护通知后,应在第一时间及时进行维护,同时填写维修反馈单对于网络问题及时通知运维中心。
3、网络监控制度,运维人员应对网络的运行状况进行实时监控及时发现网络中出现的问题及时维护并记录。
4、紧急响应与通报制度,对于因病毒或其他原因造成的网络重大故障,网络维护人员和运维人员应及时通报并与其他部门合作查找原因力争尽快解决问题,并由形成处理过程的报告。
二、服务器管理制度,为保证服务器安全、稳定的运行现制定如下制度:
1、服务器监控制度,服务器管理员应经常性地监控服务器的运行状况,如发现异 常情况应及时与运维人员联系,并作详细记录。
2、重要数据备份制度,对于电子邮件服务器中的用户信息,网站服务器中的域名信息,ftp服务器或文件共享服务器中的重要文件应进行及时备份,邮件系统的信息应天天更新备份,每周一次完全备份,备份信息应至少保存一个月。域名信息每次有更新后进行备份,ftp服务器或文件共享服务器内容根据重要性的不同进行形式的备份。
3、定期系统升级制度对于服务器linux操作系统的服务器应每周做一次漏洞检测,如遇到安全问题应立即升级内核版本。
三、宽带线路维护制度,为保障线路高质量的畅通,现制定如下制度:
1、由网络部中心负责管理,管理人员严格执行运维中心制定的《机房管理制度》由运维中心对公司网络出口实行统一管理公司内凡提供上网的计算机或外来客人需要接入公司网络的统一由运维中心负责管理。
2、各部门负责人有责任监督本部门安全使用网络运维中心确定上网技术规范对新员工提供上网指导培训不允许私自接入公司网络。
3、对于托管IDC机房的服务器服务器管理员经常性的监控服务器的运行情况定期与托管商联系如发生线路故障应及时与托管商沟通,力求最短时间内清除故障。如遇重大线路故障应严格按照和托管商签订的协议办事。
四、针对运维人员具体操作流程的规范:
1、终端使用规范
为了保证运维工作的严谨性和安全性,运维人员必须养成以下几个良好的习惯:
1>无论何时、何事、何种原因,离开座位必须锁定屏幕,保证你电脑的安全。如:Windows用Windows+L快捷键,Linux用Ctrl+D。
2>电脑必须安装杀毒软件和木马防火墙,可以使用公司购买的卡巴斯基杀毒软件。
2、服务器登陆规范 1>目前统一使用Xshell和XFTP管理服务器,请勿使用其他破解版本。
2>必须以普通用户身份登录并且在登录后切换到管理员身份。
3、服务器管理规范
1>在服务器上不允许直接使用rm命令,遇到确实不用的文件请使用mv filename/tmp的方式,将文件放入/tmp目录下,由系统自动删除。
2>对于没有经过验证的命令决不允许在服务器上运行,必须完全理解该命令执行后的结果方可执行。执行命令时必须确定当前的工作目录。
3>修改配置文件必须备份,如cp filename filename.20160602bak,然后进行修改。必要的时候要与开发协调,并写申请上报领导审批方可修改。
4、日志记录
运维日志是运维工程师每天必须进行登记的内容之一,由时间、日常工作、监控故障、响应故障、未完成工作、注意事项等项目组成,用来将每天的主要工作和处理的问题进行详细登记,便于总结工作和以后的查询。
5、测试评估
1>内部服务器测试,配个开发评估其功能是否可以达到要求
2>申请测试服务器,进行在线测试,并整理详细安装部署和管理文档 3>在线运行的服务器,加入监控平台进行统计监控
第二篇:IT运维巡检规范V0.01
IT运维项目组巡检规范
第一章 总 则
第一条 为规范信息运维项目组人员在值班期间对于应用系统、工业电视、机房环境、工业电视上传系统、等各大运行设备状态的监管和巡视工作,保证系统安全运行,特制定本规范。第二条 本细则适用于IT运维项目组全体员工。
第二章 巡检方式
第三条 定时巡检,是指值班人员按规定的时间对运维管理范围内的各大应用系统、工业电视、机房环境、服务器、软件平台进行现场检查。
第四条 不定时巡检:是指根据应用系统存在的问题,在原规定的时间外相应增加的现场检查。
第五条 特殊情况巡检:是指运维管理范围内的各大应用系统有程序更新、业务变更、升级、业务切换以及其它特别需要时,对运维管理范围内设备进行的现场检查。
第六条 无论任何专业凡是要涉及到更新、变更、改造、切换等问题时,均需要及时电话通知专业负责人、项目经理及信息主管。第七条 并根据巡检结果填报相应巡检记录表,任何人在进入机房等运维负责范围区域均需要填写出入登记表,如实填写到访目的,同时各专业均要做好各自设备操作记录。
第三章 巡检周期
第八条 巡检周期指两次巡检之间的时间间隔,运维值班人员应根据运维管理范围内各大应用系统的维护等级、复杂程度、系统本身运行情况、人员配备等要素来确定运维管理范围内具体应用系统的巡检周期。
第九条 按天巡检,各大应用系统、工业电视、视频上传、信息及SIS机房环境等。
第四章 巡检内容
第十条 应用系统巡检内容包含(不限于)以下内容:
(1)应用服务进程运行情况、进程连接数、服务的正常启停。(2)应用服务参数配置更新前是否备份,日常日志是否按时清理。
(3)应用服务系统文件、应用程序、数据的备份与清理。(4)灾备情况检查。
第十一条 应用服务器巡检内容包含(不限于)以下内容:CUP利用率、内存使用情况、硬盘存储使用情况、网络连接情况、操作系统版本。
第十二条 应用数据库巡检内容包含(不限于)以下内容:(1)检查各应用系统数据库实例、监听运行状态,数据库是否能正常连接,数据库进程数,会话锁状态,检查不可用索引。(2)检查表空间碎片及管理情况,检查表空间上表与索引情况,查看OS性能。
(3)生产应用系统数据库的变更、故障处理以及日常故障维护记录是否完整。
(4)生产应用系统数据库监控指标是否合理。
(5)生产应用系统数据库参数配置文件备份,数据库数据备份清理,数据库归档日志清理脚本运行情况,数据库其他日志备份与清理。
(6)生产应用系统数据库表空间的利用情况、数据库版本双机是否一致。(7)灾备情况检查。
第五章 巡检人员要求
第十三条 参与巡检人员组成由运维项目经理安排,工作日值班巡检为一人,节假日由二人组成,如遇特殊情况,根据需要随时增加值班人员,当现场除原定值班人外,又出现临时补充人员时,值班巡检工作依然由原定值班人员承担。
第十四条 巡检人员应按本规程的要求,按规定的巡检周期和巡检流程,对所负责的应用系统进行全面细致的检查,不遗漏项目,并对检查的准确性负责。第十五条 巡检人员在巡检过程中遇有疑问,不得随意操作,必须按本规程规定的巡检流程进行处理。
第六章 巡检结果检查与评价
第十六条 巡检人员须对巡检内容做记录,认真填写各项巡检记录表,对巡检时发现的问题如实填写,形成系统分析,如发现问题不能解决,需第一时间联系相关专业人员根据问题严重程度给予指导处理,同时巡检记录应装订,并存档。
第十七条 巡检计划及巡检项目应根据实际情况在每月月初由相应责任工程师负责制定,并严格按照巡检计划执行,如需更改则需进行上报审批,通过审批后方可执行。
第七章 附则
第十八条 本规程由信息运维制定并负责解释和修订。第十九条 本规程自颁布之日起执行。
第三篇:安医运维规范
安医附院运维管理制度
第一章总则
第一条、本制度的制定,为保证院所有系统安全稳定运行,系统操作规范,提高系统可靠性。根据我院网络及应用系统技术要求、技术体制、技术业务规程、法规、规定以及现行的管理体制,制定本运行维护基本管理制度
第二条、完善运行维护管理体系,建立健全运行维护规范,提高运行维护管理效率,使全院所有网络和信息服务系统指标始终保持在一个较好的水平。
第二章设备信息管理制度
1、目的
第三章机房管理制度
1、目的
为加强各机房的现场管理,对可能影响机房生产、安全的各种因素进行控制,确保设备安全正常运行,切实有效控制因人员操作不当导致的风险,有效地保障机房运行、信息安全。
2、组织结构和职责
2.1、组织机构
2.2、责任
3、机房管理基本要求
3.1、机房环境要求
机房应防尘,门窗要严密,做到地面清洁、设备无尘、排列正规、布线整齐、仪表正常、工具就位、资料齐全、设备有序、使用方便。
机房内的温度、湿度应符合维护技术指标要求,保持正常通风。
机房应建立防尘缓冲区,备有工作服和工作鞋。机房应有良好的防静电措施。
机房照明须有应急备用,各种照明设备应有专人负责,定期检修。
动力机房应设置警示牌和防护栅栏以指示高压区、检修区、禁止合闸区。
无人值守机房要全封闭,保持机房整洁无尘,应有良好的防火、防盗、防潮、防尘等措施以及相应的远端监测系统。
无人值守机房的周围环境要保持清洁和安全可靠,机房门前道路应保持畅通无阻。3.2机房制度要求
各中心机房必须统一规范上墙制度,并醒目挂置。交流配电机房应上墙悬挂配电图。
严格执行值班、交接班制度,明确职责,严格纪律,保证制度的进行。
严格执行安全生产的各项规定,严禁违章操作,确保网络、设备及人身安全。
严格执行消防安全制度和监督条例,增强机房人员的安全意识,消防设施经常检查,消除隐患。
严格执行保密法规,对机房人员进行保密教育,增强保密观念,定期进行保密检查,防止泄密失密。
不断健全完善机房各项规章制度,并组织贯彻实施。厂家在分公司机房进行设备安装调测,事先应向分公司相关部门提出申请,经批准后方可进行,并做好机房入门登记,分公司相关部门应安排专人配合厂家现场工作。
外单位人员工作性进入分公司机房须经分公司相关专业部门同意,安排专人陪同,做好机房入门登记,并佩带外来人员入室胸牌。
机房进行重大参观活动,须经院领导批准;上级领导参观视察机房时,应做好陪同工作。3.3、机房安全管理要求
切实遵守安全制度,认真执行安全操作规定,做好防火、防爆、防盗、防雷、防冻、防潮等工作,确保人身和设备的安全。
在维护、测试、磁带更换、装载、故障处理、日常操作以及工程施工等工作中,应采取预防措施,防止造成工伤和通信事故。凡进行危险性较大、操作复杂的工作时,必须事先拟定技术安全措施。
各类机房应有可靠避雷装置,配备合适消防器材,安装烟雾告警、高温告警、防盗告警等设备,并制定紧急处理预案。
各机房应具备在紧急情况下能与上级部门及时取得联系的手段。机房内有紧急故障处理流程图,人工再启动和再装入流程图,联系人、联系电话等,且相关资料齐全,每个机房维护人员都能理解、执行。
雷雨季节要加强对机房内保安设备、地线及防护电路检查。加强网络安全管理,确保网络信息不受侵犯,保密信息不被泄露,网络信息不丢失,网络信息正常传递。
生产核心网络以及与外部因特网存在接口的网络,应特别加强网络安全管理,提高防范措施。
各种涉及密级的图纸、资料、文件等应严格管理,认真履行使用登记手续。
加强机房现场钥匙的管理,保证钥匙齐全和完好,由机房值班人员及保安进行分管,并作为交接班的一项内容。
机房设备管理要求
各专业机房应建立包机责任制,也就是全部现用与备用设备均应按所划分的设备维护段,落实到特定的人,维护要做到定人、定设备,责任段落要清晰。机房内的设备,如果属于其他部门来维护,应由本部门去负责落实并明确其他部门对该设备的维护责任人。本机房内新增设备(无论该设备是由本部门维护,还是需要其他部门来维护),如果本部门没有去负责落实并明确责任人,则视该设备由本部门负责维护。
设备机架、电缆标识应齐全准确,电缆、光缆、尾纤等应布放合理。各种设备要按照有关规定建立帐卡、说明书及相应图纸资料等档案。
无论现用、备用设备,应保证备件、技术档案、原始资料完整,不得任意更改设备的电路、结构或拆用部件,备用设备应保持原机的正常状态,定期使用。
新建、扩容的设备或电路,须按相关规定经试运行后进行验收,验收合格方可正式投入运行。
运行网络设备断电、移动、搬迁应有记录。系统搬迁,应事先制定详细的实施方案,并报省级分公司批准。3.3、机房日常维护要求
对设备要精心管理,精心维护,精心使用。做到维护有标准,操作有规程,质量有保证。
按照维护规程和维护作业计划的要求,定期地、有计划地开展维护工作,对设备的运行情况、应具备的各种功能、系统重要数据的正确完整情况以及设备硬件的完好情况等进行检查和测试。
对随机或突发性的设备故障、严重的告警等异常情况,应按照应急处理流程尽快恢复设备的正常工作。
机房工程施工要求
机房机架设置应保持合理的间距,避免不必要的空间浪费。根据公司相关规定,采用合理的走线方式,合理地铺设机房静电地板。机房工程施工,必须在显著位置悬挂醒目的工作提示牌。机房工程施工工具严禁使用运行网络的供电电源。加强对机房工程施工的监护,设专人负责,杜绝人为事故的发生。
加强对机房工程现场的控制,工程材料等杂物严禁堆放在消防通道。
工程施工队进机房施工,应事先书面通知相关部门,写明施工单位、施工内容、时间、地点、工期、进场人数、施工小组负责人等基本情况,以书面形式向运行维护部提出申请,内容包括施工相关情况说明、本工程期间专业部门现场监督人(协调人)名单。经运行维护部审核同意后,工程施工队方可进场施工。施工期间,工程施工队必须每日清理现场;施工结束,工程施工队必须按规定清理工程余料。工程结束后,相关专业部门应及时书面通知运行维护部,并写出工程小结通报。
附则
本制度自发布之日起实施,请部门严格按照本制度规定执行。本制度在执行过程中,将进一步修改和完善。
各部门可根据各自实际情况,在本制度基础上制定相应实施细则,并向同级运行监督部报备。
对于特殊情况,各单位要详细说明并上报审批。
第四章保密制度
1、目的
硬件设备管理制度
1、目的
请示报告制度
1、目的
加强部门信息处理和反馈管理,有效地控制网络、系统和设备的运行状态,通过规范请示报告流程,统一指挥调度,提高网络运行维护的管理效率。
维护计划管理制度
质量分析例会制度
故障管理制度
应急管理制度
巡检制度
监控制度
设备管理制度
维护资料管理制度
设备验收管理制度
1、资产管理
现有设备统计,新入设备登记流转,故障设备回收
2、变更管理
3、机房管理
4、事件处理管理
5、应用服务管理
6、服务器储存管理
7、设备巡检
8、监控
9、
第四篇:运维工程师工作规范
智慧和平指挥大厅运维工程师工作规范
1.机房巡检:工程师每天到达“智慧和平”现场,先去大屏幕后方机房检查机房温度是否过高,空调是否正常开启,检查机柜里各设备是否正常运行,开启大屏幕检查大屏幕是否显示正常。如有迎检接待任务需长时间开启大屏幕时要不定时间去机房观察机房温度,空调是否正常运行,以保证大屏幕正常运行,如有异常立即向接口人反应情况并记录在巡检表上。开启“智慧和平”前端演示用电脑,逐一检查电脑是否可以正常使用,各功能模块系统是否可以正常登陆,开启音响功放检查音响、麦克风、视频会议终端是否正常,反应给接口人并记录在巡检表上。
2.智能探头点检:每周登陆智能监控系统查看所有智能探头是否正常显示,探头位置是否移动,恢复移动过探头到预置位,不能正常显示的记录在点检表上,并交由接口人联系维保商尽快维修。
3.每天下班前询问接口人第二天是否有接待任务,问清楚具体时间,具体部门,制定合适的演示方案,如有接待任务,提前准备好演示方案,并根据现场情况适当调整方案。4.如有接待任务,工程师和讲解员需着正装,领导到达参观现场工程师需起立站好,等领导全部入席后方可坐下,根据现场接口人要求做好功能演示,参观结束后工程师应起立并
站到大厅边上,待领导全部退席后方可继续其他工作。5.现场主管记录每天工作内容并形成工作日志,每周五总结本周的重点工作和完成情况。制定下一周的工作计划并形成工作周报交由接口人存档。
第五篇:QONE使用规范-运维项目
项目立项
新建运维项目,首先在系统管理选择项目设置(此工作由总体部人员完成。)项目特征类型选择“运行维护项目”如下图: 项目初始化
2.1 项目基本信息
由项目经理初始化项目,选择项目管理->项目基本信息->项目特征信息,进行项目信息页面,其中带*号的都为必填项,项目成员和项目QA和项目MA要如实填写,其它信息均可随意填写。如下图所示:
2.2 过程定义
选择项目管理->项目基本信息->项目过程定义,进入项目过程定义页面,选择自定义,点击提交。如下图所示:
选择设置项目报告点,任务报告周期设置为“每×天报告一次”,其中的天数设置应大于项目工期(即在项目周期内不需要填写任务报告),点击提交。如下图所示: 项目计划制定
3.1 任务设置
选择项目管理->项目计划->甘特图,选择左侧项目名称点击右键,选择添加任务,如下图所示:
共添加四种任务,四种任务名称为:
1、二线支持
2、应用维护
3、修改BUG
4、问题报告
前三种任务属性中的任务类型设置为返工活动,并且选择设为阶段。点击确定即可。
第四种任务属性中的任务类型设置为测试,并且不选择设为阶段。点击确定即可。如下图所示:
任务属性设置完成后,为问题报告任务添加质量计划,选择修改报告,填写报告名称为:××部门运维问题报告,测试项目选择本项目。如下图所示:
3.2 模块划分 选择项目管理->项目计划->项目模块划分,添加本部门所有运维项目。包括编号、名称、模块负责人(即项目负责人)。问题记录及处理
4.1 提交问题
由负责运维项目的人员提交本项目的所有问题。选择项目管理->我的任务->任务列表,点击进入选择“2010年开发一部运维问题报告”,的“提交质量记录”,如下图所示:
点击新增BUG,如下图所示:
填写BUG信息,其中带*号的必须填写。
标题为问题的概要描述,模块为自己所负责的运维项目,解决人一定要填写自己,BUG类别选择一个合适的选项,严重程度任选,优先级任选,引入阶段选择一种,检出阶段与引入阶段相同,BUG描述为详细说明,填写完毕后,点击确定即可。
4.2 确认问题
提交完成后页面回到BUG列表,选择全选,点击确认,如下图所示:
4.3 BUG跟踪-开发人员视图:解决BUG 选择项目管理->我的任务->BUG跟踪,点击ID下面的编号,如下图所示:
选择解决BUG,填写解决方案,解决用时,解决说明,点击提交即可。如下图所示:
4.4 BUG跟踪-测试人员视图:关闭BUG 进入测试人员视图,选择ID下面的编号,如下图所示:
点击关闭BUG,如下图所示:
无需填写说明,直接点击提交即可。如下图所示:
问题查询、统计
项目经理或高级经理可以在质量数据中查询BUG和统计情况,如下图所示: