详解Linux运维工程师必备技能(五篇模版)

时间:2019-05-12 16:44:35下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《详解Linux运维工程师必备技能》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《详解Linux运维工程师必备技能》。

第一篇:详解Linux运维工程师必备技能

详解Linux运维工程师必备技能

2013-12-18 10:56 cs312779641 51CTO技术论坛 字号:T |

T

本人是Linux运维工程师,对这方面有点心得,现在我说说要掌握哪方面的工具吧。说到工具,在行外可以说是技能,在行内我们一般称为工具,就是运维必须要掌握的工具。我就大概列出这几方面,这样入门就基本没问题了。

AD:

本人是Linux运维工程师,对这方面有点心得,现在我说说要掌握哪方面的工具吧。说到工具,在行外可以说是技能,在行内我们一般称为工具,就是运维必须要掌握的工具。

我就大概列出这几方面,这样入门就基本没问题了。

Linux系统如果是学习可以选用Redhat或CentOS,特别是CentOS在企业中用得最多,当然还会有其它版本的,但学习者还是以这2个版本学习就行,因为这两个版本都是兄弟,没区别的,有空可以再研究一下SUSE,有些公司也喜欢用,例如我公司。。

工具如下:

1、Linux系统基础

这个不用说了,是基础中的基础,连这个都不会就别干了,参考书籍,可以看鸟哥linux基础篇,至少要掌握这书60%内容,没必须全部掌握,但基本命令总得会吧。

2、网络服务

服务有很多种,每间公司都会用到不同的,但基础的服务肯定要掌握,如FTP, DNS,SAMBA, 邮件, 这几个大概学一下就行,LAMP和LNMP是必须要熟练,我所指的不是光光会搭建,而是要很熟悉里面的相当配置才行,因为公司最关键的绝对是WEB服务器,所以nginx和apache要熟悉,特别是nginx一定要很熟悉才行,至少有些公司还会用tomcat,这个也最好学一下。其实网络服务方面不用太担心,一般公司的环境都已经搭建好,就算有新服务器或让你整改,公司会有相应的文档让你参照来弄,不会让你乱来的,但至少相关的配置一定要学熟,而且肯定是编译安装多,那些模块要熟悉一下他的作用,特别是PHP那些模块。

这上面2点只是基础,也是必要条件,不能说是工具,以下才是真正的要掌握的工具。

3、shell脚本和另一个脚本语言 shell是运维人员必须具备的,不懂这个连入职都不行,至少也要写出一些系统管理脚本,最简单也得写个监控CPU,内存比率的脚本吧,这是最最最基本了,别以为会写那些猜数字和计算什么数的,这些没什么作用,只作学习意义,写系统脚本才是最有意义,而另一个脚本语言是可选的,一般是3P,即python, perl和php,php就不需要考虑了,除非你要做开发,我个人建议学python会比较好,难实现自动化运维,perl是文本处理很强大,反正这两个学一个就行了。

4、sed和awk工具

必须要掌握,在掌握这两个工具同时,还要掌握正则表达式,这个就痛苦了,正则是最难学的表达式,但结合到sed和awk中会很强大,在处理文本内容和过滤WEB内容时十分有用,不过在学shell的同时一般会经常结合用到的,所以学第3点就会顺便学第4点。

5、文本处理命令

sort, tr, cut, paste, uniq, tee等,必学,也是结合第3点时一并学习的。

6、数据库

首选mysql,别问我为什么不学sqlserver和oracle,因为Linux用得最多绝对是mysql,增删改查必学,特别要学熟查,其它方面可能不太需要,因为运维人员使用最多还是查,哪些优化和开发语句不会让你弄的。

7、防火墙

不学不行,防火墙也算是个难点,说难不难,说易不易,最重要弄懂规则,如果学过CCNA的朋友可能会比较好学,因为iptables也有NAT表,原理是一样的,而FILTER表用得最多,反正不学就肯定不合格。

8、监控工具

十分十分重要,我个人建议,最好学这3个,cacti,nagios,zabbix,企业用得最多应该是nagios 和 zabbix,反正都学吧,但nagios会有点难,因为会涉及到用脚本写自动监控,那个地方很难。

9、集群和热备

这个很重要,肯定要懂的,但到了公司就不会让你去弄,因为新手基本不让你碰,集群工具有很多,最好学是LVS,这是必学,最好也学学nginx集群,反向代理,还有热备,这个就更多工具能实现了,像我公司是自己开发热备工具的,mysql热备也要学,就是主从复制,这个别告诉我容易,其实不容易的,要学懂整个流程一点也不容易,只照着做根本没意思。

10、数据备份

不学不行,工具有很多,但至少要把RAID的原理弄懂,特别是企业最常用的1+0或0+1,自己做实验也要弄出来,备份工具有很多,如tar, dump, rsync等,最好多了解一下。

算了,说到这10点已经够你受了,应该可以入门了,因为有些技术会比较难学,例如apache和nginx中还有些很重要的技术,如系统调优和服务优化,还有程序优化,这些在没接触工作前很难学习到的,所以先把这10点学了吧,估计要学熟至少3个月不止,就脚本那部分已经让你很吃力了,我建议是先学熟shell,等工作后再学另一门脚本语言,这样会比较好。

以上就是踏入Linux运维工程师需要掌握的工具,其实还有很多工具要掌握的,但你在学习环境中是很难学到,最后我再提醒一下,这里所指的工具相当于技能,而不是像windows或ubuntu那些图形化工具,那些工具没用的,还有,学Linux就别装图形界面,这样虚拟机就不用吃太多内存,而且绝对不建议在真机上装Linux,根本达不到学习效果。

第二篇:系统运维工程师

系统运维工程师

系统运维工程师年终个人工作总结及下年工作计划

时间一晃而过,弹指之间,2010年悄然而至,自从2010年3月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司网络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯定。经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:

一、公司电脑日常维护工作

刚一开始接手工作的时候,发现公司大部分工作电脑都没有安装安全防护软件和升级系统补丁;员工随意安装系统及应用软件,致使公司局域网内病毒隐患严重、工作不稳定和系统崩溃,工作秩序被打乱,员工不严格要求自己,上班时间聊QQ、玩农场、看娱乐网站等;为此公司和个人工作经常受到影响,工作效率降低。针对这种情况,我采取了以下措施:

1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。

2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障影响整个局域网内的其它工作,使故障扩大化,并延长了解决问题的周期。

3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。

4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还

原。

5、对于网络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司网络办公环境。

经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。

二、网络的日常维护

路由器及交换机的维护管理,确保公司网络运行正常,员工正常利用网络资源。加强路由器的规则设置,优化外网接口,内部员工合理地分配带宽流量,使公司的网络能稳定有效地工作。

三、公司网络制度管理和完善

公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资产流失。

四、公司服务器平台管理与维护工作

公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本我司服务器相应出现几次重大故障,分别如下:

1、网络故障七次,重大一次,因服务器遭DDOS攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、网络升级、电信与联通DNS解析故障影响到我司服务器平台网络连接不正常。

2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。

3、其它故障共计5次,因联通网关溢出,无法与我司IVR服务器数据库网关同步,导致用户无法正常订购与使用我司亲情相伴业务。

经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。

4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。

5、公司针对员工的工作岗位与职位重新部署了FTP服务器的访问权限与互联网访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外网均可实现访问FTP服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进行了保密设置,从而大大提高了公司重要资料的完整性与保密性。总结本的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的网络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。

在新的一年里,将百尺竿头,更进一步,2011年的大致工作计划为:

1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如OA软件)。

2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。

3、解决企业网站制作等专业性知识问题,业余时间强化学习并能胜任网站管理工作。

4、进一步增强IT系统和网络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域网,使内、外网连接任意,在任何地方工作都能连接本公司服务器资源。

5、重新改建机房机柜网络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。

6、在资金允许的情况下对公司办公电脑、网络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。

7、学习更多的网络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。

2011年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务学习,不断提高自身综合素质,把新一年的工作做好,为公司更好的发展尽一份力!

扩展阅读:如何 成为系统运维工程师 要成为系统运维工程师,需要学习那些课程?Windows、Linux、网络和Oracle哪些知识点需要学习,武汉怎么参加培训?

[标签:工程师,linux,oracle] 听前辈说软件开发工程师,以及系统运维工程师,在考虑选择。大家帮忙说一下我该选什么?学习哪些内容?才毕业没什么工作经验,该如何准备?

系统运维要求什么都懂一点,主要是基于Linux、UNIX有前途,shell网络数据库都需要懂一些。越老越吃香知识不需要太多创造性的东西了解基本规律然后去部署排错以后转管理。

我们来看看系统运维都有一些什么要求深入了解Linux/Unix操作系统 深入了解分布式系统、计算机网络、硬件体系结构

精通Linux/Unix环境下脚本语言(Shell、Perl、PHP、JSP、Python)的编程熟练使用grep、awk、sed、vi等系统工具

可以学RHCE+CCNP+OCP RHCE是红帽Linux认证目前最普及的企业版LINUX发行版的认证学了通吃LINUX再学一下AIX就UNIX搞定;可以朝RHCA发展

CCNP基本是思科网络工程师比较成熟基础的技能培训认证,将来有钱了可以朝CCIE发展

OCPOracle数据库DBA认证专家也是成熟的基础认证,可以发展为OCM 这个课程可塑性很强延展性出去能满足绝大多数的工作需求至于日常的局域网维护硬件什么的就不说了

你是武汉的话你可以找授权培训官网都可以查 武汉誉天RHCE+CCNP+OCP 系统运维做的很多啊网络操作系统数据库网站运维《互联网运营智慧--高可用可扩展网站技术实战》本书深入浅出地介绍运维架构中的各个节点,从网络规划到服务器安装到负载均衡、分布式文件系统等架构规划,无一不囊括,包括:从简要说明选择开源技术作为运营环境开篇,到选定平台及工具的部署实施,以实例展示如何使用开源工具,来实现用户访问量在1000万这样的一个级别的站点功能。

运维工程师熟悉tcpip系列协议,熟练配置思科和华为网络能参考手册配置其他厂商设备包括安全设备

熟悉服务器硬件系统配置操作系统unixlinuxwindows等安装配置检测其运行等 熟悉常见的应用如webftp邮件等服务搭建及排查熟悉常见的系统安全设置,以及整个安全体系架构

会安装及配置维护常见数据库oraclemysqlsql-server等有一定的存储方面的知识。。。。

要熟悉你服务器的环境相关的东西特别是网络相关

熟悉服务器的硬件配置熟悉服务器上的操作系统及各种常见的应用系统熟悉发生故障的时候处理流程等

不强求你精通内核调优等但是你知识要全面而且有一两手是拿手的 主要想当linux运维,服务器管理方面 最佳答案

操作:下个虚拟机,装CentOS。

教材:《鸟哥的Linux私房菜基础学习篇》、《鸟哥的Linux私房菜服务器架设篇》第三版。这两本书深入浅出,原理讲得很透彻而易懂,不像很多书只讲皮毛或很枯燥。第三版是以CentOS为例的。

RedHat官方也有教材,但是一来你没有配套的系统练,二来它的原理方面不如上书讲得深。

CentOS和RedHatEnterprise的源代码是一样的,很多都兼容。学好CentOS再迁移到RHEL很容易。如果是小型企业,用CentOS就可以了。大型企业才有必要购买RHEL。

软硬并施!软件:主要是服务器操作系统和数据库系统

硬件:服务器硬件,数据存储硬件(如EMC、IBMSAS磁盘阵列,存储服务器)网络:Cisco网络设备,局域网,接入网,光纤通道存储网国家电网的工程师,责任重于泰山!

linux运维工程师主要干些什么?有什么要求?我们知道多少?对于linux你了解多少呢?linux运维工程师职责linux运维工程师招聘linux服务器

工作职责:

1、负责Linux操作系统的安装、配置,系统监控和维护,问题处理,软件升级。

2、负责Linux系统下的常用软件(如FTPServer、Apache、NginX、MySQL、ORACLE等)安装及日常维护。

3、负责Linux的系统维护、优化。

4、负责Linux系统的网络安全及数据日常备份。

5、会编写常用的SHELL脚本。

6、能独立完成新软件的安装和配置及工作文档

7、了解Web技术/Java语言开发,支持其他部门工作。

8、了解TCP/IP/UDP/DDNS协议,能在Linux配置包括网站服务器,以及DNS/DDNS,和DHCP服务器等。

职位要求:

1、具有2年以上Linux系统维护的经验,熟悉Linux/Unix常用服务的安装配置与使用

2、精通Linux系统原理,熟悉内核参数调谐,精通基于linux的常用服务配置,如mail/nginx/dns等,并能够快速部署;深入掌握apache、tomcat及weblogic配置及调优

3、熟悉Linux系统架构,管理以及优化。

4、熟练掌握LINUX网络安装、配置、日常管理、安全、备份、恢复、故障处理、日志分析等技能。

5、熟悉虚拟机技术,熟悉虚拟化架构下的系统维护、分布式管理、容错、备份等技术。

6、熟练掌握交换机,防火墙等常用网络设备的配置,熟悉TCP/IP协议

7、熟练相关应用服务器如web、email、ftp、http等

linux运维工程师主要干些什么?有什么要求?我们知道多少?对于linux你了解多少呢?linux运维工程师职责linux运维工程师招聘linux服务器

工作职责:

1、负责Linux操作系统的安装、配置,系统监控和维护,问题处理,软件升级。

2、负责Linux系统下的常用软件(如FTPServer、Apache、NginX、MySQL、ORACLE等)安装及日常维护。

3、负责Linux的系统维护、优化。

4、负责Linux系统的网络安全及数据日常备份。

5、会编写常用的SHELL脚本。

6、能独立完成新软件的安装和配置及工作文档

7、了解Web技术/Java语言开发,支持其他部门工作。

8、了解TCP/IP/UDP/DDNS协议,能在Linux配置包括网站服务器,以及DNS/DDNS,和DHCP服务器等。职位要求:

1、具有2年以上Linux系统维护的经验,熟悉Linux/Unix常用服务的安装配置与使用

2、精通Linux系统原理,熟悉内核参数调谐,精通基于linux的常用服务配置,如mail/nginx/dns等,并能够快速部署;深入掌握apache、tomcat及weblogic配置及调优

3、熟悉Linux系统架构,管理以及优化。

4、熟练掌握LINUX网络安装、配置、日常管理、安全、备份、恢复、故障处理、日志分析等技能。

5、熟悉虚拟机技术,熟悉虚拟化架构下的系统维护、分布式管理、容错、备份等技术。

6、熟练掌握交换机,防火墙等常用网络设备的配置,熟悉TCP/IP协议

7、熟练相关应用服务器如web、email、ftp、http等

第三篇:漫谈运维—运维工程师

《谈网站或其他服务器运维》,这里只谈运维工程师所要做的细节工作,让人们知道运维工程师到底都在做些什么,至于上级所要做的,只是提一下,不做参考。

以下是个人观点,我说的只是我自己的想法,也是我发展的目标。你可以有异议,我们是来交流的。你对的我肯定会向你学习。因为我也在摸索。运维工程师至少要能做以下的工作:

1,网络工程师的工作

你至少要能配置CISCO 6509以下的设备,熟悉各种网络协议,否则网络出问题的时候你会傻掉。

2,系统工程师的工作

你至少要理解各种系统服务,在出问题的情况下要迅速解决问题,而不是等系统工程师来解决。

3,安全工程师的工作

我不要求你一定要会各种网络编程,但是在服务器收攻击的情况下,没有防火墙的情况下,做一些简单的处理工作。

4,存储工程师的工作

至少要熟悉各个厂商的设备,各种备份和还原的办法

5,测试工程师的工作

在新版本上线之前,你至少要协同测试工程师做测试工作,因为你是运维人员,不了解程序架构导致无法解决故障,你也有一份责任。

6,研发人员的工作

运维工具都需要自已开发,熟悉开发语言,需要有过实际开发经验,否则工作会非常痛苦,我深有体会。

7,英语

不想说了,我的最大痛苦就在这里

8,好的沟通者 不出问题时候你可以打游戏睡觉,出问题的时候要能和项目人员沟通,快速解决问题,而不是推;我知道有很多人能推责任,你可以做替死鬼,但是离开这个工作你还能找到更好的;把责任推到别人身上的人,下次出问题的时候,绝对没人帮你。你要能和各个兄弟部门关系非常的密切,出了问题有兄弟帮你担责任;也要能非常扯皮,没事在会议上把别人都搞定。

9,库房管理员

数万台服务器让你来管理,任何丢失或者损坏都是不负责任和失职的表现。

10,运动员

不要回家就睡觉,有空还是运动下吧;在服务器down机的时候,机房恰巧就你一个人,机柜没有空间,你需要更换一台HP 585 4U的服务器,满配约80公斤的服务器,你怎么做?

11,责任心

这个我不想说什么,这是你的职业精神。

12,组织者

给你2个啥都不会的民工,再给你2000台服务器,要求你2天把服务器装完,你咋办?

13,1-7条中,你必须有一条非常精通,是这个行业的专家。否则过了32岁,没有公司要你。

大家看了肯定觉得这个人是神仙,但是这必须是你慢慢能做到的,至少是我6年来运维经验的一点总结。

因为现在的公司都在用招聘民工的钱招聘神仙,其次我也是想让各位看看,运维工程师要担负多少责任。

我去面试过的一些公司都说,你什么都会,什么都不精。我说对,正是需要我们这些什么都会的人领导什么都精的人。

我这句话没有贬低大牛的任何意思,只是当时一个临场的发挥。虽然说完就知道这个面试白来了,但是我还是想为广大的运维工程师出口气。

不怕千招会,就怕一招精。这仍旧是我给大家的建议。

最后给大家最后最大最重要的建议,做什么工作都可以,千万别做SA。我把SA的定义成:speediness answer而不是system admin。为什么?你可以想象一下哪些工作需要快速响应。网络工程师需要,机房网络骨干交换机故障,整个机房所有服务器无法连接,需要快速响应不?系统工程师需要,系统出问题了,要快速响应不?安全工程师需要,服务器被攻击了,要快速响应不?存储工程师需要,公司核心存储有问题了,要快速响应不?

你可以做研发,出了问题可以测试,可以想办法慢慢解决;你可以做DBA,出了问题可以推到网络工程师或者系统工程师身上,说不是DB连接问题;你可以做测试工程师,你说有问题这个东西就可以不上线„„在出问题的时候,倒霉的就是SA,所以不要再争论SA包含哪些工作,SA就是一个倒霉的快速响应者,你想,哪个SA 24小时不开手机?哪个SA 晚上可以舒服的睡觉或者安心的出去度假?走在路上一听到和自己手机短信铃声一样的,利马下意识的抓出自己的手机看看是不是服务器报警;晚上和老婆 XXOO00,一个电话过来,立马停下,抓出手机看流量图;包里放着笔记本,但是因为还要开机,太慢,拿着手机上putty ping或者telnet机器„„

这就是大家羡慕的SA,你也不要抱怨自己做了SA,生活就是这样。所以不要再争论哪些xxx员应该归属于SA,系统管理员或是运维工程师,如果想做这行,就安生的当一个“快速响应者”,这是你的职业,也是你需要做到的。作为一个SA,你肯定经历过通宵好几天加班做事,你肯定经历过饭买来已经忘记了吃,你肯定经历过几天加班没睡觉,着个沙发坐下就失去知觉睡倒„„没有经历过不能说你不好,只能说你管理的机器太少。

我公司是每月发21天工资,某两月我一月发了44天工资一月发了47天工资,创全公司建司7年来加班记录„„项目做完自然也就落了个部门通告表扬,然后的结果就是健康情况急剧下滑,然后就是某天晚上在机房内加班一通宵,穿着短裤进机房,然后一个通宵被机柜下面的冷风吹了个关节炎„„这就是做SA的代价。

以下是一些实际经验,发给大家做参考,有任何问题可以mail我,answer3ai@gmail.com

有的东西是企业机密,我不能透露也不能给你相关文档。

一,架构设计

现在你要做的,就是设计你的服务器架构和网络架构。这要先看你的网站是做什么的,每日有多少的人数访问,例如,我打算站点初期每日有20000左右的访问量,和1000人左右的并发量。我可以用我的人数并发量1000×站点中每个页面的平均大小200k×每个访问用户可能要打开4个网页=800 000k=800M的网络流量(当然这个数字肯定是非常的过分,至于为啥,自己可以想下)

然后可以用测试环境用软件检测在你的真实环境下的服务器压力,比如在2000人在线的情况下,服务器的cpu占用多少,内存占用多少。

那么你可以得到你大致配置,其实市面上的标准服务器配置都足够你用了,比如现在的DELL 1950,HP DL360G5,IBM X???(忘记了)

等服务器,足够我跑一个这样简单的网站。其实说白了,双奔3都够,真的。当然你网站的流量比我要大的多,那你可以买的更好一点的服务器。或者负载均衡器。

网络架构

站点现在是一台独立服务器,未来采用的是分布式架构,比如bbs.hilinux.com是一台服务器,man.hilinux.com是一台服务器„„

mysql是一台服务器。这样你要算服务器要多少台,交换机要多少口,防火墙要买什么级别的。

哪些服务器可以放在一个防火墙下,哪些服务器不用防火墙保护,哪些服务器是内网服务器,需要什么样的网络连接,最好是画出大致拓扑,方便你预算设备花费。

服务器交换机等设备选型和购买

说的简单点就是买什么机器,你可以和google一样开始,买几台pc作为你的网站服务器,也可以自己组装一台服务器

或者也可以和我一样,去挑选品牌服务器当然,现在你要看你服务器做什么的,你可以亲自去电脑城看组装服务器,也可以打电话到IBM,HP,DELL的各地销售商让他们送服务器来测试,当然你不要告诉他们你只买一台,那你就别指望测试了。我告诉供货商hilinux.com需要200台服务器,一个F5,10台CISCO 2960交换机,3个NETSREEN206防火墙,一个EMC CX500+满硬盘 那么不到3天,hilinux.com所需要的4台测试服务器,就送来了„„当然,不要牛了这么多最后只买1台,那么你晚上走夜路会被人打的。

最后就是价钱问题了,这个你自己看着办吧。让你公司的财务或者采购出马砍价付钱就是了。当然,除了服务器的服务,你最好还是想想有利于自己的服务,比如人家公司可以帮你拆箱子了什么的。我做的最弱智的一件事情就是,来了400台服务器,50个交换机,8台EMC,我一个人花了一星期把箱子才全部拆完„„

机器选型的时候你也要为自己考虑,比如HP的ILO功能,可以让你远程BIOS级操作服务器,比如浪潮的自动资产管理等等,为自己管理服务器提供便利,否则机器10来台还好,100台还一般,我这里3万来台,我不死几百遍了。丢失一台服务器,几个月工钱就没了„„

二,IDC选择

首先要看你服务的地区是哪里,然后再去找当地的电信机房。毕竟,虽说全国已经互联了,但是各地的网速还是有差异的。

或者说有的IDC机房利用率高,虽然出口带宽大,但是利用率高的结果是导致你网速慢的原因之一。

我的做法是在全国各个机房的服务器用pingplus这个软件进行一周的的流量测试。可以看到平均丢包,最大延时等等。

当然,你也可以到你目标服务的地方,找个可以上网的地方进行网络测试,比如说网吧包个机器„„

好了,网络测试完了。那么你已经决定去哪个IDC了吧。

然后你就可以电话或者自己提着礼品登门拜访一下IDC服务商的老大了

当然,你也可以找代理服务商,因为他们拿到的价钱有时候比电信或者网通给你的价钱低,但是,关键还是一个服务,因为你毕竟服务器放在那,晚上关键着急没人给你重启,机器出了问题其实按个F1就可以解决的问题,服务商的值班人员不懂。你就只能打晚上的打飞机去机房维护吧。

提着东西拜访一下服务商老大是礼节性的东西,东西不在多而在精,这样你未来谈事情人家也给你绿色通道,做事情要好做很多。当然,我也不反对你空手去,你一次租个100个机柜+10G带宽,人家还是很优惠的。哈哈。大家都是混口饭吃,也不至于难为你什么。

最后你要知道现在的中国还是卖方市场,你给人家牛,那你买的产品只能是„„蒙牛 然后是开始去参观机房

细心的检查一下空调数量,空调出厂和最后维护日期,网络布线类型和架构,是否可扩展,主备从电力等。

基本都是非常关键的东西,出问题了,人家可以给你更换一个新的,服务很好,但是你服务器挂一天的损失是多少,你可以自己掂量。

还有机柜电力,现在的机柜放置16台1U的服务器是正好,多了过于热,少了资源浪费;但是你发现人家只让你用10安培电力,过了要交钱买电;

或者不限制你用电,但是插线板只有10个,你还真买个托线板去转接?你要想想你一个托线板挂了,你服务器要挂几个?

最后,我的一个机房包间里140个机柜,2个空调,结果某天挂了一个空调,虽然6小时人家IDC商就给更换了一个空调机(这速度已经非常快了),结果我机器至少被热死了100台以上,机器是HP的,机器过热,HP会自动关机,而且会不让你启动。你崩溃不?注:不是给hp做广告哈。

三,服务器上架

好了,要是你买的服务器到了,你会发现你接到电话后,楼下一个N大的“擎天柱”集装箱车给你送服务器来„„(某次我收2000台服务器就是这样的阵势);在这里有个重大的提示,你们财务给厂商下单的时候,收货地址一定要写对。比如 XX路XX号XX大厦XX楼XX室,你写到xx号,送快递的会给你堆到院子里,你写到xx楼,送快递的会给你送到电梯口,你写到xx室,他们才会给你搬到室内。因为送货的都是服务器厂商找的,你因为这个事情去联系厂商修改送货地址,至少要多等N小时。而且他们视你的单子的数量和楼层,判断来多少搬运人员。而且,一定要把服务器搬到你指定的地方再签字收货,否则„„嘿嘿„„

我最霉气的是:来了20台机器(还好不多),下着大雨人家给我往院子里一丢,让我自己搬上19楼,我没推车没啥的„„

你可以说,找电信的帮忙撒,废话,这个我还不知道。那我告诉你,我在某电信大楼工作时,从CCIE到机房主管到机房工作人员,全部是美女„„

虽然我在这个地方只干了5天活,我的同事们口水都有3尺长„„你还叫人家给你搬机器不? 你可以说,雇民工撒,我又不是没雇过,钱得你自己支付,公司不给你报销的话,爽不?

下面是拆箱子,面对着堆积如山的2000台服务器,我是连抬手的力气都拿不出来„„当时机房只有我们公司3个人+电信值班2个人„„

这时候,我的办法是„„我打电话找来了2队收废品的:

这么多箱子,除了机器和电源线留下,里头的导轨光盘等等你全部拿走,谁拆的多谁拿的多„„

最后按照我的要求帮忙搬到机柜上„„于是我们5个人是监工„„看人家拆箱子搬机器。

于是人家2队人找来了30多号人,一早上把2000台机器全部拆箱子完毕放到机柜上。

要是我们几个人拆,估计„„„„

最后再说个行价,服务器箱子一个价值5块钱甚至更多。你服务器到了,卖卖箱子请大家吃饭吧。别让扫地的阿姨拿走,几个无所谓,10来个箱子,够大伙儿吃顿烤肉了„„还有EMC的木箱子„„拿去养个小鸡小鸭的„„

42U机柜1U的服务器最好是16台。你就看着上吧。呵呵

四,安装系统和布线

好了,面对几千台服务器开始装系统,我不知道你会怎么想„„

全部是1U服务器有什么办法安装系统?(我们公司穷,买不起刀片;而且电信不配合,要是上刀片,电路你们自己拉线,价钱还是原来的价钱;最重要的„„我们公司以人为本,宁愿多养个人也不愿意买个好服务器让人失业),而且不允许GHOST,因为你这是服务器,不是网吧„„GHOST出来的系统,我不知道谁用过,爽不。我自己是郁闷郁闷到了,莫名问题的时候,你就知道GHOST还是靠不住的。

其次,我们公司安全部要求:必须得一台一台安装,先安装光板的系统(比如没有SP的WIn2000),然后手工打SP4补丁,不能网络打补丁。于是我们就光盘堆成山。最扯淡的,为了快,我做了一个补丁共享的服务器,所有的补丁CP的本地来打。结果忘记拔网线,导致人家说我们是插了网线打补丁,有中毒的危险,需要重装。我直接崩溃„„ 办法1,你可以1台1台慢慢装,反正这么多机器,你可以管公司要更多的时间。但是我们公司一般是机器到了,最多2-3天就要要,一向是那种计划不如变化快的没有计划没有进度管理的“小”公司,项目组拿着鸡毛当令箭,牛x哄哄的公司。郁闷!

这个时候前期的准备就比较重要了(我公司多用windows2003),因为首先我要装一个光系统,再打驱动,再打补丁,再安装远程控制软件。一台机器装完大约要1小时多点。那么机器多了怎么办?光盘不够怎么办?等等问题就来了。

我的办法是,我一看TMD全部是DVD,IBM的机器直接佩combo,公司给我们发的全部是CD,娘的,典型的没有最慢只有更慢,出了问题闲你慢的领导班子。于是只好自己出钱买了DVD,用软件把RAID,网卡,显卡其他驱动做到光盘里,需要安装的软件也直接做成自动安装的方式,补丁也刻录到光盘里(我们要求补丁必须单打,不能安装集成补丁的ISO,shit),这样弄,你只用把光盘往光驱里一丢,分区一分,就可以下一台机器了。然后等你在去关注这个机器的时候,已经可以设置IP插网线了。灵感来自番茄花园。吼吼。

当然这时候你最好是买个KVM,16口的KVM,一次准备16张光盘就可以用一套键盘鼠标操作16台机器。当然啦,KVM是可以级联的,我最牛一次一次一套键盘安装166台机器。郁闷的是,塞光盘塞死,插KVM线插死,配置IP配死,有时候还会弄错„„

办法2,你可以用NETKVM去远程安装,但是你插那些NETKVM的线路,2000个插下来,爽不?然后你继续扎KVM和网线的时候,看着和瀑布一样的网线和KVM线交错在一起。估计直接崩溃。远程KVM有的牛x的是可以分发ISO的,就是传说中的远程分发安装。可以自己买一个研究研究了,我们公司以人为本,从来不买这类高科技。

办法3,我犯贱时候发明的:我们的机器全部是RAID1,于是我安装一台raid1的机器,系统全部安装好,然后拔掉一个硬盘,插上一个新硬盘自动恢复镜像,基本10来分钟恢复好一个硬盘,插到机器上去。这样,还是比装系统来的快。当然啦,型号是一模一样的„„

办法4,HP的ILO2功能,实现远程分发。前提你得一台一台配置好BIOS里的ILO2。也是蛮痛苦的。IBM和DELL现在也都有这个功能,但是你在分发以前,还是得一台一台机器插上网线,配置好BIOS的IP,痛苦。然后把操作系统和机器的驱动程序和后续的软件全部做到一张DVD里,让他自动运行。然后所有的服务器远程运营这一个ISO,最好多弄几台,否则一台机器弄的慢死。

办法5,绝对最简单的办法!!就是买机器前,让厂家给你在硬盘里灌好系统,和你买笔记本一样,打开是个安装完成需要你输入序列号的系统。但是弱点是后续的软件需要自己装。因为服务器厂商是不会帮你安装别的软件的。还有更多的办法,只是暂时没想到,大家也可以谈论自己的办法。互相交流嘛。(51CTO编辑注:其实现在已经有很多无人值守安装系统的管理软件,比如KickStart和现在流行的Cobbler,都是不错的批量安装工具,而且都是开源的。现在都追求自动化,希望越来越多的运维们将不必面对一台一台装机的困扰)

所以我喜欢linux,可以用N种办法安装系统。

windows就是个让IT人当装机男,挨踢人当民工。

好了系统装好了,电源线和网线连接完,和瀑布一样的。这时候还是尽量把他扎一下吧。

否则机器通风不畅,会导致热死。

简单办法就是电源线扎一边,网线扎一边。有钱的公司可以买个网线序号标,没钱就自己拿胶布标。

你可以随便扎,或者和给你老婆梳头一样,好好扎。哈哈

插交换机的时候,从上往下,从1-24往后,这样网络异常,数一下就知道了。

想来想去这里也没啥值得关注的地方。所以就几行带过。

五,资产统计

假如你的机器只有2000台反而好容易管理了,但是现在我要管理的全国IDC有31个,平均每个机房有不同品牌服务器1500台。

一共大约有45000台的样子(我的资产管理系统里的数字,不包含交换机,防火墙等)

这时候怎么办?

每季度和财务小MM一起出去旅游盘点IDC资产,幸福啊„„(我们财务小mm很PL的哦)到了机房就是我一个人干活点资产,小mm带着大口罩,披着双层的放辐射服„„

可怜我们这些干活的,短裤背心,IDC里一呆就是好几个月(IDC办公室就在机房边上„„),不知道精子被辐射杀死多少„„

1,必须有资产管理系统,虽然这个其实是个很简单的数据库,但是你可以把每一台机器的品牌,硬件信息,操作系统信息,购买年限,质保年限等,你非常关注的东西做一个详细记录,并配发同一的资产编号。比如我们的资产号,FWQ-123456 服务器-123456,这是一个总的资产号,这个服务器哪怕搬到美国,也是这1个资产,直到丢失,或者抛弃,都是这一个资产,永远不会变。

比如我现在的板凳就是一个资产号是:服务器-000010的一个4U服务器,配置是P2 300*2 256M内存 16G硬盘×4 购买时间是1999年10月,从中维修过1次,升级过1次,在哈尔滨机房-广州机房-河南机房-北京网通机房-上海公司内部测试机房-上海库房服役过。

有历史吧„„.2,送到机房

看过我这个服务器去过的地方,羡慕不?见证我们公司的发展史。9年过去了,终于成了我的板凳„„

服务器在购买合同确定以后,就应该按照配置记录资产,并且在财务备案,资产编号一定和财务记录相同。这样这个服务器走到哪里,都有备案和记录。现在要把这个服务器送到某个机房去,搬着走吧„„汗

送到机房,我们要给服务器按照财务给的表格粘贴资产编号,选个顺眼的地方,不会磨损的地方。

一般是机器正面某个地方,然后是机器屁股后面某个地方,然后机器侧面把手的地方,粘贴3个,以防掉了就烦了。

然后在粘贴这个机器的应用资产号和IP标签:

应用资产号举例:FWQ-SH-XX-B31-WEBSERVER 意思是:服务器-上海-xx机房-B列31号机柜-web服务器

IP标签举例:外123.234.123.234内10.0.0.1。这2个标签你可以分开也可以在一张标签上写清楚。

并且在安装服务器的时候。把FWQ-SH-XX-B31-WEBSERVER-123-234 把这个作为你的HOSTS信息,windows里叫做计算机名

这样远程上来都非常清晰自己在哪个服务器上,出问题时候也非常容易找到这个机器,不要闲麻烦,一切的麻烦都是为了以后快速的解决down机问题而做的。当然啦,甚至在密码管理上你也可以用这个规则来设置密码,但是最好规则别让别人知道了„„

3,把这些信息全部录入你的资产管理系统

系统无非服务器名,IP信息,用途,机架位置,或者是否在使用一类的,我就不多讲了

4,资产系统软件交互,也可以说是监控系统。

企业可以开发一个软件,在装机的时候安装到服务器上。然后资产管理系统定时去取服务器上的信息,比如网络流量,CPU内存硬盘负载一类的东西,这样你的资产管理系统又变成了一个监控系统;

当然啦,你也可以在资产系统里集成一个远程桌面管理系统,自动载入用户名和密码,还有随机码,就可以登录系统。省的还得管理服务器密码。

然后用户的访问权限不同,看到的节面权限就不同。

比如说,监控人员没有登录权限,或者IDC人员没有登录权限一类。权限分配你自己研究好了。

5,还是IDC的工作。

话题继续回到我和财务小mm去盘点(你公司比较大的话,你可以多派几个人分开去各个地方„„)

小mm一看我们机房服务器黑压压的一片,铺天盖地的,直接无语。为啥,因为要拿着资产表一个一个核对,面对几千个机器,直接晕倒。

虽然按照资产管理系统里导出的信息,机柜号,IP号,机器从上到下的顺序都非常精确,但是你一个一个核对,还是慢。

怎么办?

库房管理的工作用上了,哈哈。你买服务器或者买笔记本电脑的时候有没有注意到箱子上的条码?

那个条码非常清楚的记录了这个机器的详细信息。所以黑莓手机或者NOKIA手机(别的我没用过)都有扫描条码的功能„„好像与主题无关„„

那么剩下的就简单了。

去买个这种条码标签的打印机,编辑成自己需要的条码,一个一个贴好,上面有你所有需要盘点的信息„„ 比如我们是从资产到机柜号到服务器名字到内外网IP都要盘点„„小崩溃

打印出来贴上去。然后买个扫描枪,和超市那种一样,不过你要买有存储功能的,否则你要端着笔记本去扫描,SB了。

然后我和财务mm本来需要一个人念号码一个人核对(你要直到在机房里大喊资产号,喊一天的结果是啥,自己想),现在一个人拿一个扫描枪,按照规则一个一个扫描。完成后把数据导出后重新整理分析。直接和数据库核对(当然这个也需要你自己开发),核对完成生成一张表。

表上写的非常清楚你哪个机架没有哪个机器,哪个机器不在特定的位置上,哪个机器缺少„„等等

这样比如说,机器位置不对扣5块钱工资,机器IP不对扣2块钱工资,或者„„反正扣到最后„„这月不给发工资了,还得倒贴点„„哈哈哈

六,监控架构

监控架构其实每个地方都有自己的做法,我也知道我的办法不是很先进,但是仍然拿出来和大家一起讨论

首先谈谈监控软件,一说起这个常用的东西MRTG,cacti一类的就都可以用了。只要稍微归类一下,流量展示看的还是很清楚的。

要是要监控服务一类的,那就只好启用大名鼎鼎的nagios,和一些牛x人基于这个做的一些别的商业软件。

或者就是自己做个脚本去定时探一下,不通了给你发邮件了啥的,你vim一下nagios的chack_xxx,学习一下里头人家探测的办法,自己也能搞出来个啥东西,都还是很不错的了。

作为IDC工程师,我们所要关注的东西就是个流量了,我们要很清楚某台65下的某台35上每个口的应用,当遭受攻击或者流量异常的时候,一眼就能知道是怎么回事。我不相信你天天看着10M的流量,某天突然一下给你来个80M,你说这是正常事件吧。哪怕正常,你也找相关的人确认一下吧,一个100m口跑 80M,估计电信的人都来找你了。

每天看着这些流量图是很枯燥的事情,那么我们没事只能想办法让他自动报警给我们了,于是EMAIL报警,然后把他发送到一个有手机提示新邮件的邮箱,你手机就有了。MSN报警,还是不错的吧,手机报警一类的办法都是不错的。这样你你可以和我一样放心的去打网游了。这里只谈经验,不谈详细的技术,因为我一说我的系统架构地球人都知道我是哪个公司的了,虽然已经离职,但是咱也有个职业道德,谢谢。

当然了,有些公司是有网络监控部门的。但是我就一直在想这个问题,所有的数值都可以用短信报警,你随时都可以收到信息。用这个部门干啥,让一群可怜的家伙 8小时一动不动盯着屏幕,公司又在他们电脑上安装了抓屏软件,上班事件聊天上网就扣钱„„我估计他们每天最期望的事情也莫过于服务器挂了,可以给我们打个电话重启个服务器或者连到服务器上检查一下啥问题,重启个服务了啥的。当然了,这些兄弟最后的职业方向也只能是进入运维部门了,至少公司服务器宕机维护的流程性东西掌握的非常熟练了。但是这是用好几年时间换来的经验,太„„所以我是奉劝兄弟们有发现监控部门招聘人,就别去了吧。面前8台显示器,猛一看还以为是黑客帝国呐,结果仔细一看全tmd是流量图。常年对着8个显示器,那个辐射„„

我就不清楚设置个节点,出现问题告诉人,人去操作会死啊,非要让人和机器一样一动不动的盯着显示器,TMD,官僚。虽然我没经历过,但是想也能想到。做SA,最大的要点是懒,把一些需要人做的事情都自动化„„但是话说回来,我公司以人为本,人海战术嘛,可以理解。

上面的帖子位子已经满了,下来的帖子在这里写。

企业实际面对的一些问题

我大概通读了veyron 大侠的文章,认为系统架构方面的我绝对不如他。我就不在这里卖艺了,那么我卖企业都会实际面对的一些问题。

1,自动化,流程化你的信息管理

为什么要自动化,这年头流行办公自动化,你丫没事还拿着工单四处签字,老土了吧。

为什么要流程化,这念头流行流程管理,假如你公司没有一个固定的流程管理,出了事情,大家都不知道怎么做,各个部门的电话乱打,大家都一锅粥没有效率。所以,未雨绸缪,在没有出问题的时候,模拟出问题,多多准备,建立规范的流程,公司的每个人都要遵守,这样,流程化的管理+办公自动化,大家只用在电脑上翘翘键盘,点击确定,流程就发出去,一路审批,OK,流程发送到做事的人地方,也许这个做事的人在美国,也一样方便。

上面说的是一个原理和意思,用这样的理念去管理你的服务器应该如何去做?当然了,你假如只有10来台服务器,就不用考虑这个了„„.首先服务器采购录入资产管理系统(详细见上面有写),服务器的去向和调度都在管理系统里有提现。

这里说的是:如何去上架,维修,下架等流程控制

先说上架下架:服务器到机房以后,别人要用服务器怎么办?先可以到你的资产管理系统里,看你机房还有什么配置的机器多少台,然后让他们选择自己项目服务器的配置,数量。在流程管理系统中,把这些机器选中,生成一个表单,表单名字为xx项目上架需求,写清楚谁用,做什么,数量,哪个机房等。然后提交给他们部门领导,他们部门领导同意后,转给需要审批的领导,一层层下来,流转到我们部门领导,我们部门领导流转给部门机房员工,员工收到流程,检查上架下架服务器;如要上架,安装完系统后填写IP,机器名,机架等相关信息。如要下架,删除相关信息,提交给流程控制的人员,流程控制人员确认后,这个流程完成。届时,所有的人审批过的数据,经手人,数据库里都有,出现什么问题找相关责任人,一下就找到了,省的和某些XX部门JJYY。

维修也一样了,机器坏了,或者需要重装系统,按照上面的流程,一步步走一遍,就可以了。年底统计机房一天要干多少活,省的某些领导认为机房人TMD都在闲着。机房的人呢?没有流程不干活,否则白干。

在流程系统里重启服务器,重启服务器要是要流程,就太慢了,那么你可以做一个绿色通道,写清楚原因,重启哪个机器,直接提交给相关机房人员,在你的流程系统里绑定一个短信网关,机房人员可以收到需要重启服务器的短信。准确无误。

这样代替了无纸化办公,既有自己做的事情的每一个记录,又有相关人员管理,可以量化自己的工作,免得年终奖的时候xx人有说你干的少,发的少。你把记录拉出来对比对比就知道谁多谁少了。

2,如何升级你的服务器

服务器老了,或者需要加内存加硬盘,怎么升级。

虽然说是很简单换个CPU,加个内存,加个硬盘很简单。

但是,如何控制你的配件不丢失,确定的安装到机器上利用了呢?

简单,在服务器上做一个探测服务器配置的客户端,每天探测一次硬件配置发送到资产管理服务器上。

与资产管理系统的硬件配置做对比,出了问题就报错发一封邮件到机房工作人员,抄送流程控制人员一封就可以了。

至于的加内存的时候注意型号啥的问题就不说了,大家应该都没问题了 要说的是,假如你一个机柜上放的机器比较多,比如4个6个机器一摞,恰巧坏了,恰巧一个人在机房,非得解决,怎么办?

简单,一个办法,但是还是需要你有力气,虽然有力学原理

比如有4台服务器,最下面的坏了,你可以拽住最下面的把4台一起往出拉,拉出来一点,把上面3台往后推,这样一点一点的拉出来,下面最关键:

拉到最后,前面要留出来一点,轻轻的把上面3台的尾巴着地,然后一只手抬住上面3台机器,一只手拉出下面一台机器。

上面3台一定要留出来一点,否则放下的时候,机器和机柜托板会压住你的手,你一松手,机器震一下,硬盘就挂了„„

所以在推进去的最后仍旧要留一点在外面,最后放下来了再推进去这最后一点。

然后就可以换或者加内存了。相对比较省劲,不危险,不会压倒自己,不会砸坏服务器的办法就是这样了。

第四篇:运维工程师年终工作总结

篇一:系统运维工程师年终个人工作总结及下年工作计划 **公司系统运维工程师年终个人工作总结及下年工作计划

时间一晃而过,弹指之间,2010年悄然而至,自从2010年3月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司网络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯定。经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:

一、公司电脑日常维护工作

1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。

2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障影响整个局域网内的其它工作,使故障扩大化,并延长了解决问题的周期。

3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。

4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还原。

5、对于网络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司网络办公环境。

经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。

二、网络的日常维护

路由器及交换机的维护管理,确保公司网络运行正常,员工正常利用网络资源。加强路由器的规则设置,优化外网接口,内部员工合理地分配带宽流量,使公司的网络能稳定有效地工作。

三、公司网络制度管理和完善

公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资产流失。

四、公司服务器平台管理与维护工作

公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本我司服务器相应出现几次重大故障,分别如下:

1、网络故障七次,重大一次,因服务器遭ddos攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、网络升级、电信与联通dns解析故障影响到我司服务器平台网络连接不正常。

2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。

3、其它故障共计5次,因联通网关溢出,无法与我司ivr服务器数据库网关同步,导致用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。

4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。

5、公司针对员工的工作岗位与职位重新部署了ftp服务器的访问权限与互联网访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外网均可实现访问ftp服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进行了保密设置,从而大大提高了公司重要资料的完整性与保密性。

总结本的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的网络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。

在新的一年里,将百尺竿头,更进一步,2011年的大致工作计划为:

1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如oa软件)。

2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。

3、解决企业网站制作等专业性知识问题,业余时间强化学习并能胜任网站管理工作。

4、进一步增强it系统和网络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域网,使内、外网连接任意,在任何地方工作都能连接本公司服务器资源。

5、重新改建机房机柜网络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。

6、在资金允许的情况下对公司办公电脑、网络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。

7、学习更多的网络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。

2011年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务学习,不断提高自身综合素质,把新一年的工作做好,为公司更好的发展尽一份力!篇二:年终总结(运维部)2011年运维部工作总结 2011年业已尾声,我部门在公司的正确领导下,认真执行公司制定的各项制度及部门制度,努力改进工作中存在的不足,并取得了一定进步,2011年我部门总体工作特点是:运维任务基本饱和且多个项目同时进行,工作分散、繁琐,现就部门的各项工作进行一下简要总结。ⅰ.一年工作概况

1、上半年运维任务相对轻松,根据公司和部门要求集中进行内部优化,以及对以前工作进行总结,各负责人在现有条件基础上,统筹安排,有条不紊的完成公司规定的任务指标,没有因运维任务繁多而出现混乱。

2、下半年各主要项目陆续接手,同时部门内部各人员职责基本清晰,各负其责,整个部门运行基本踏入正轨,方案、合同、资料、服务流程运行良好,同时现场服务人员能认真负责的执行公司及部门的各项规定,掌握、收集、记录现场第一手资料,完成公司交办的各项任务。

3、本中部门与部门间、员工与员工间,都在工作中不断的磨合,发现问题、解决问题,各项工作并没有因此而停滞不前,经过一年时间的不断改进,对内公司各项工作渐渐运转自如,对外也赢得了相关客户的认可,一切正朝着令人欣喜的方向前进。

4、本人员安排如下:

5、本服务数据如下:

6、本部门收费回款如下:

7、运维和参与项目实施情况

㈠.全年部门完成运维任务:①.解决招行成都分行监控中心大屏和两河公园停车场故障与项目尾款回款两个难题;②.完成招行密押系统升级更新和其他系统运维任务;③.完成安县交通卡口及金牛公安分局等其他客户监控系统运维任务;

㈡.全年部门完成参与项目实施任务:金牛公安分局视频资源管理系统 ⅱ.但是总结本的工作,还有一些问题存在,有些工作亟待改进:

一、备件管理

1、备件管理在2011年做得并不好,由于项目运维还处于成熟过程中,对运维备件要求未按照实际使用作计划,导致在运维过程中,无法对备件进行有效控制,在今后工作中要着重加强管理调度,坚持每月执行备件计划制度。针对备件需求和备件使用制定相应的领用制度,做到“谁提备件,谁负责”,坚持限额领用制度。

2、加强备件现场使用的管理力度,对送达现场的备件,及时准确地进行核实,发现问题及时上报,对备件使用量大的、有特殊要求的须经过部门负责人或分管领导审核同意。

二、服务流程管理

1、服务流程是否合理决定服务的效率,在保证质量和安全的前提下,尽可能地提高服务及时性。原则:对同时发生的运维任务,合理调配人力、物力资源,统筹安排,因地制宜,在尽可能短的时间内完成更多的工作,做到人员效应最大化。优化运维方案,通过集体讨论,优先采用能够保证服务质量要求,方案可行而成本支出较小的运维方案,目的是成本控制,同时加强现场管理,合理调配有限资源,减少浪费。

2、现场服务人员和主管负责人、后勤人员要勤于沟通,有变化及时通报,做到信息畅通,避免因沟通不及时而出现重复派工、二次报修等问题。

三、人员培训

1、技能培训:公司目前项目主要分环保、交通卡口和安防系统3大块,而运维部人员对所有项目的都还未做到详细熟悉细致了解和掌握的程度。

2、制度意识培训:运维部人员平时处理故障的情况较为繁重,在一定程度上对制度或资料填写有疏忽的现象,对资料收集整理保存以及查询带来了不便。

3、部门只做到了制度化和形式化,落实与实施的程度还不够。ⅲ.对公司制度和管理制度的建议

针对我们在维护过程中遇到的问题,我作出如下几点建议:

1、对公司的产品:现今我司自主产品基本没有,尤其是新项目,产品处于测试阶段,但这些产品已经在客户那里开始使用,所以出现问题较多,工程师都是一边学习一边维护。避免不了在客户面前向公司有关方咨询处理问题的方法,给客户留下了不好的印象;其次,是老产品的更新升级,设备运行也不稳定,造成维护量巨大,处理一个问题又出现新的问题。希望公司12在这方面得到改进。

2、配件管理:公司在配件备货方面存在较大问题,主要为相关配件公司没有配件库存,有的设备还需供应商提供;如:读卡器,摄像机等,这极大影响了服务效率,12此问题应首要解决。

3、服务流程及工作量:服务流程没有什么问题,主要是协调沟通机制还未建立起来,导致工程师不能与客户及时了解情况以及管理人员不能了解实时状态。造成不必要的催促和二次报修。另外由于有些片区条件特殊,如其他县市区,由于离公司较远一个较为简单的任务需要派人去现场,这样就造成了一定的资源浪费和增大了服务成本,希望公司在新的一年有所考虑和改进。

4、人员培训:公司应加强人员在工作技能和公关技能方面的培训,提高人员意识和安全性、纪律性;部门拟定在12年对部门人员进行1月1次技能或理论培训,实时进行现场实际操作培训;另外部门决定在新年里对部门员工进行职称培训,力争在12年部门有1~2名项目经理,2名以上安防技术专业工程师。ⅳ.来年工作计划

1、人员划分:

2、制度流程:

进一步细化规范部门制度和流程,最大程度优化服务结构,监督人员落实和实施,做好资料收集整理、备品备件管理。

3、系统数据;明年公司将上业务支撑管理系统,部门将根据系统数据做详细的篇三:xxxx年运维工作总结 xxxx有限公司

xxxx运维工作总结 工作总结 xxxx xxxx/x/x 对过去的xxxx年的运维工作进行总结,主要总结工作内容、运维工作流程、经验总结。目录 1工作内容........................................................................................................................................3 1.1例行工作.............................................................................................................................3 1.1.1 设备巡检.................................................................................................................3 1.1.2 日常数据配置.........................................................................................................3 1.2 网络割接、工程配合与配置优化....................................................................................4 1.2.1网络割接..................................................................................................................4 1.2.2 工程配合.................................................................................................................4 1.2.3 系统配置优化.........................................................................................................4 1.3 故障处理............................................................................................................................4 2运维工作........................................................................................................................................4 2.1 服务精神............................................................................................................................4 2.2 自我要求............................................................................................................................4 2.3 运维水平............................................................................................................................5 3经验总结........................................................................................................................................5 3.1 运维工具............................................................................................................................5 3.2 智能巡检............................................................................................................................5 3.3 经验总结............................................................................................................................5 3.4 项目实施............................................................................................................................5 3.5 轮岗...................................................................................................................................5 3.6 机房割接............................................................................................................................6 3.7 部门协助............................................................................................................................6 xxxx运维工作总结 1工作内容

工作内容主要分为:例行工作、网络割接、工程配合、配置优化、以及故障处理几项。1.1例行工作

例行工作占全部工作的x%,主要包括:设备巡检、日常数据变更。具体百分比如下: 设备巡检:x%、日常数据变更:x% 1.1.1 设备巡检

设备巡检分为定期巡检和不定期巡检,定期巡检分为周巡检和月末巡检两种。定期巡检x次:周巡检x次,月末巡检x次

不定期巡检,主要是在每个工作日开始,根据具体工作安排情况对核心设备的log进行简单分析,以及时发现前一工作日设备的运行变化是否有异常,此项工作是周一早晨的重点工作。1.1.2 日常数据配置

日常数据配置变更主要根据各部门提交的工单来处理,以及移动内部的协作配合工单需求,主要分为以下几类: 常规操作工单; 终端应用故障排除; 无线用户接入;

新增设备的网络规划; 配合新增设备网络布线;

涉及核心设备的接口地址变更操作;

大量需要集中处理的工作,如服务器批量接入等; 涉及网络拓扑变化的操作;

应其他部门要求的网络保障。1.2 网络割接、工程配合与配置优化 1.2.1网络割接

根据客户需求,对网络的线路或者设备调整时进行割接,包括前期割接方案的编写,中期割接方案的实施以及割接后测试。由于网络割接是对正在使用的线路、设备进行操作,将会直接影响到上面承载的业务,因此日常的网络割接时是日常工作、网络改造中极为重要的一部分,本类工作占全部工作比例为x%左右。1.2.2 工程配合

工程配合主要是值守配合业务系统上线。1.2.3 系统配置优化

系统配置优化主要指对网络的整体进行配置分析,对存在的隐患提出可行性建议,并执行相关的优化操作。

主要包括:网络拓扑分析、拓扑优化建议、网络带宽分析、链路优化建议、分析设备协议配置并进行优化、监控设备软件版本的更新情况并适时升级、对设备资源占用率较高的原因进行分析并解决。1.3 故障处理

处理各种紧急故障,对因网络隐患或人为误操作等因素产生的故障进行处理。2运维工作 细致缜密的完成计划中的日常运维工作:严把质量;服务至上;严格要求;技术领先。2.1 服务精神

承接运维工作,保障xxxx网的运行,对用户负责,严把质量,服务至上,贯穿于日常工作的各个环节之中,满足运维期过程中的客户满意度。2.2 自我要求

对于在工作中客户的要求,我们及时相应配合,严格要求自己,对于出现的网络故障和客户需求,及时提出完整的解决方案,并拟请用户试行或测试后实施。有力的保障了运维工作的及时有效性。2.3 运维水平

对于提高服务业务技术水平上,对自己提出一定的要求。按照“技术领先”的原则,通过xx运维小组,内部讨论,相互学习。3经验总结

运维期内网络发生了x次严重的生产安全事故,均是因为安全隐患引起的问题,经过后期的整改工作,对网络的隐患进行排查。考虑到当前的运维工作,需要运用先进的技术和经验提高劳动效率和运维工作质量: 3.1 运维工具

运用先进的运维工具提高劳动效率。通过网络监控软件随时保持信息的及时性、可控性,一旦发生问题可以迅速定位和修复。3.2 智能巡检

需要对我们的巡检工作进行优化,人为巡检存在一定问题遗漏。为使我们在高效完成运维工作的情况下,可对巡检工作进行优化,将人从繁琐的巡检工作解脱出来。3.3 经验总结

在工作的过程中注意新技术和新方法的学习和收集,认真完成运维工作中的汇报、总结和知识积累工作; 3.4 项目实施

在运维工作过程中,积极协助新增设备的各项实施工作,获得了信息技术部的肯定;在到货、验收、集成方案和安装调试过程中提供全程保障; 3.5 轮岗

我们一方面做好运维工作的情况下,另一方面派出部分或全部人员协助信息技术部的各项工作,以弥补其人力不足的状况,且可以相互学习,熟悉各岗位的工作

第五篇:运维工程师岗位职责

运维工程师岗位职责

1、响应及解决客户的技术要求、疑问以及系统使用过程中遇到的各种问题;

2、负责服务过程中问题现象和处理方案的收集撰写,形成知识库,并对知识库进行维护更新;

3、及时反馈技术处理过程中的异常情况,及时向部门负责人、服务开发PM、客户经理等相关人员报警;同时,主动协调资源推动问题解决;

4、定期对所有服务问题进行分析,并对服务效率有影响的问题提供反馈意见,提升服务支持团队专业度

岗位职责2:运维工程师岗位职责

1、负责数据中心日常巡检工作,并根据要求形成相关统计报告。

2、每周按照要求制作机房运行参数等的统计分析。

3、能够部署相关的操作系统(windows、linux)以及一些基本服务,例如AD、DNS、DHCP、AAA、IIS、文件系统等。

4、能够配置交换机的基础配置(MSTP、RSTP、主从VLAN、动态VLAN等基础配置)

5、路由协议(静态、RIP、ospf路由)。

6、了解防火墙的工作原理,能够进行简单的策略下发。

岗位职责3:运维工程师岗位职责

无论做什么运维,运维工程师最基本的职责都是负责服务的稳定性,确保服务可以7___24H不间断地为用户提供服务。在此之上运维工程师的主要工作职责如下:

质量:保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。

效率:用自动化的工具/平台提升软件在研发生命周期中的工程效率。

成本:通过技术手段优化服务架构、性能调优;通过资源优化组合降低成本、提升ROI。

从产品的生命周期来看:

1.产品发布前:负责参与并审核架构设计的合理性和可运维性,以确保在产品发布之后能高效稳定的运行。

2.产品发布阶段:负责用自动化的技术或者平台确保产品可以高效的发布上线,之后可以快速稳定迭代。

3.产品运行维护阶段:负责保障产品7___24H稳定运行,在此期间对出现的各种问题可以快速定位并解决;在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性。

岗位职责4:运维工程师岗位职责

1、参与设计、审核、优化公司IT系统以及各应用系统的体系架构;

2、全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台;

3、负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化;

4、建立面向开发部门,业务部门的服务流程和服务标准;

5、负责IT运维相关流程的规划、设计、推行、实施和持续改进;

6、负责内部分派下发,对实施结果负责。

7、负责日常网络及各子系统管理维护。

8、负责设计并部署相关应用平台,并提出平台的实施、运行报告。

9、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。

10、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。

11、负责网络监控和应急反应,以确保网络系统有7______小时的持续运作能力。

12、负责日常系统维护,及监控,提供IT软硬件方面的服务和支持,保证系统的稳定。

下载详解Linux运维工程师必备技能(五篇模版)word格式文档
下载详解Linux运维工程师必备技能(五篇模版).doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    运维工程师岗位职责范本模板

    运维工程师岗位职责范本模板1、负责思科、华为、华三等主流厂商的网络设备安装、配置和管理;2、负责项目的实施工作,包括项目的规划设计、安装调试、系统优化等;3、参与项目......

    运维工程师面试题[范文]

    IT运维工程师笔试题 姓名:时间:一、填空题 双绞线两种制作标准的线序: EIA/TIA 568A:、、、、、、、EIA/TIA 568B:、、、、、、、连接方法有两种: 正线(双绞线两边都按照EIAT/TIA 5......

    浅谈It运维工程师职业规划

    浅谈It运维工程师职业规划 随着国内软件行业的发展和扩大化,有更多更复杂的系统出现,为了保证系统的稳定运行,需要有更多的IT运维工程师。合作企业对于it运维工程师的需求量也......

    运维工程师工作总结

    运维工程师工作总结 运维工程师工作总结1 时间飞逝,一晃而过,弹指之间20xx年已过去,作为公司的一名运维工程师,在公司领导及各部门各同事的帮助下,我顺利的完成了各项工作。在具......

    粤嵌讲解Linux系统运维工程师必备技能

    粤嵌讲解Linux系统运维工程师必备技能 Linux系统运维工程师必备技能有哪些?粤嵌教育从下面几个方面为你讲解: 一、什么是Linux系统运维工程师 运维工程师在国内又称为运维开......

    运维工程师年终工作总结[5篇材料]

    年终总结还对年初工作规划没有得到落实或落实不到位的原因及工作中存在的问题,分析出现问题的原因,从而提出解决问题的办法,进一步做好来年的各项工作都是很重要的。下面是小编......

    运维工程师试用期工作总结[合集]

    尊敬的公司领导:我于20xx年09月07日起正式成为公司一员。时光如水、岁月如梭,转眼间,做为一名我友正式员工已经有三个月之久。在这个难忘的日子里,我深入体会到了公司的积极氛围......

    运维工程师工作规范

    智慧和平指挥大厅运维工程师工作规范 1.机房巡检:工程师每天到达“智慧和平”现场,先去大屏幕后方机房检查机房温度是否过高,空调是否正常开启,检查机柜里各设备是否正常运行,开......