第一篇:政府网站运维面临四大困境,怎么破?
政府网站运维面临四大困境,怎么破?
来源: 南方网 作者: 张伟雄、彭可桥
南方网讯“扶贫办”写成“扶贪办”,有“僵尸网站”6年不更新,政民互动的“万能回复”让人心塞,“补办身份证”查无此数据……近日,国务院开展第一次全国政府网站普查,引发了舆论对政府网站各种问题的炮轰。据悉,在去年联合国发布的《2014电子政府调查报告》中,我国在193个国家电子政务发展指数中仅排名70,需要急起直追。
近年来我国的互联网发展可谓经历了一个“大爆炸”的阶段,互联网的基础设施、基础技术已经十分成熟,许多互联网公司在这个“风口”上打造出了国际一流的网站和产品。但是,政府网站的水平却远落后于商业网站。电子政务业内人士指出,在当前的技术阶段,政府网站发展的滞后,主要不在于技术,而在于内容、管理和服务意识。
因此,这次普查首要是整治政府网站的内容,解决群众反映强烈的“不及时、不准确、不回应、不实用”等问题。对普查中发现存在问题的网站,督促其整改,问题严重的坚决予以关停,切实消除政府网站“僵尸”、“睡眠”等现象。
可以说,普查是对全国现有的7万多个政府网站划定内容质量的底线,达标者要继续办好办强;不达标者整改或关闭。
记者通过深入调查发现,及时发布信息,准确发布信息,妥善回应网民关切,推出实用好用的内容,是政府信息公开部门的共识。但是,由于各种原因,他们在实际工作中遇到种种困难,制约了他们进一步做好政府网站。
【困境一】领导“互联网+政务”思维欠缺
现象:工作人员担心“做得越多错得越多”
某地级市政府网站的工作人员告诉记者,市政府主要领导思维比较传统,把政府官网看做自己工作的宣传窗口,只能报喜不能报忧。政府领导“恐网”、“怕网”的思维,也导致了政府网站投入的人力、资金不足,办好办活的自由度很低。
该工作人员透露,在实际工作中,大家都担心“做得越多错得越多”,所以在信息公开时,能不公开就不不公开;在回答网友的问题时,能不回答就不回答。
有怎样的领导就有怎样的员工。领导对网络持保守态度,网站工作人员自然不敢“乱说话”。所以才有某县政府网站的“来信选登”栏目,600多封百姓留言全是“您好,我们会尽快为您处理”的“神回复”。
透视:国家层面倒逼官员提升互联网思维
随着互联网的繁荣,从网上社交、到网上办事、到网上买卖,已经成为现实生活的一部分。政府如果在网上缺位,将无法与群众保持密切联系,无法打牢施政的民意基础和社会基础,也难以实施政府职能转变、简政放权、创新政府管理和服务方式,法治政府、阳光政府的建设将成为空话。
近年来,党中央、国务院先后印发了一系列重要文件,督促政府网站加强政府信息公开、提高政府公信力。在国家层面的强力推动下,加上互联网对社会生活的革新,越来越对的政府部门领导会重视网站的建设。此次在全国范围内开展的政府网站普查,只是引起各级政府部门领导重视的开端。
【困境二】人手不足、兼职者多,管理队伍建设严重滞后
现象:“僵尸网站”曝光后,有的假复活
日前,南方日报也对惠州市县镇三级的政府网站存在的“抛荒”现象进行了曝光,该市市委书记陈奕威对此做出批示,限时整改。
南方都市报跟进报道发现,惠州多数被曝光网站已开始整改,不过也有网站存在弄虚作假的嫌疑。比如,某统计局网站对首页“工作动态”、“经济普查”等栏目进行了多条信息更新,不过点击更新的网页浏览,才发现该局更新的内容基本都是“旧闻”,把去年甚至前年的信息拿出来重新发布。
有政府网站的有关负责人向记者“吐苦水”:网站更新的人手不足,网站管理人员一般身兼多职,要做很多类型的工作。这次普查只能“兵来将挡”。
人手短缺、流动快、兼职多,这是地方政府网站反映最多、最强烈的问题。在去年的全国政府网站工作交流会上,国务院副秘书长王仲伟指出了政府网站运维队伍建设的严峻问题:“有人提出,根据地方实践,省级政府网站的专职管理人员一般不能少于15人、地(市)级的不能少于5人、县(区)级的不能少于3人。这个要求实在是太低了……腾讯、新浪、百度等商业网站工作人员都在6000人以上,新华、人民、央视网人员在2000人以上……政府网站虽然跟普通商业网站不同,但是也要7×24小时滚动发布信息、365天不间断提供服务。没有一支稳定的专业队伍,不可能支撑下来。”
透视:政府领导,媒体运维
办政府网站是政治性和专业性都很强的工作,对从业者的的政治素质、专业能力要求较高。对从业人员既要加强培训,不断提高;还要提高准入门槛,严格把关,选拔具有政治、经济、传媒、法律、技术等知识背景的专业人才和复合型人才从事此项工作。
在人手不足的情况下,服务外包是各级政府网站建设与维护的惯常做法。如网站策划设计、软件开发、安全保障等,都可依靠外部力量完成。
据南方周末报道,中国政府网是国务院办公厅网站处领导,由新华网团队负责运营维护,“内容方面,国办用新华网稿源或直接向中国政府网供稿,稿件审核由网站负责”。现在省级政府门户网大都参照中国政府网的运营模式,由当地党委机关报业集团派出团队专门负责网站运营维护。
此外,政府部门还可以加强与新闻媒体协作。如广东省政府网站去年与南方新闻网共同策划的的粤东西北12市年考的访谈,打通了政府内部资源和媒体采编资源、用户资源,促成了一系列声势浩大的政民互动活动,就取得了良好的政策宣传效果。
【困境三】政府部门间协调难度大
现象:“既然他们不配合,就不用调研这个部门了”
政府网站,简单而言,就是将政府各部门的工作搬上网,纵向涉及各级人民政府,横向涉及各部委厅局。所以在建设阶段,统一规划的难度大;在日常运维阶段,协调发布信息的难度更大。
一位电子政务的项目经理在网上分享了网站项目建设的经历。那是某政府信息中心组织实施的项目,但“行政服务中心竟然不配合调研,理由是他们已经建设了一个并联审批系统,会在近期上线。”
该经理将情况反映给信息中心领导,领导说:“既然他们不配合,就不用调研这个部门了。只要你们按照我们的要求建设完成,我们就付款。”
政府内部的协调难问题可见一斑。
在内容建设的过程中更是如此。政府网站的一条信息、一次互动都可能需要多个部门、多次办理,甚至联合行动。由于不同行政机关职责不同、分工不同,既可能是“条条块块”分割造成的空白地带,也可能是职能交叉造成的重叠环节,这对跨部门间的通力合作就提出了很高的要求。
透视:“品牌化”运营调动各部门积极性
有专家指出,无论是政府网的建设初期,还是网站内容的运营过程中,建立健全支撑网站信息内容建设的协调机制都十分重要。政府的信息公开部门通常主管政府网站,应赋予信息公开部门更大的监督权。对有维护网站栏目职责或自有官网的职能部门,上级信息公开部门应有权对其进行考评,并将考评结果纳入该职能部门的年度考核中去。
有运营政府网站经验的媒体人士则表示,可以将网站栏目进行“品牌化”运营。即通过媒体手段优化各职能部门提供的内容和服务,使职能部门的工作亮点更突出、内容更抢眼球、用户体验更佳。当一个网站或栏目做得好,负责的职能部门的积极性就会提高,自然会配合网站的建设。
【困境四】互联网产品迭代太快 内容难接地气
现象:别让政府APP从“花瓶”变为“僵尸”
目前我国移动互联网用户规模已达近9亿,政府网站也在向移动端发展。
据新京报报道,近两年北京全市至少有20多个政府部门推出官方APP.这些“政府APP”涉及各个生活领域,包括查地铁线路、发票真伪、社保缴费情况,还可以“赏玩”故宫文物,甚至是通过APP举报干部“四风”问题。
那么,这些产品给公众的真实体验如何呢?新京报记者在体验过了17款“政府APP”后发现,这些APP的下载量“冷热不均”,有的仅有几十次下载量。同时,一些政府部门开发的APP下载不够方便,更新不及时等问题。
许多政府网站的工作人员表示,互联网特别是移动互联网产品迭代太快,许多商业网站都是狂烧风投的钱来不断“试错”,最后“剩者为王”。对于政府网站而言,既不能投入巨资开发一个前景不明朗的产品,又不能不跟进当前互联网市场的新产品,否则会因不接地气而被网民嫌弃。
透视:善用“大数据” 打通联系群众“最后一公里”
随着网络覆盖面和移动终端普及率的提高,不少政府部门在立足政府网站的建设之余,开始启用政务APP、微信公众号、基于“大数据”网格化治理系统等互联网产品,这无疑是向服务型政府转变的创新举措。
目前,广东多个地市在发展政府互联网产品方面已有诸多受到好评的实践。
在惠州,普通市民用APP就能参与市政设施维护:巡查人员和普通市民只需通过相应的手机APP实时上传到市政巡查平台,各类问题会由系统自动分发到各部门,相关人员就会跟进处理,这大大提高了市政设施维护的效率。
东莞石龙镇则基于广东地理信息服务平台的“大数据”探索出的企业风险应急预警系统用于监管企业,使当地劳资纠纷下降9成。
已进入“大数据”生活的佛山南海,通过“南海一点通”超级APP建立电子证照库,实现跨部门证照信息共享,办证人只需要一个基本证件(身份证或者企业数字证书)就可以关联其他所有证件,电子证照库能大大简化了业务办理流程,减少提交材料数量……
越来越多的政府部门利用取之于民的“大数据”中心开发出了形式多样的电子政务产品,用之于民,进一步密切了政府与人民群众的关系,同时在群众心中树立了良好的政府形象。
王仲伟则认为,要把政府网站内容建设提高到新水平,政府部门就要把握多媒体的传播规律,运用网民喜爱的数字化、图表化、可视化方式制作网络产品,使政府网站变得轻松、亲切、活泼;及时跟踪、充分吸纳网络新技术、新业务,善用微博微信、移动客户端、自适应等新技术,拓展网站新业态,形成立体化、多渠道传播格局。
第二篇:广播电视面临困境如何破局
浅谈市县级传统媒体面临困境如何破局
欧阳少迅
提语:当下广播电视面临体制瓶颈和多媒体科技快速发展等因素影响,导致电视事业发展受阻,收视率走低,而由此带来的问题就是公信力下降、自收自支能力下滑等。面对这样的情况,大家都在想招破局,但怎样的发展路子才能真正闯出困境,本文试以市县级传统媒体改革角度探讨破局思路。
目前,我国广播电视事业面临的问题诸多,主要矛盾都集中在了收视率严重下降,广播电视广告收益大幅滑坡,由此引发了人才流失、单位内部矛盾增加。这只是表面上的问题,更深层次讲,广播电视事业的发展水平也代表着一个国家对宣传舆论阵地的把控协调程度与文化传播的导向力度。
过去人们对互联网的出现也曾有过疑问,认为电脑普及,网络盛行,势必将使报纸快速走向消亡,但事实上到目前为止,纸媒借助网络仍有其生存的空间与土壤。同样,我们在看待自媒体高度发展的今天,是否还是同样否定广播电视等这样的传统媒体的存在意义呢?
根据前瞻产业研究院《2016-2021年中国电视台运营情况与发展战略规划分析报告》显示,2013上半年国内电视台收视率同比下降了2分钟至167分钟;2014年上半年同比下降4分钟;2015年上半年同比下降7分钟,收视量的减少幅度明显加大。特别是市县级广播电视事业在方兴未艾的自媒体面前,应对迟缓、举步维艰,收视率严重下滑,自营性广告也受到严重影响。虽说国内业界人士对于收视率调查一直存疑,之前也一直由国外调查公司来承担这项任务,有时同一家电视台的收视率会有两家调查公司给出不同数据的情况发生,之后各级电视台片面追求收视率指标也出现了不少造假事件的发生,但不管收视率调查本身的准确度如何,现实情况不容乐观还是有目共睹的。例如闽东地区市县级广播电视台五年前后对比,电视广告收益就呈明显下降趋势,据初步了解电视广告总体收入从2013年到2018年广告收益下降一半不止。
就市县级广播电视为例来说,造成电视收视率与广告效益下降的原因很多。除了与省级以上广播电视媒体相比,省级广播电视媒体占有资金、人才、政策、设备等绝对资源优势之外,市县级广播电视媒体还存在两大制约因素:
一是国家广播电视体制制约,市县级广播电视台属事业单位,以半企业化管理为模式,除了一部分财政保障之外,所有台聘人员工资靠电视广告收入为主。而做为事业单位既要行使部分行政职能,同时还要参与市场竞争,主体定位一直很尴尬。在工资福利待遇上就造成了多种层级,级别待遇最高的是行政职务人员,其次是正式事业编制人员,接着还有待遇比较差的台聘人员和临时聘用人员。这就是多年来电视界中出现“电视农民工”的问题根源。相对比,台聘人员干活多,收入少,正式编制人员干活少,收入多,成为业内普遍现象。而这一现象也造就了不少贪腐行为的发生。
二是移动科技水平的发展,让众多受众有了自己的选择与诉求,广播电视乃至纸媒网站的受众被大量分流。
广播电视是依赖科技发展而生存的,同时科技水平的提高也深刻地影响到了广播电视未来的发展方向。五年来,从地方到央视媒体都开始对广播电视事业未来发展进行了不少的探讨与试验,最终都趋向于传统媒体与新媒体之间进行整合,互利资源、共享优势。在2018年8月,中央首次对县级融媒体中心的建设作出重要批示,“县级融媒体中心”这个新型地方媒体机构也是第一次在国家级会议上被提及,这在中国媒体发展历史上无疑具有划时代意义。
“融媒体”“中央厨房”等关键词成为业内普遍热议的话题。以宁德市蕉城区新闻中心为例,蕉城区新闻中心是由区级宣传部下设的多个媒体部门的组合,这种构架从最初建立开始,意想不到地竟符合了如今融媒体的雏型,该新闻中心由区委宣传部直接领导,内设区委报道组、三都澳侨报、蕉城在线网站,同时还兼管区级广播电视台,在微信兴起之后其适时的成立了大梦蕉城微平台。虽然各部门之间相对独立运作,但整体管理上比其他区域的宣传媒体管理体系来得集中。蕉城新闻中心是事业单位参公管理形式(参照公务员管理模式),多年来一直不停跟进科技发展的脚步,关注国内新媒体发展的动向,在2018年10月,福建省第16届运动会期间,在闽东首次尝试以融媒体方式进行新闻报道。将各部门人员进行统一分工调配,利用先进的微平台直播设备,调动广播电视、网站、报纸的优势,在现场做第一时间的赛事直播,在新媒体上呈现第一现场,在传统媒体上进行二次深度报道。做到了一次采访拍摄,多渠道传播,在时效性与报道力度上都下足了功夫。随后,蕉城区融媒体中心也宣告正式成立。可以说蕉城区委宣传部的这次大胆举措,不仅在闽东媒体界引起强烈反响,也为国内市县级新闻媒体未来发展提供了一个很好的参照样本之一。
媒体整合是现在大部分媒体人的共识。之所以要整合就是因为传统媒体的自身优势仍然存在,电视闭路网络点对点、视频传送往高清方向提升、拥有一个专业的团队人才等,而对于新媒体来说,其传播快、反馈及时、受众多、深受人们欢迎。新“老”媒体这些优势都是媒体传播最为需要的,整合也就势在必行。
然而,说到传统媒体与新媒体的整合,在理论上在未来发展前景展望中虽然看好,却在具体实施中遇到了不少问题。其实,究其根源就是媒体现有体制管理出现瓶颈的问题。传统媒体的管理方式用的都是事业机关单位的管理模式,而人事编制却又有限,为解决这一问题各家电视台都成立了广告部门来解决自用人员的工资问题,可以说这种方法采用的是折衷主义,但随着形势的发展显然已经无法再维持下去。现在人事改革的呼声很高也正是因为诸如广播电视媒体这样的单位也同样遇到了这个问题而无法得到有效解决。
国家人事体制的改革正在逐步推进,关键在于做为基层政府如何先行先试,走出一条明朗的大道。
宁德市蕉城区融媒体中心,今年10月下旬揭牌成立,接下来一个全新的媒体机构如何运作就到了关键的节点。
暂且就县区级融媒体中心的基础构架做个设计吧,借鉴国内少数已经建成的融媒体机构做法,这个融媒体中心应分成五大组成部分,一是指挥调控中心,二是专业采编中心,三是媒体矩阵中心,四是技术支持平台,五是人才队伍。前三者都与技术有关,后两者与人员使用有关,这五大组成部分都要有一套科学合理且较为适应融媒体今后不断发展的运营管理体制的支撑。
图例说明
可以看出指挥调控中心是融媒体的核心与管理部分,所有图文与视频信息被收集到指挥调控中心,由调控中心进行筛选分配,一部分直接采做新闻分配到采编中心进行制作,另一部分需要指派采编中心记者进行新闻采访再回馈到指挥调控中心进行审核后,才再次分配到采编中心进行编辑,制作完成的所有信息都将通过多元矩阵分配到各平台进行发布。之所以将人才队伍列入五大部分之一,是因为所有的工作都无法离开人员的使用,全新的平台,高科技含量的工作都需要有一支高效、专业、专心的团队才能运转。仅一个指挥调控中心,就需要有资深的新闻专业知识、拥有较强的管理水平的管理人才担任。只有这样才可以对全媒体信息内容进行筛选分配、准确及时地指派任务,同时能监管各部门的实时工作进度。
融媒体运作与管理工作是高强度的、专业化的岗位,这就需要有一定数量的人才引进和与之相对应的福利待遇标准,而融媒体中心又时时与外界各媒体发生关系,如宣传部关于学习贯彻中央精神,需要通过中心将各个现场活动与会议新闻传播到各社区、乡镇。而社区与乡镇也会有各种需求通过中心向社会发布。就这样一个传播与反馈、再传播再反馈的过程来看,无疑是依托现代科技手段进行高效的信息产品生产与加工的过程。最能适应这种信息产品生产系统的显然要有一套行之有效的企业化管理模式与之相适应。
因此,一旦融媒体中心成立,就意味着原有的体制将无法满足其运作的需求,那么只有在事业体制基础上制定出企业化管理模式才是一个改革前进的方向,融媒体中心的企业化管理,有利于市场的对接,在对有用信息的采集基础上,生产出自己的信息产品推到需要的平台上,以移动端用户为主进行全媒体发布。
其改革内容重点:一是借鉴有效的国有企业管理体系。国内个别地方甚至还出现以公司托管的方式对融媒体中心进行管理,为何不是承包呢,显然这是一个国家宣传机构,话语权与管理者最终仍是宣传部为代表的官方政府,宣传部门要对融媒体中心所生产的信息进行有效把控。
二是建立有效引进人才的相对公平的按劳取酬福利待遇。只有这样才能让平台入驻更多的人才资源,并发挥出人才的最大作用。
三是以自愿原则对现有的员工进行分离,愿意留在事业体制内的和愿意进入企业化管理体系的都将明晰。
四是政府要舍得投入,建立一个较完善的融媒体中心不仅涉及到场所建设,还有硬件设备的购置和人员必要的开支,这是起步发展的物质前提。毕竟融媒体中心姓“公”,不姓“私”,要使其健康成长需要有肥沃的土地。
五是敢于尝试,大胆创新。从改革开放到现在,国家发展的每一步无不与此理念相关。
只有符合以上的环境,才能够让一个新生事物得到健康的成长。一个市县级融媒体中心的成立,就意味着一个区域内的全部媒体的深度整合,之前各干各活,各自为阵的局面就会变成统一利用资源,合力打造信息平台。
也许,有些业内人士会提出,这样是不是会造成信息的重复与浪费。其实,融媒体的成立是因为科技水平的发展促成的,我们看到如今手机用户热衷于更加方便随性地使用手机来获取信息与发布信息,而这种现象还将会有一个较长时期的存在,不管未来科技产品会使用户终端发生怎样的变化,个人对社会信息需求是不会有太大改变的。所以融媒体服务的重点是移动端受众这一理念也将长期存在和延续。其次,融入大媒体中的各家信息平台本身就有其自身的特性,从融媒体输出的信息,同样也可以结合自身的特点进行加工利用,比如蕉城新闻中心融媒体在对福建省第16届运动会蕉城体育馆赛事内容进行直播时,其属下的三都澳侨报对同一信息内容进行了深度报道,从而满足不同人对获取信息的不同需求。就算是完全采用同一信息进行发布,由于平台的不同,也增加了其受众的广泛性,在传播的广度上进行了有效的扩张。
面向未来展望媒体发展的远景,各市县级融媒体之间还会有一次升级融合的过程,区域与区域之间,县级与县级之间,省级与省级之间都将会有一个大融合的趋向性。而这种融合指的是信息之间的互相交换与利用,人才之间的流动。因为随着城际交通的完善,人们不再满足于本区域内的所需信息的获取,旅游、经商、求医、求学等都将更需要有相应的、个性化的信息产品产生。而做为地方政府之间也更需要有相应的政策、举措和经验的借鉴与交流。这种信息大融合将在未来很大可能性得到实现。
融媒体这一新型媒体结构,将会解构传统媒体,为我国我党的宣传阵地开辟出全新的一片天地。
第三篇:网站运维工程师岗位职责
网站运维工程师岗位职责:
岗位职责:
1、负责网站服务应用的日常升级、发布及维护;
2、负责部署并优化各类网站技术架构;
3、负责配合公司业务进度,技术支持各网站项目上线;
4、负责突发性事件的快速响应和处理,解决服务器和网络故障;
5、负责制定和实施网站各项目系统的资源规划、部署方案和运维方案;
6、负责编写网站项目的各类技术文档;
7、负责网站服务安装和系统升级及服务器维护,保障服务稳定安全可靠;
8、负责管理和配置软硬件的监控和应急响应,以确保7*24小时持续运作能力。
任职要求:
1、具备良好的沟通能力,善于表达;
2、计算机软件及相关专业本科及以上学历,3年以上网站项目运维工作经验;
3、熟练掌握linux(Centos redhat)和Windows server 等系统操作经验,对系统有一定了解;
4、熟悉Nginx、php、tomcat、iis、apache 等主流网站基础架构技术实现(至少一种);
5、熟悉Mysql、Mssql、Memcache、Redis等数据应用的优化,性能监控,备份恢复,提升数据应用性能;
6、对WEB高并发负载均衡技术、CDN、各类缓存技术有一定了解;
7、熟悉使用脚本语言Shell、Python、PHP等(至少一种);
8、具有一定阅读英文技术文档能力;
9、人品正直,工作态度认真负责,能吃苦耐劳,注重团队合作。
第四篇:岗位描述_网站运维工程师
岗位名称:运维工程师
岗位级别:助理运维工程师、运维工程师、高级运维工程师
岗位职责:
网站服务器托管、迁移、扩容等
网站服务器运行支持环境搭建配置
网站服务器环境安全与漏洞测试及修补
网站服务器环境运行效率与压力测试及优化
网站备案及相关运营资质办理
网站系统日常可连通性监控与数据备份
网站系统访问分析与流量监控及报告
网站系统代码安全与漏洞测试
网站系统代码运行效率与压力测试
公司办公设备日常维护
岗位要求:
网站服务器托管、迁移、扩容等
熟悉Windows、IIS、Apatch网站服务器运行支持环境搭建配置 网站服务器环境安全与漏洞测试及修补
网站服务器环境运行效率与压力测试及优化
网站备案及相关运营资质办理
网站系统日常可连通性监控与数据备份
网站系统访问分析与流量监控及报告
网站系统代码安全与漏洞测试
网站系统代码运行效率与压力测试
公司办公设备日常维护
第五篇:大型网站运维探讨和心得分享
大型网站运维探讨和心得分享
看到一篇不错的心得体会;相信我们做技术的都会有或多或少的担忧自己的未来职业发展,下面和大家一起来探讨一下。
一、什么是大型网站运维?
首先明确一下,全文所讲的”运维“是指:大型网站运维,与其它运维的区别还是蛮大的;然后我们再对大型网站与小型网站进行范围定义,此定义主要从运维复杂性角度考虑,如网站规范、知名度、服务器量级、pv量等考虑,其它因素不是重点;因此,我们先定义服务器规模大于1000台,pv每天至少上亿(至少国内排名前10),如sina、baidu、QQ,51.com等等;其它小型网站可能没有真正意义上的运维工程师,这与网站规范不够和成本因素有关,更多的是集合网络、系统、开发工作于一身的“复合性人才”,就如有些公司把一些合同采购都纳入了运维职责范围,还有如IDC网络规划也纳入运维职责。所以,非常重要一定需要明白:运维对其它关联工种必须非常了解熟悉:网络、系统、系统开发、存储,安全,DB等;我在这里所讲的运维工程师就是指专职运维工程师。我们再来说说一般产品的“出生”流程:
1、首先公司管理层给出指导思想,PM定位市场需求(或copy成熟应用)进行调研、分析、最终给出详细设计。
2、架构师根据产品设计的需求,如pv大小预估、服务器规模、应用架构等因素完成网络规划,架构设计等(基本上对网络变动不大,除非大项目)
3、开发工程师将设计code实现出来、测试工程师对应用进行测试。
4、好,到运维工程师出马了,首先明确一点不是说前三步就与运维工作无关了,恰恰相反,前三步与运维关系很大:应用的前期架构设计、软/硬件资源评估申请采购、应用设计性能隐患及评估、IDC、服务性能安全调优、服务器系统级优化(与特定应用有关)等都需运维全程参与,并主导整个应用上线项目;运维工程师负责产品服务器上架准备工作,服务器系统安装、网络、IP、通用工具集安装。运维工程师还需要对上线的应用系统架构是否合理、是否具备可扩展性、及安全隐患等因素负责,并负责最后将产品(程序)、网络、系统三者进行拼接并最优化的组合在一起,最终完成产品上线提供用户使用,并周而复使:需求->开发(升级)->测试->上线(性能、安全问题等之前预估外的问题随之慢慢就全出来了)在这里提一点:网站开发模式与传统软件开发完全不一样,网站一天开发上线1~5个升级版本是家常便饭,用户体验为王嘛,如果某个线上问题像M$需要1年解决,用户早跑光了;应用上线后,运维工作才刚开始,具体工作可能包括:升级版本上线工作、服务监控、应用状态统计、日常服务状态巡检、突发故障处理、服务日常变更调整、集群管理、服务性能评估优化、数据库管理优化、随着应用PV增减进行应用架构的伸缩、安全、运维开发工作: a、尽量将日常机械性手工工作通过工具实现(如服务监控、应用状态统计、服务上线等等),提高效率。
b、解决现实中服务存在的问题,如高可靠性、可扩展性问题等。
c、大规模集群管理工具的开发,如1万台机器如何在1分钟内完成密码修改、或运行指定任务?2000台服务器如何快速安装操作系统?各分布式IDC、存储集群中数PT级的数据如何快速的存储、共享、分析?等一系列挑战都需运维工程师的努力。在此说明一下其它配合工种情况,在整个项目中,前端应用对于网络/系统工程师来说是黑匣子,同时开发工程师职责只是负责完成应用的功能性开发,并对应用本身性能、安全性等应用本身负责,它不负责或关心网络/系统架构方面事宜,当然软/硬件采购人员等事业部其它同事也不会关心这些问题,各司其职,但项目的核心是运维工程师~!所有其它部门的桥梁。
上面说了很多,我想大家应该对运维有一些概念了,在此打个比方吧,如果我们是一辆高速行驶在高速公路上的汽车,那运维工程师就是司机兼维修工,这个司机不简单,有时需要在高速行驶过程中换轮胎、并根据道路情况换档位、当汽车速度越来越快,汽车本身不能满足高速度时对汽车性能调优或零件升级、高速行进中解决汽车故障及性能问题、时刻关注前方安全问题,并先知先觉的采取规避手段。这就是运维工作~!
最后说一下运维工程师的职责:”确保线上稳定“,看似简单,但实属不容易,运维工程师必须在诸多不利因素中进行权衡:新产品模式对现有架构及技术的冲击、产品高频度的升级带来的线上BUG隐患、运维自动化管理承度不高导致的人为失误、IT行业追求的高效率导致流程执行上的缺失、用户增涨带来的性能及架构上的压力、IT行业宽松的技术管理文化、创新风险、互联网安全性问题等因素,都会是网站稳定的大敌,运维工程师必须把控好这最后一关,需具体高度的责任感、原则性及协调能力,如果能做到各因素的最佳平衡,那就是一名优秀的运维工程师了。
另外在此聊点题外话,我在这里看到有很多人要sina、QQ、baidu,51.com等聊自已的运维方面的经验,其实这对于它们有点免为其难:
a、各公司自已网络架构、规模、或多或少还算是公司的核心秘密,要保密,另外,对于大家所熟知的通用软件、架构,由于很多公司会根据自已实际业务需要,同时因为原版性能、安全性、已知bug、功能等原因,进行过二次开发(如apache,php,mysql),操作系统内核也会根据不同业务类型进行定制的,如某些应用属于运算型、某些是高IO型、或大存储大内存型。根据这些特点进行内核优化定制,如sina就在memcache上进行过二次开发,搞出了一个MemcacheDB,具体做得如何我们不谈,但开源了,是值得称赞的,国内公司对于开源基本上是索取,没有贡献;另外,服务器也不是大家所熟知的型号,根据业务特点,大部份都是找DELL/HP/ibm进行过定制;另外,在分布式储存方面都有自已解决方案,要不就是使用现成开源hadoop等解决方案,或自已开发。但90%都是借鉴googleGFS的思想:分布式存储、计算、大表。
b、各公司业务方向不一样,会导致运维模式或方法都不一样,如51.com和baidu运维肯定区别很大,因为他们业务模式决定了其架构、服务器量级、IDC分布、网络结构、通用技术都会不一样,主打新闻门户的sina与主打sns的51.com运维模式差异就非常大,甚至职责都不大一样;但有一点,通用技术及大致架构上都大同小异,大家不要太神化,更多的公司只是玩垒积木的游戏罢了,没什么技术含量。
c、如上面所讲,目前大型网站运维还处于幼年时期理念和经验都比较零散,没有成熟的知识体系,可能具体什么是运维,大家都要先思索一番,或压根没想过,真正讨论也只是运维工作的冰山一角,局限于具体技术细节,或某某著名网站大的框架,真正运维体系化东西没有,这也许是目前网上运维相关资料比较少的原故吧。或者也是国内运维人员比较难招,比较牛的运维工程师比较少见的原因之一吧。
二、运维工作师需要什么样的技能及素质
做为一名运维工程师需要什么样的技能及素质呢,首先说说技能吧,如大家上面所看到,运维是一个集多IT工种技能与一身的岗位,对系统->网络->存储->协议->需求->开发->测试->安全等各环节都需要了解一些,但对于某些环节需熟悉甚至精通,如系统(基本操作系统的熟悉使用,*nix,windows..)、协议、系统开发(日常很重要的工作是自动运维化相关开发、大规模集群工具开发、管理)、通用应用(如lvs、ha、webserver、db、中间件、存储等)、网络,IDC拓朴架构; 技能方面总结以下几点:
1、开发能力,这点非常重要,因为运维工具都需要自已开发,开发语言:c/c++(必备其中之一)、perl、python、php(其中之一)、shell(awk,sed,expect….等),需要有过实际开发经验,否则工作会非常痛苦。
2、通用应用方面需要了解:操作系统(目前国内主要是linux、bsd)、webserver相关(nginx,apahe,php,lighttpd,java。。)、数据库(mysql,oralce)、其它杂七八拉的东东。。系统优化,高可靠性。。这些只是加分项,不需必备,可以边工作边慢慢学,这些东西都不难。当然在运维中,有些是有分工偏重点不一样。
3、系统、网络、安全,存储,CDN,DB等需要相当了解,知道其相关原理。个人素质方面:
1、沟通能力、团队协作:运维工作跨部门、跨工种工作很多,需善于沟通、并且团队协作能力要强;这应该是现代企业的基本素质要求了,不多说。
2、工作中需胆大心细:胆大才能创新、不走寻常路,特别对于运维这种新的工种,更需创新才能促进发展;心细,运维工程师是网站admin,最高线上权限者,一不小心就会遗憾终生或打入十八层地狱。
3、主动性、执行力、精力旺盛、抗压能力强:由于IT行业的特性,变化快;往往计划赶不上变化,运维工作就更突出了,比如国内各大公司服务器往往是全国各地,哪里便宜性价比高,就那往搬,进行大规模服务迁移(牵扯的服务器成百上千台),这是一个非常头痛的问题;往往时间非常紧迫,如限1周内完成,这种情况下,运维工程师的主动性及执行力就有很高的要求了:计划、方案、服务无缝迁移、机器搬迁上架、环境准备、安全评估、性能评估、基建、各关联部门扯皮,7X24小紧急事故响应等。
4、其它就是一些基本素质了:头脑要灵光、逻辑思维能力强、为人谦虚稳重、亲和力、乐于助人、有大局观。
5、最后一点,做网站运维需要有探索创新精神,通过创新型思维解决现实中的问题,因为这是一个处于幼年的职业(国外也一样,但比国内起步早点),没有成熟体系或方法论可以借鉴,只能靠大家自已摸索努力。
三、怎样才算是一个合格的运维工程师
1、保证服务达到要求的线上标准,如99.9%;保证线上稳定,这是运维工程师的基本责职所在。
2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性、和创新思维。
3、网站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。
4、通过创新思维解决运维效率问题;目前各公司大部份运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。
5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。
6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。
7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。以上只是技术上的一些层面,当然个人意识也是很重要的。
四、运维职业的迷惘、现状与发展前景
运维岗位不像其它岗位,如研发工程师、测试工程师等,有非常明确的职责定位及职业规划,比较有职业认同感与成就感;而运维工作可能给人的感觉是哪方面都了解一些,但又都比上专职工程师更精通、感觉平时被关注度比较低(除非线上出现故障),慢慢的大家就会迷惘,对职业发展产生困惑,为什么会有这种现象呢?除了职业本身特点外,主要还是因为对运维了解不深入、做得不深入导致;其实这个问题其它岗位也会出现,但我发现运维更典型,更容易出现这个问题;
针对这个问题我谈一下网站运维的现状及发展前景(也在思考中,可能不太深入全面,也请大家斧正补充)运维现状:
1、处于刚起步的初级阶段,各大公司有此专职,但重视或重要承度不高,可替代性强;小公司更多是由其它岗位来兼顾做这一块工作,没有专职,也不可能做得深入
2、技术层次比较低;主要处于技术探索、积累阶段,没有型成体系化的理念、技术。
3、体力劳动偏大;这个问题主要与第二点有关系,很多事情还是依靠人力进行,没有完成好的提练,对于大规模集群没有成熟的自动化管理方法,在此说明一下,大规模集群与运维工作是息息相关的如果只是百十来台机器,那就没有运维太大的生存空间了。
4、优秀运维人才的极度缺乏;目前各大公司基本上都靠自已培养,这个现状导致行业内运维人才的流动性非常低,非常多好的技术都局限在各大公司内部,如google50万台机器科学的管理,或者国内互联公司top10的一些运维经验,这些经验是非常有价值的东西并决定了一个公司的核心竞争力;这些问题进而导致业内先进运维技术的流通、贯通、与借签,并最终将限制了运维发展。
5、很多优秀的运维经验都掌握在大公司手中;这不在于公司的技术实力,而在于大公司的技术规模、海量PV、硬件规模足够大,如baidu可怕的流量、51.com海量数据~~~~这些因素决定了他们遇到的问题都是其它中/小公司还没有遇到的,或即将遇到。但大公司可能已有很好的解决方案或系统。发展前景:
1、从行业角度来看,随着中国互联网的高速发展(目前中国网民已跃升为全球第一)、网站规模越来越来大、架构越来越复杂;对专职网站运维工程师、网站架构师的要求会越来越急迫,特别是对有经验的优秀运维人才需求量大,而且是越老越值钱;目前国内基本上都是选择毕业生培养(限于大公司),培养成本高,而且没有经验人才加入会导致公司技术更新缓慢、影响公司的技术发展;当然,毕业生也有好处:白纸一张,可塑性强,比较认同并容易融入企业文化。
2、从个人角度,运维工程师技术含量及要求会越来越高,同时也是对公司应用、架构最了解最熟悉的人、越来越得到重视。
3、网站运维将成为一个融合多学科(网络、系统、开发、安全、应用架构、存储等)的综合性技术岗位,给大家提供一个很好的个人能力与技术广度的发展空间。
4、运维工作的相关经验将会变得非常重要,而且也将成为个人的核心竞争力,具备很好的各层面问题的解决能力及方案提供、全局思考能力等。
5、特长发控和兴趣的培养;由于运维岗位所接触的知识面非常广阔,更容易培养或发挥出个人某些方面的特长或爱好,如内核、网络、开发、数据库等方面,可以做得非常深入精通、成为这方面的专家。
6、如果真要以后不想做运维了,转到其它岗位也比较容易,不会有太大的局限性。当然了,你得真正用心去做。
7、技术发展方向、网站/系统架构师。
五、运维关键技术点解剖
1、大规模集群管理问题
首先我们先要明确集群的概念,集群不是泛指各功能服务器的总合,而是指为了达到某一目的或功能的服务器、硬盘资源的整合(机器数大于两台),对于应用来说它就是一个整体,目前常规集群可分为:高可用性集群(HA),负载均衡集群(如lvs),分布式储、计算存储集群(DFS,如googlegfs,yahoohadoop),特定应用集群(某一特定功能服务器组合、如db、cache层等),目前互联网行业主要基于这四种类型;对于前两种类似,如果业务简单、应用上post操作比较少,可以简单的采用四层交换机解决(如f5),达到服务高可用/负责均衡的作用,对于资源紧张的公司也有一些开源解决办法如lvs+ha,非常灵活;对于后两种,那就考验公司技术实力及应用特点了,第三种DFS主要应用于海量数据应用上,如邮件、搜索等应用,特别是搜索要求就更高了,除了简单海量存储,还包括数据挖掘、用户行为分析;如google、yahoo就能保存分析近一年的用户记录数据,而baidu应该少于30天、soguo就更少了。。这些对于搜索准备性、及用户体验是至关重要的。接下来,我们再谈谈如何科学的管理集群,有以下关键几点: I、监控
主要包括故障监控和性能、流量、负载等状态监控,这些监控关系到集群的健康运行,及潜在问题的及时发现与干预;
a、服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;例如针对前端webserver,我们就可以有很多种类型的监控,包括应用端口状态监控,便于及时发现服务器或应用本身是否crash、通过icmp包探测服务器健康状态,更上层可能还包括应用各频道业务的监控,常用方法是采用面业特征码进行判断,或对重点页面进行签名,以网站被黑篡改(报警、并自动恢复被篡改数据)等等,这些只是一部份,还有N多监控方式,依应用特点而定,还有一些问题需解决,如集群过大,如何高性能的进行监控也是一个现实问题。
b、其它就是集群状态类的监控或统计,为我们合理管理调优集群提供数据参考、包括服务瓶颈、性能问题、异常流量、攻击等问题。II、故障管理 a、硬件故障问题;对于成百上千或上万机器的N多集群,服务器死机、硬件故障概率是非常大的,几乎每时每刻都有服务硬件问题,死机、硬盘损坏、电源、内存、交换机。针对这种情况,我们在设计网站架构时需要充分考虑到这些问题,并将其视为常态;更多的依靠应用的冗余机制来规避这种风险,但给系统工程师足够宽裕的处理时间。(如google不是号称同时死800台机器,服务不会受到任何影响吗);这就是考验运维工程师及网站架构师功能的地方了,好的设计能达到google所描述自恢复能力,如gfs,糟糕的设计那就是一台服务器的死机可能会造成大面积服务的连锁故障反映,直接对用户拒绝响应。
b、应用故障问题;可能是某一bug被触发、或某一性能阀值被超越、攻击等情况不一而定,但重要的一点,是要有对这些问题的预防性措施,不能想当然,它不会出问题,如真出问题了,如何应对?这需要运维工程师平时做足功夫,包括应急响应速度、故障处理的科学性、备用方案的有效等。III、自动化
自动化:简而言之,就是将我们日常手动进行的一些工作通过工具,系统自动来完成,解放我们的双手及枯燥的重复性劳动,例如:没有工具前,我们安装系统需要一台一台裸机安装,如2000台,可能需要10人/10天,搞烂N张光盘,人力成本更大。。而现在通过自动化工具,只需几个简单命令就能搞定、还有如机器人类程序,自动完成以往每天人工干预的工作,使其自动完成、汇报结果,并具备一定的专家系统能力,能做一些简单的是/非判断、优化选择等。。这些好处非常明显不再多说。。应该说,自动化运维是运维工程师职业化的一个追求,利已利公,虽然这是一个异常艰巨的任务:不断变更的业务、不规范化的应用设计、开发模式、网络架构变更、IDC变更、规范变动等因素,都可能会对现有自动化系统产生影响,所以需要模块化、接口化、变因参数化等因此,自动化相关工作,是运维工程师的核心重点工作之一,也是价值的体现。
2、运维中关键技术点解剖(比较实际,现实中的案例,今天先想出这几条,如大家有其它感觉兴趣的,可以提出,一起交流~)
1、大量高并发网站的设计方案
2、高可靠、高可伸缩性网络架构设计
3、网站安全问题,如何避免被黑?
4、南北互联问题,动态CDN解决方案
5、海量数据存储架构