第一篇:数据分析师眼中的数据真相
数据分析师眼中的数据真相
随着大数据概念的普及和人们对数据价值认识的不断深入,数据分析越来越受到人们的重视,尤其是在企业中,现在很多做销售、市场的企业人员已经开始用数据说话,很多企业也已经开始借助数据进行决策和管理,量化经营的理念正逐步深入人心。与此同时,专业的数据分析师也逐渐进入人们的视野,被评为未来十年最有前途的十大职业之一。
作为一名数据分析师,数据的真伪。因为随着数据产生量的爆炸式增长,断出现,人为造成的,从而造成错对待这类数据不能人云亦云,1、失业率
4%以下作为一项重要的执政业率似乎比我们首先应
世界上大多数国家都采用两种失业统计方法。一种是行政登记失业率,另一种是劳动力抽样调查失业率。两种失业率都是政府决策的重要依据。中国之前一直采用城镇登记失业率来衡量失业情况。城镇登记失业率是指在报告期末城镇登记失业人数占期末城镇从业人员总数与期末实有城镇登记失业人数之和的比重。分子是登记的失业人数,分母是从业的人数与登记失业人数之和。在城镇单位从业人员中,不包括使用的农村劳动力、聘用的离退休人员、港澳台及外方人员。城镇登记失业人员是指有非农业户口,在一定的劳动年龄内(16岁以上及男50岁以下、女45岁以下),有劳动能力,无业而要求就业,并在当地就业服务机构进行求职登记的人员。
由城镇登记失业率的计算方法我们不难看出,一系列限制使得这一指标的代表性大为降低。由于很多真正失业的人不一定去登记,加上农村的农民就业没有包括在里面,而最近几年2.5亿农民工群体已成为一支不容忽视的就业群体,而且随着人们寿命的延长,45到60岁之间的人仍工作在第一线,然而他们却都没有被纳入到城镇登记失业率的统计范围之内,字,比调查失业率要低。也是造成实
正是基于城镇登记失业率这些明显的缺陷,中国政府决定,不再使用“城镇登记失业率”这一指标,而采用“9月9日,中国首次向外公开了调查失业率的有关数据。《金融时“今年以来,中国经济运行稳中有进,上半年GDP5%2.4%的二季度均为4.1%
在美国和西班牙交战期间,美国海军的死亡而同时期纽约居民的死亡率是千分之十六。后来,海军征兵人员因为这两个数字根本就是不匹配的,当兵的一般都是身强力壮的年轻人,而居民的死亡率是包括老弱病残等各类人群的一个综合数据,而老弱病残者又是主要的死亡人群构成者,这些人拉抬了整个居民的死亡率。所以正常应该是用同年龄段的海军和纽约居民的死亡率来作对比,从而判断参军是否安全。一般情况下,相同年龄段的海军死亡率应该是高于居民死亡率的。
这一案例说明数据之间要具有匹配性才能进行对比。不具有可比性的数据有时候会很隐蔽。不容易发现,这就需要分析师有更敏锐的观察能力。比如某个零售企业想计算2013年11月前十天的销售比去年同期增长了多少,表面上来看这两个数据是可以直接对比的,有匹配性。实际上对以规律性非常强的零售企业来说,周末对销售的影响是非常大的。翻开日历会发现,2013年11月的1~10日比2012年11月同期多一个“星期天”,这就容易使对比结果出现误差。因此,对零售企业来说,最好以周来进行对比。
三、离婚率
群是离婚主力军,36~50岁年龄段是婚姻平稳期,50从教育背景看,学历高低与离婚率高低成反比,学历越高,离婚率越低。/结婚总数,乍一看,没有任何问题。以2012年离婚数除以2012年离婚的人和结婚的人根
2002年结婚人群在2012年的离婚率=2002年结婚且20122002年结婚人群从2002每年都计算一个离婚率的话,还可以分析每即通常所说的七年之
实际生活中这样的例子还有很多。有时候是数据的确有错误,有时候数据虽然正确,但计算方法或者使用场合不正确,或者对比不匹配,同样会误导我们。因此,虽然我们不能每个人都成为数据分析师,但多尝试从数据背后看问题,多培养数据敏感性,仍然会使我们获益匪浅。
第二篇:数据分析师怎么写报告
数据分析师怎么写报告
【数据哥注】先说说写一份好的数据分析报告的重要性,很简单,因为分析报告的输出是你整个分析过程的成果,是评定一个商业项目、一个产品、一个运营事件的定性结论,很可能是产品决策的参考依据,既然这么重要那当然要写好它了。---我是分割线---随着时代的发展,人们每天在互联网上产生大量的数据,对于企业来讲这些数据都是十分宝贵的资源。企业可通过数据挖掘进行战略调整以及营销部署,尤其是对于互联网公司而言,用户行为产生的数据就是企业最宝贵的资源。数据挖掘(Datamining),又译为资料探勘、数据挖掘、数据采矿。它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关。不过目前为止,在企业中存在着很大的数据分析问题,如何进行数据分析,数据挖掘的结果要如何展示,企业中各个部门要如何才能最大化的利用数据分析结果。这些一直困扰着数据团队。数据分析在企业主要是由于业务需求驱动的,但从数据分析师角度来看数据分析并不是简单的坐在那里等需求,需求来了就做没有需求就坐在那里等。数据分析师需要进行思考。思考一:数据分析的需求方是谁,是公司的领导层还是销售,还是市场团队或者产品团队。思考二:企业有什么样的资源,企业有什么样的数据,如何将需求方与数据本身的价值进行串联,这是一个非值得思考的方向。在企业中同样一份数据报告的需求方有很多,但肯定不是全部的人都需要。作为数据团队,将有效的数据传递给最需要的人,这样才能更大更好的发挥数据本身的价值。数据分析师需要思考在一个企业中,对于各个部门员工的数据培训是不可少的,由于数据报告主要面向企业内部的员工,如何让员工具有一定的数据解读能力就显得非常必要。企业知识管理同样是数据团队重要的工作之一,数据团队将每天分析完的数据转化为知识,让每一个需要的人都可以随时随地的得到想要的数据信息。也就不再需要让数据团队将已经存档完毕的数据从新拿出来。作为数据分析团队,在进行数据解读的时候需要具有独到的看法,比如:案例1:老杜有五个女儿,那么他第六个孩子一定是个儿子。案例2:有三组彩票号码,这三组哪一个中奖率最高?哪一个最低?案例3:某市嚼口香糖的人和心脏病去世的人同时升高,嚼口香糖可导致心脏病发作。其实我们可以发现,这些数据事件中的因果关系并不明确。第一,男孩和女孩的几率都是一样的,前五个是女孩但是第六个仍然有一半的几率是女孩。第二,虽然每组数字让我们都有所联想,但事实上每组数字的中奖率都是一样的。第三,并没有直接的数据证明嚼口香糖会导致心脏病,所以这个数据只能说明这个城市的人口增加了,人口基数的变化造成了这样的数据结果。这是很多人在进行数据解读时犯的错误,只是关注数据的相关性,从相关性解释数据的因果性。比如,经过统计,用户喜欢在一大堆文字或者有电话号秘密的地方点击暂停......作为数据分析人员需要掌握以下十种重要的技巧第一:会用一款或以上的数据分析工具第二:经常浏览数据统计的网站第三:在数据分析前先进行调研第四:在分析数据的时候用户体验的角度出发的么并不是以公司利益为主。第五:了解数据采集的方式以及数据内容和质量内容第六:熟悉各种样式低量和定位的不同第七:做一个饥渴的探索者第八:在企业内部有效的沟通着第九:街头智慧第十:防御中带有进攻。在企业中,数据分析师的角色十分重要。没有数据指引的企业犹如没头苍蝇到处乱飞,相比之下,企业的决策层可以根据数据挖掘提供的相关报表完成企业战略发展的制定。对于数据分析师来说,如何将企业收集的杂乱数据进行分析处理,最终为其他部门提供一份清晰明朗的数据报告就显得格外重要。
第三篇:项目数据分析师事务所
项目数据分析师事务所
1.事务所应该是什么性质的企业?命名有标准吗?如何为事务所起一个规范的名称?
答:申请事务所应该具备独立的法人资格,一般是以股份制形式成立的有限责任公司。协会对事务所的命名是有标准要求的,按照要求,事务所的全称应为:(城市名)市(事务所名称)项目数据分析师事务所有限责任公司
2.在地方城市的工商局能注册成“事务所”吗?
答:事务所的注册首先需要得到协会审批,之后才可以向地方工商部门申请注册。按照协会流程,申请人需先申报事务所预备案,通过后,持协会出具的相关文件,向工商部门申请事务所核名。事务所名称中必需包含“数据分析”和“事务所”字样。目前还未遇到持协会文件在工商部门无法审批含有“事务所”名称的地区。
3.事务所业务范围?
答:事务所的业务范围应为:(包括但不限于:行业数据分析、投资数据分析、经营数据分析、运营风险数据分析、决策数据分析、编制项目数据分析报告等),战略咨询,营销策划,投融资设计与服务等。
4.成立事务所应具备哪些基础条件,按照哪些流程进行?
答:成立事务所应具备的基础条件如下:
a)拥有一定数量的项目数据分析师(协会目前要求至少为5名以上),项目数据分析师必须持有协会颁发的《项目数据分析师证书》,并且证书在有效期内;
b)事务所注册资金在50万以上;
c)拥有一定的业务基础及运营思路,坚持良好的商业诚信。
d)能够遵守行业准则,接受协会监督管理。
成立事务所一般的流程是:
1)有成立事务所的想法后,要为成立事务所做一些前期准备工作,比如联络几个志同道和的项目数据分析师,并且凭借现有资源提前做一些市场调研,寻找业务需求,在具有一定业务基础的条件下成立事务所;
2)向协会会员处咨询入会方式,参加会员处定期组织的创业指导活动;
3)事务所预备案:到协会网站“下载中心”下载《数据分析事务所成立预备案及入会申请报告(格式)》,按要求填写电子版各种表格,填写后发邮件给会员处进行初审,会员处反馈意见后按要求补充或调整表格内容,完善后邮寄正式申报材料;
4)符合条件的预备案申请将由会员处统一出具面向当地工商部门的相关文件,由申请人持文件正本向当地工商局做出核名申请;
5)通过正式核名并获得营业执照后,申请人需将之前填报的《数据分析事务所成立预备案及入会申请报告(格式)》正本加盖公章后提交正式入会申请;
6)会员处按流程审核申请,并于10个工作日内通知申请人审批结果;
7)协会向通过审批的事务所发放资质;
5.事务所需要协会批吗?
答:事务所在到工商部门核名前,必须先到协会进行预备案审批,申请人持相关文件才能得到工商部门的批准。事务所申报资料准备目录:入会申请书;项目数据分析师名单及每名项目数据分析师的证书、身份证复印件;申请人简历及身份证复印件;团体会员申请登记表;事务所章程;事务所运营方案,经中国商业联合会数据分析专业委员会审批合格后方可办理。
6.现在全国有事务所吗?哪些地方有?有多少家?
答:目前全国一共60多家项目数据分析师事务所,事务所遍布全国10多个省市自治区,比如北京、陕西、浙江、江西、山东、江苏、新疆、甘肃等。
7.一般事务所有多少人从业?
答: 一般事务所的规模在15-20人左右,有些规模大的已经发展到40人以上。目前,在协会已审批的数据分析事务所中,50%以上都是建立在原有的会计师事务所、资产评估事务所等基础上的,根据以往的经验,建议事务所优先选择原有内部人才进行培养。这样做主要是因为事务所原有人才对公司的忠诚度较高,对业务及流程更为熟悉,愿意与公司共同发展。因此,对业务及人员的稳定会有很大促进作用。
8.项目数据分析的业务都从哪里来?
答:目前事务所普遍的项目数据分析业务主要来源于以下几个方面:
1)在当地做各种有效的广告和宣传,会有项目主动找上你;
2)利用自身已有的客户资源,去挖掘其进一步的数据分析需求;
3)请求协会帮助,共同开发当地政府、组织及相关资源,展开行业合作,为事务所在当地开展业务提供更多便利;
4)以上为事务所普遍采用的业务开拓方式,各事务所还需因地制宜,找到拓展地方市场最为有效的方法。
9.事务所能从事法定业务吗?未来能从事法定业务吗?
答:首先要说明项目数据分析师事务所现在没有法定业务,未来更不会有法定业务。针对这个老生常谈的话题,说明三个问题:
1)中国的经济将越来越市场化,“反垄断法”也出台了,很多原来政府垄断的行业现在也全面市场化了。所谓的法定业务,总让人不自觉地与“垄断”相联系,其实不然,真正的法定业务只可能是应特种行业或特种业务的需要而产生的,它是因为某些行业不能完全放开市场而形成的特殊性质的“垄断”。政府有个很明确的观点:企业的市场行为应该让市场去鉴定和评价。所以,对于有着明确的全市场特征的数据分析业而言,这种特殊的垄断是不可能形成的。
2)数据分析业务中很重要的一个特点是“预测”,它要求分析师具有很强的经验性和判断性,这与会计师行业的已发生的、历史的数据有着本质上的区别。科学性和艺术性的高度一致是数据分析师们追求的目标,但这也意味着它无法具备“法定业务”中所要求的特有的公正性。
3)法定业务是国家相关部门赋予行业的部分特殊权力,同时一定也意味着相应的监督和限制,比如收费的限制、业务范围的限制等等,清晰的规范意味着利润空间的固定和狭窄,而数据分析业恰恰由于其工作的复杂性和分析的多样性,造成了其高利润的行业特点。从某个角度上看,“法定业务”并不像想象的那么美好。
10.一年能接多少个业务?业务额都是多少?
答:由于各地经济发展水平不同,事务所之间的业务数量差距较大。目前事务所年业务额平均超过百万。此外,事务所经营能力强弱也会对业务量产生直接影响,以北京地区为例,一些事务所之间的业务量相差达2-3 倍之多。
11.事务所盈利吗?能给我介绍业务吗?
答:目前,绝大部分事务所都在盈利,行业整体发展形势旺盛。但任何一个行业都存在优胜劣汰,事务所的盈利是取决于事务所自身经营能力强弱的,并不能因为行业旺盛,就忽视事务所自身经营能力的培养。事务所一旦加入成为协会会员单位,就将共享协会带来的一些资源,比如业务资源和平台资源。协会不定期接到客户的咨询电话,希望协会可以为他们推荐事务所来提供报告服务,那么,协会会将这些业务根据客户所在地及相关要求向他们推荐相对应的事务所。同时,协会搭建的包括项目数据分析服务平台在内的各种平台资源,事务所也将共享,经过评估如果有一些好的项目,事务所可通过协会平台帮助客户推荐投资机构,帮助其实现融资。
12.协会可以为事务所提供一些经营上的帮助吗?
答:协会对事务所的经营帮助主要体现在支撑职能上,如不定期举办的创业指导以及为优秀融资项目推荐投资机构等。事务所可以经常与协会沟通,对经营中的困难及时反映,主动寻求协会的帮助。
13.什么是项目数据分析报告?
答:项目数据分析报告是确定项目投资价值的重要依据。它通过数据分析,量化展现项目的收益性、风险性,为决策提供了充分的支持。项目数据分析报告包含环境评价、国民经济评价、财务评价、社会效益评价四大体系,深受国内外投融资机构的信赖。随着项目数据分析报告在中国越来越广泛的应用,目前,它已经逐渐成为投资金融机构进行项目投资初始判断的最佳依据。
14.项目数据分析报告及服务与商业计划书和可行性研究报告的区别?
答:商业计划书侧重于对项目盈利模式进行描述说明,理论性较高,主要用于论证项目盈利结构的合理性;可行性研究报告侧重于对项目是否可行进行论证,结论相对单一。项目数据分析报告是立足于项目收益与风险预测,运用“定量”的精确分析思想来对项目进行论证。通过数据采集和模型分析,不但论证了项目盈利模式的合理性、项目实践的可行性,还对项目盈利能力及抗风险能力的强弱、项目投资价值进行了深入评估,最终得出项目评价及建议。同时,项目数据分析报告是带着企业战略目标和发展理念去评价整个项目和经营情况,更加符合企业自身特点的分析、判断和评价。
第四篇:数据分析师个人工作总结
数据分析个人工作总结
在数据分析岗位工作三个月以来,在公司领导的正确领导下,深入学习关于淘宝网店的相关知识,我已经从一个网店的门外汉成长为对网店有一定了解和认知的人。现向公司领导简单汇报一下我三个月以来的工作情况。
一、虚心学习,努力提高网店数据分析方面的专业知识
作为一个食品专业出身的人,刚进公司时,对网店方面的专业知识及网店运营几乎一无所知,曾经努力学习掌握的数据分析技能在这里根本就用不到,我也曾怀疑过自己的选择,怀疑自己对踏出校门的第一份工作的选择是不是冲动的。但是,公司为我提供了宽松的学习环境和专业的指导,在不断的学习过程中,我慢慢喜欢上自己所选择的行业和工作。一方面,虚心学习每一个与网店相关的数据名词,提高自己在数据分析和处理方面的能力,坚定做好本职工作的信心和决心。另一方面,向周围的同同事学习业务知识和工作方法,取人之长,补己之短,加深了与同事之间的感情。
二、踏实工作,努力完成领导交办的各项工作任务
三个月来,在领导和同事们的支持和配合下,自己主要做了一下几方面的工作:
1.汇总公司的产品信息日报表,并完成信息日报表的每日更新,为产品追单提供可靠依据。
2.协同仓库工作人员盘点库存,汇总库存报表,每天不定时清查入库货品,为各部门的同事提供最可靠的库存数据。
3.完成店铺经营月报表、店铺经营日报表。
4.完成每日客服接待顾客量的统计、客服工作效果及工作转化率的查询。5.每日两次对店铺里出售的宝贝进行逐个排查,保证每款宝贝的架上数的及时更新,防止出售中的宝贝无故下架。
6.配合领导和其他岗位的同事做好各种数据的查询、统计、分析、汇总等工作。做好数据的核实和上报工作,并确保数据的准确性和及时性。
7.完成领导交代的其它各项工作,认真对待、及时办理、不拖延、不误事、不敷衍,尽量做到让领导放心和满意。
三、存在的不足及今后努力的方向
三个月来,在公司领导和同事们的指导和配合下,自己虽然做了一些力所能
及的工作,但还存在很多的不足,主要是阅历浅,经验少,有时遇到相对棘手的问题考虑欠周密,视角不够灵活,缺乏应变能力;理论和专业知识不够丰富,导致工作有时处于被动等等。另外,由于语言不通的问题,在与周围的同事沟通时,存在一定的障碍。
针对以上不足,在今后的工作中,自己要加强学习、深入实践、继续坚持正直、谦虚、朴实的工作作风,摆正自己的位置,尊重领导,团结同事,把网店的数据分析工作做细做好。
四、对公司人员状况及员工工作状态的分析 1.对公司人员状况的分析
要想管好一个企业,首先要管好这个企业的人,要想管好一个企业的人,首先要对这个企业人员的基本情况有个比较全面的、细致的、科学的正确的了解。
目前公司成员大部分为90后,是一个年轻化的团队。他们大部分在长辈们的宠爱中长大,心理素质不怎么成熟,没有自信心,没有目标,责任心不强,不怎么能吃苦,心理承受能力较弱,不爱学习,不明白工作的真正意义。不过也有一部分比较懂事,做事比较踏实、勤奋、性格也比较好。
因此,我们在招聘的时候,要招那些肯学习、善于学习、领悟力学习力强的人。不过,这部分人一般都比较现实,对待遇、公正公平、发展空间比较看重。其实,我们要想打造一流的企业,培养一流的员工,一流的管理人员并不是难事。最重要的是要有一颗真正的,持之以恒的做事业的心。
2.对员工工作状态的分析
目前,部分岗位存在分工不明确的现象,出现问题时,同事之前相互推诿,不愿意承担责任,这也是部分员工责任心不强的最直接反映。部分员工没有团队合作意识,这就可能导致工作在某个环节衔接不上,进而有可能出现重大问题。
因此,明确分工和加强员工的团队合作意识也是公司目前需要解决的问题。
五、对公司企业文化的分析
企业文化,对我本人来讲,是一个管理学里面比较专业的词,我怕自己讲不好它。但我却可以深刻的体会到,这个无形的东西就在我的周围,在我们的骨髓里。因为我觉得它重要,所以,还是想讲它,而且觉得非讲不可。
在我所走到的企业里,旺旺集团的企业文化给我留下的印象最深。他们有自己明确的经营理念、经营目标、公司训、公司口号、企业标识、公司社歌和独立的传媒机构。他们的企业文化具有很强的感染力和凝聚力。
但是,很长一段时间以来,我们的公司一直处在“黎明前的黑暗”之中,为什么公司领导的那种不到山顶不罢休的气势、决心和信心,并没有感染所有的员工,那种不到山顶不罢休的气势、决心和信心并没有很好的变成我们的企业文化。没有被突出出来,没有在公司发展的日日夜夜中,张扬的体现给我们企业所有的员工们看。甚至是没有被人感觉到。
所以,加强健康向上的企业文化的建设工作,也就成为一种必要。十分的必要。也该引起足够的重视。把目前创业阶段的决心和信心力量、企业和员工相互之间的理解、信任、支持和默契融入到我们的企业文化中去。从而感染和吸引更多的优秀人才到我们中来,共同开创我们企业的未来。
第五篇:数据分析师教你识别数据陷阱专题
数据分析师教你识别数据陷阱
随着大数据概念的普及和人们对数据价值认识的不断深入,数据分析越来越受到人们的重视,尤其是在企业中,现在很多做销售、市场的企业人员已经开始用数据说话,很多企业也已经开始借助数据进行决策和管理,量化经营的理念正逐步深入人心。中颢润数据分析师事务所认为,与此同时,专业的数据分析师逐渐进入人们的视野,并且也被评为未来十年最有前途的十大职业之一。
在中颢润看来,作为一名数据分析师,保持对数据的敏感性是最基本的要求之一,这里所说的数据敏感性不仅是指能够发现隐藏在数据之间的关系和规律,还包括能够辨别数据的真伪。因为随着数据产生量的爆炸式增长,一些假的、有问题的数据也不断出现,这些数据有些是由抽样误差或采集过程引起的,有的则是出于某种目的人为造成的,而且有些错误的数据还非常隐蔽,往往容易被人忽视,从而造成错误的判断甚至因此蒙受巨大的经济损失。作为中颢润的一名数据分析师的长时间的经验总结,对待这类数据不能人云亦云,需要有自己的认识和理解,要透过数据的表面看背后的真相和存在的问题,下面举几个日常生活中常见的数据案例来说明如何看清数据的真相。
1、失业率
失业率是我们大家都非常熟悉的一个指标,也是政府制定相关政策的一个重要依据。这些年,中国政府一直将失业率控制在4%以下作为一项重要的执政目标,每年也都基本实现了这一目标,然而,以大多数人的感受来说,实际的失业率似乎比4%要大,而且有时候感觉会差很多。那么,到底是什么原因造成了实际统计数据与民众自身感受之间的这种差距呢?要弄清这一问题,我们首先应该看一下失业率的概念和统计方法。
失业率是失业人口占劳动力人口的百分比。世界上大多数国家都采用两种失业统计方法。一种是行政登记失业率,另一种是劳动力抽样调查失业率。两种失业率都是政府决策的重要依据。中国之前一直采用城镇登记失业率来衡量失业情况。城镇登记失业率是指在报告期末城镇登记失业人数占期末城镇从业人员总数与期末实有城镇登记失业人数之和的比重。分子是登记的失业人数,分母是从业的人数与登记失业人数之和。在城镇单位从业人员中,不包括使用的农村劳动力、聘用的离退休人员、港澳台及外方人员。城镇登记失业人员是指有非农业户口,在一定的劳动年龄内(16岁以上及男50岁以下、女45岁以下),有劳动能力,无业而要求就业,并在当地就业服务机构进行求职登记的人员。
由城镇登记失业率的计算方法我们不难看出,一系列限制使得这一指标的代表性大为降低。由于很多真正失业的人不一定去登记,加上农村的农民就业没有包括在里面,而最近几年2.5亿农民工群体已成为一支不容忽视的就业群体,而且随着人们寿命的延长,45到60岁之间的人仍工作在第一线,然而他们却都没有被纳入到城镇登记失业率的统计范围之内,因此实际每年公布的登记失业率数字,比调查失业率要低。这也成为城镇登记失业率饱受诟病的原因,也是造成实际每年公布的失业率与我们每个人的切身感受相差较大的最根本原因。
正是基于城镇登记失业率这些明显的缺陷,中国政府决定,从2011年开始,不再使用“城镇登记失业率”这一指标,而采用“调查失业率”。2013年9月9日,中国首次向外公开了调查失业率的有关数据。国务院总理李克强在英国《金融时报》发表署名文章《中国将给世界传递持续发展的讯息》透露,“今年以来,中国经济运行稳中有进,上半年GDP同比增长7.6%;5%的调查失业率和2.4%的通胀率,均处于合理、可控范围。”5%的调查失业率,高于此前人社部公布的一二季度均为4.1%的登记失业率,可以说更具有说服力。但这一数据到底是否准确、代表性如何,需要对调查失业率的计算方法、抽样方式、方法、调查范围等深入研究之后才能判断其最终的代表性。
二、死亡率
死亡率的概念大家都不陌生,而且一般也不会产生歧义。但是如果死亡率被用在不恰当的场合,那么同样会出现问题。
以一个经常被引用的故事为例。在美国和西班牙交战期间,美国海军的死亡率是千分之九,而同时期纽约居民的死亡率是千分之十六。后来,海军征兵人员就用这两个死亡率来证明参军更安全。那么,这个结论正确吗?显然是不正确,因为这两个数字根本就是不匹配的,当兵的一般都是身强力壮的年轻人,而居民的死亡率是包括老弱病残等各类人群的一个综合数据,而老弱病残者又是主要的死亡人群构成者,这
些人拉抬了整个居民的死亡率。所以正常应该是用同年龄段的海军和纽约居民的死亡率来作对比,从而判断参军是否安全。一般情况下,相同年龄段的海军死亡率应该是高于居民死亡率的。
这一案例说明数据之间要具有匹配性才能进行对比。不具有可比性的数据有时候会很隐蔽。不容易发现,这就需要分析师有更敏锐的观察能力。比如某个零售企业想计算2013年11月前十天的销售比去年同期增长了多少,表面上来看这两个数据是可以直接对比的,有匹配性。实际上对以规律性非常强的零售企业来说,周末对销售的影响是非常大的。翻开日历会发现,2013年11月的1~10日比2012年11月同期多一个“星期天”,这就容易使对比结果出现误差。因此,对零售企业来说,最好以周来进行对比。
三、离婚率
中国离婚率连年递增,婚外情成婚姻最大杀手,从年龄结构看22~35岁人群是离婚主力军,36~50岁年龄段是婚姻平稳期,50岁以上人群离婚率上扬,从教育背景看,学历高低与离婚率高低成反比,学历越低,离婚率越高,学历越高,离婚率越低。这些结论似乎与我们的日常感受比较吻合,但需要注意的是离婚率的计算公式是否科学合理。现行的离婚率公式是这样的:离婚率=离婚数/结婚总数,乍一看,没有任何问题。以2012年为例,2012年的离婚率就是2012年离婚数除以2012年结婚数?但仔细研究会发现,2012年离婚的人和结婚的人根本就不是一个概念。这样计算的结果容易广大人民群众造成误解!
实际的离婚率计算公式应该是:2002年结婚人群在2012年的离婚率=2002年结婚且2012年离婚总数/2002年的结婚总数。此外,如果我们对2002年结婚人群从2002年开始到2012年为止,每年都计算一个离婚率的话,还可以分析每年的离婚率变化情况,是否真在第七年的时候达到最高值,即通常所说的七年之痒是否真的存在。
与离婚率的概念类似,很多零售企业每个月都会计算的退货率,也需要分门别类才能正确的计算出来的。
以上中颢润仅仅列举了几个日常生活中常见指标的数据陷阱问题,实际生活中这样的例子还有很多。有时候是数据的确有错误,有时候数据虽然正确,但计算方法或者使用场合不正确,或者对比不匹配,同样会误导我们。因此,虽然我们不能每个人都成为数据分析师,但多尝试从数据背后看问题,多培养数据敏感性,仍然会使我们获益匪浅。