第一篇:中国和美国人口普查和统计方法的比较
中国和美国人口普查和统计方法的比较
西方经济学张 斌2024200
2人口和经济的发展是紧密相关的,各国历来都重视对人口的调查,以期取得可靠的资料作为经济,政治决策的一种依据。而各国人口统计方法,内容,手段,数据发布的及时性方面的差别直接导致人口统计数据质量的差异,也决定了不同国家之间数据是否存在可比性。人口统计资料和预测主要来源于全国普查、人口抽样调查。本文打算对中国和美国这两个有代表性的国家的人口普查方法做一横向和纵向的比较。这种历史的对比使我们更清楚的意识到其发展的历程和重要性。
一、关于人口的定义
在比较之前有必要对人口的定义做一说明。《人口科学词典》将人口定义为:人口是指生活在一定社会生产方式,一定时间和地域,具有一定数量和质量的人的总称。它是一切社会生活的基础和出发点,是社会生产力构成的要素和生产关系的体现者。我们在人口普查时对人口的定义本质上的规定性是生存着的人的集合,是一种生物性的人的集合。而在英文中人口是指(population)。联合国多国文字人口学词典对population的定义有两重意义:(1)是指统计学的总体,(2)是指人的一定区域人口群体。美国人口普查局对“population statistics”——人口统计数据的定义是:美国人口普查局使用的人口统计数据就是简单的指一个地区的“居民数字”(number of inhabitants)。人口普查局提供关于居民数字,地区,州,城市,县,和“other aeras”的人口普查计算和当前的估计。也提供关于人口的社会和经济的特性的各式各样的信息,例如家庭构成,人种,收入和重要社会,经济,人口学问题的深度报告。
二、人口普查的历史
先对人口普查和人口统计作一定义和区分。人口普查:指在统一的调查时间内,按照统一的调查内容和要求,对全国或一个地区的人口(人口数量或人口构成等方面)进行专门组织的统计调查。人口普查资料是编制国民经济长远计划和研究人口发展、变化等的重要依据。人口统计:指在特定的期限内,对人口及其变动的统计。主要内容有:人口数、人口的地区分布、人口的性别、年龄、职业、民族等各种构成,人口的出生、死亡、迁移和婚姻状况等统计。人口统计资料主要来源于人口的经常登记和人口普查,经过整理分析,作为编制国民经计划和研究人口发展、变化等的重要依据。
美国人口普查已有200多年的历史。1790年开始第一次人口普查以后,每隔10年进行一次,从不间断,到2000年已是第22次。但从第1次到第17次人口普查(即从1790~1950年)因地域包括范围不同(即包括州数不同),严格上说是不可比的。如第1次只包括通过独立宣言的13个州,第2次增加了3个州,第3次增加1个州,第4次增加6个州,共有23个州,一直到1960年第18次人口普查才增加到目前的50个州。也就是说从第18次至22次人口普查的地域范围都包括50个州,才是可比的。
中华人民共和国成立以来,50多年时间,我国成功地进行了五次人口普查,这些普查分别于1953、1964、1982、1990、2000年进行。我们可以看出,1982年及以前的人口普查,进行的时间上是不规范的,即年号末尾逢
2、逢
3、逢4的都有,这是因为过去国家对普查进行的时间未做明确规定,所以人口普查进行的时间不统一。1987年制定的《统计法实施细则》规定了每10年一次人口普查,在年号末尾为0的年份进行,从此,人口普查就走上了法制化、规范化的轨道。在年号末尾为0的年份进行人口普查,也是联合国所建议和提倡的,是世界大多数国家进行人口普查所采用的时间(少数国家不在逢0的年份进行,但也是接近0的年份)。从这方面来讲,我国人口普查同国际是一致的。
三、人口普查的执行机构
美国人口普查由人口普查局组织进行。人口普查局是美国联邦政府商务部属下的一个局。它的职责除了10年进行一次人口普查外,每年还进行一次人口抽样调查,以推算每年的人口数据,每年的人口抽查以年中(7月1日)为标准时间。人口普查局一般只负责统计数据的调查、整理、公布和提供,而不进行统计资料的分析研究。这有助于他们集中精力和时间把统计数据校准。人口普查工作机构原先只是一个临时机构。从1790年第1次开始至第12次人口普查(1900年),100多年间都是如此。直到1902年人口普查局才正式成立,成为一个永久性机构,比它的上级机构商务部成立早11年。
中国人口普查由国家统计局人口和社会科技统计司承担主要人口数据的收集工作。公安部进行户籍人口登记和统计,反映当年的户籍人口中的总数及出生、死亡、迁移登记状况。民政部负责人口婚姻状况的登记,由中国民政统计年鉴发布。计划生育部门进行妇女生育和实行计划生育措施方面的统计;劳动人事部门进行就业、待业方面的统计;卫生部门进行人口死亡原因的统计;教育部门进行各级各类学校入学、在校及毕业人数的统计,等等。
因此可以看出,美国人口普查是由人口普查局单独执行的,但它也会把自己的统计数据和其它机构进行对比,比如把自己统计的移民数和移民规划局的统计数字对比,进行调整。由单一机构执行,可能效率高,它不存在部门间的摩擦,当然对自身的技术要求也更高。而在中国,我们可以看到人口普查工作是由多个机构共同执行的,这就存在一个部门间的协调和数据口径的统一性问题,当然解决好了,就可以发挥协同作战的优势。
四、人口普查的进行
美国人口普查是普查与抽样调查相结合,以普查数据为准,抽样调查结果只用来检验普查数据的准确程度。以2000年人口普查为例,这次人口普查以实际普查数据为准,但还是在每6户中按等距方式抽一户作长表问卷的抽样调查。实际普查结果表明,按抽查结果推算,这次普查大约漏算了640~760万人,重复计算310~430万人,两者相抵净漏算约为330万人,相当于总人口2.81亿的12%,其中大部分是少数族裔人士。美国2000年人口普查的过程大致可分为下列几步:
首先,制定人口普查计划,调查表格和时间表。人口普查计划涵盖整个普查工作过程,内容详细、全面,具有操作性。调查表格分长短两种表格。应该一提的是美国在1940年就首次采用长短表技术。短表内容简单,只包括住户人数、姓名、性别、年龄、族裔等几个项目,人口普查局估计一个普通家庭填写此表只需10分钟。这种表发给5 /6住户填写。长表内容较多,除了短表内容外还包括户主的婚姻状况、学历、出生地、就业、经济收入、住房状况等共53项,估计一个普通家庭填写此表需要38分钟才能完成。长表只发给1/ 6住户填寄。整个人口普查时间从准备到资料整理完成所需时间大约5年,即从1999年至2003年。但主要时间集中在2000年3、4月间。人口普查工作时间之所以主要集中在3、4月间,是因为这两月是关键阶段,主要工作是:①寄发人口普查表,协助居民填写普查表。全国各地设立5万个服务中心协助居民填表。印发填表指南,指导居民填表。普查表除了英文外,还译成多种外文,如中文、西班牙文、越南文、韩文、日文等,开设多种语言电话服务,提供需要帮助的填表电话服务。②4月1日为“人口普查日”,4月中旬起将开始派遣普查员到未寄回普查表的家庭进行普查登记、填表,一直到6月底,甚至到7月中
其次,招聘普查工作人员,进行培训。人口普查局为了完成这次人口普查任务,决定招雇86万临时普查工作人员(包括普查员、组长和文员)从事普查工作。这些人员都要经过培训,考试合格,方能担任。
第三,开展宣传、引导,保护个人隐私。动员更多的美国居民来参加人口普查,不仅第一次在媒体上以不同语种大量刊登广告,宣传人口普查的重要性、好处,与个人切身利益的关系,还印制了50多种不同语言的人口普查指南,并首次在英文和西班牙文的普查表外专为亚太裔居民加印了中、韩、菲、越四种语言内容一样的普查表。民众参与率提高,人口普查成本降低。据估计,民众参与率提高1个百分点,就可减少2500万美元的支出。人口普查资料涉及个人隐私。人口普查局为了保护个人隐私,依法不得把列入机密的人口普查资料流入其他部门。
第四,采用先进技术,实行全面电脑化的数据扫描、输入、分类、汇总、贮存、提供。美国人口普查,经历了21次普查以后,2000年的人口普查全面实行电脑化,摒弃以往古老的打卡表和1950年起用过的大型立机电脑。
新中国的人口普查。新中国成立后,我国相继于1953、1964、1982、1990年进行了四次全国性的人口普查,均采用了全面普查方法,即对全国所有属于普查对象的人口全部登记同一张普查表,这四次人口普查的项目相对较少。随着我国社会和经济的发展,需要普查的内容大量增加,为了尽可能多地获得普查信息,同时又限制普查工作量的大幅度增加,2000年第五次人口普查首次采用了普查表长短表技术。长短表技术是指在人口普查中,将普查表分为两种,由每一个人填报的表,称为“普查表短表”,其特点是项目少。在普查人口中抽一定比例的人填报的表,称为“普查表长表”,其特点是项目多。长短表技术是世界上许多国家在普查中采用的技术。我国第五次人口普查《人口普查表长表抽样工作细则》规定,90%的户填报普查表短表,短表共有19个项目,其中户记录10项,人记录9项。10%的户填报普查表长表,长表共有49个项目,其中户记录23项,人记录26项。普查表长表抽样同其它全国范围内的抽样调查不同,它不是一项独立的抽样调查,而是人口普查工作中的重要组成部分,同时又具有全面普查和抽样相结合的特点。
人口普查在组织实施过程中,严格地执行了《统计法》关于“属于私人、家庭的单项调查资料,非经本人同意,不得泄露”的规定。在国务院批准发布的《第五次全国人口普查办法》中,规定了“人口普查机构和各级普查工作人员,对各户申报的情况,必须保守秘密,不得向人口普查机构以外的任何单位和个人提供或者泄露。严禁公开个人和家庭的登记资料。”
具体的过程以几次人口普查为例:
1、2000年第五次人口普查是在国务院的领导下,在全国31个省、自治区、直辖市进行。普查对象是具有中国国籍的公民,普查时点是2000年的11月1日0时。普查采用常住人口的方法,每个人在其常住地登记,要求逐户、逐人地个别进行登记,每个人仅能在一个地方登记。全国总人口包括现役军人,分地区人口不含现役军人。问卷有两种形式,短表和长表,长表是抽10%的住户。
2、两次普查间的小普查:小普查在1987年和1995年进行。以人口普查的内容为基础,小普查抽样比是总人口的1%(在1995年小普查的样本量大约是1200万,抽样方法是三级整群(县级单位、乡级单位、调查小区)概率比例抽样。1987年和1995年小普查的普查时点分别为7月1日和10月1日的零点,小普查除了以人口普查的内容为基础,还有包括详细的经济活动人口。
3、1‰年度抽样调查:从1983年开始,除了普查和小普查的年份外,每年进行人口变动情况调查,抽样比为1‰,样本量为120万,第一级县级单位大约为880个,第二级乡级单位大约为3200个,三级调查小区大约为4800个。调查时点在1993年前为每年的12月31日,1994年后改为每年的10月1日。从1996年以后,人口变动情况调查和劳动力抽样调查相结合。2001年在人口变动中增加了就业人口的职业、行业。
人口普查和人口调查数据要进行比较检验。如果人口年度调查估计数据同普查数据差异大,将用普查数据对年度调查数据进行修正。
从两国的比较中可以看出美国由于其人口普查的历史较长,其调查的技术很完善,很早,在1940年就首次采用长短表技术,而且不断的发展完善,比如第一次在媒体上以不同语种大量刊登广告,宣传人口普查的重要性、好处,与个人切身利益的关系,加大宣传的力度。民众参与率提高,人口普查成本降低。据估计,民众参与率提高1个百分点,就可减少2500万美元的支出。还在2000年的人口普查全面实行电脑化来提高普查的效率和质量。
我国虽然起步晚,时间不长,但发展也很快,2000年第五次人口普查首次采用了普查表长短表技术。但在具体执行过程中也还存在一些差异,比如长、短表的内容和抽查的比例等。改进人口调查问卷,更好的反映城乡迁移流动人口的情况,也开始做好被调查人的工作,使被调查者能更好的配合调查员的工作。开始运用清华大学紫光公司的光电录入的新技术,代替1990年的手工录入,进一步提高出生、死亡、城乡迁移人口调查数据的质量。由此可以看出两国都非常重视人口普查的工作,不仅不断改进其技术设计,还采用先进的现代化的设备。同样注意普查工作中对数据的保密,制订了相关的法律。
五、人口普查的内容
美国人口普查的主要内容是:人口数、性别、年龄、族裔。抽样调查内容除了上述几项外还包括户主或住所第一人婚姻状况、学历和学位、出生地、是否美国公民、身体健康状况、是否要抚养18岁以下的孩子(女)、是否曾在美国军队服役,如果有,时间多长,何年何月,上周是否有工作,如果有,在何处(地址、城市、市内市外,县、州或外国),怎样去上班(即通过使用哪一种交通工具或方式),何时上班,上班路上花多少时间,如果否,上周是否被解雇,上一次工作是什么时候,上周主要工作(雇主、受雇行业、主要经营)、职业、雇员身份(公司、政府、自雇),去年(1999)有没有工作,年总收入[(或亏损)以及分项收入(工资、薪水、自雇收入(或亏损)。利息、红利、租金、社保或退休金、社安补助金、政府机关的公援金或福利金等),居屋(住宅、公寓或流动房屋)的所有权状况、居住状况、建成年份,何时入住,该居屋有几个房间、几间卧室、居屋设施状况(有没有冷热水管道、抽水马桶、澡盆或淋浴间、厨房有没有洗涤用水槽、烤箱或炉灶、冰箱,有没有电话,取暖多用哪些燃料),居屋占地面积多少英亩,该居屋年水电煤气费多少,如果你是该居屋业主,那么你是否有债务,你每月按揭分期付款多少美元,按揭中是否包括房产税、保险费,此房产价值如何,也就是说此房产加土地价值在市场出售你认为值多少美元等共53项。
中国人口普查内容包括性别、常住地(城市、农村),年龄组(0-14,15-6
4和65岁以上)民族(汉族和少数民族),教育程度、文盲率(通过10年一次人口普查,两次普查间尾数逢5的年份进行的小普查和每年一次的人口抽样15岁及15岁以上),住户类型,经济活动人口,职行业,迁移,婚姻状况,生育和死亡。小普查除了以人口普查的内容为基础,还有包括详细的经济活动人口。我国抽查内容也包括了49项,其中户记录23项,人记录26项。调查内容:按人填报的项目,包括个人的基本情况、就业和失业情况、婚姻状况、妇女生育情况、出生和死亡情况等。按户填报的项目,包括本户住址编码、户别、本户总人口、上年10月 1日以来出生人口和死亡人口、本户户籍人口中外出半年以上的人口、本户年内迁出人口等。按社区填报的项目,包括居住地类型,全村户数、人口数和出生、死亡人口,公共交通、教育、医疗、饮水、通讯等方面的条件,耕地面积和上年人均年纯收入等。
从上面的资料可以看出,两国人口普查的内容都是非常全面的,这是因为我们前边已经提到的,人口统计资料是编制国民经济计划和研究人口发展、变化的重要依据。人口统计资料又主要来源于人口的经常登记和人口普查数据的整理分析,因此人口普查的内容就务必全面。在美国人口普查不仅具有重要的经济意义,而且具有重要的政治意义。
首先它是美国国会众议员名额分配的基础。美国国会是立法机构,有参众两院。参议院有议员100名,按50个州平均分配,每州2名,以表示各州地位平等,参议员任期6年,每2年改选1/3,可连选连任。众议院议员任期2年,可连选连任,共有435名,按每州人口占全国比例分配,最少也有1名。因此,每次人口普查的各州人口数成为各州众议员调整的依据。
其次是每年1850亿美元联邦经费分配到各州和地方政府的依据。这笔经费主要用于公共建设与服务,包括医疗保健、教育培训。就业和社会服务,交通运输、自然资源与环境保护,社区和地区发展。它的分配也是以各州各地方的人口数据为依据,人口多分配多,人口少分配也少。因此人口普查数据关系到每个人的切身利益,每个人的社会福利的享受。
六、人口统计和数据发布
美国的人口普查工作以2000为例集中在3、4月开始一直到6月底,甚至到7月中。当人口普查局的数据处理中心收到普查表问卷时,这些问卷先经过一道验身手续,凭借这一手续,即能知道哪些住户尚未寄回普查表,以便安排普查员上门拜访登记。验身手续完成后,普查表答案经数台扫描机传输到超级电脑,把数据制成档案。电脑还能自动删除来自同一家的多余问卷。把这些档案资料进行加工整理,分类汇总、贮存,并最后公布于洲际网络,还向新闻媒体发布。第一次向新闻媒体发布人口普查资料是2000年12月28日。可以看出人口数据的发布一般是在五个月后。
现在,我国已经加入了WTO,这就意味着我国将在更深层次,更广的范围参与世界经济合作,在我国的许多领域,都将按照国际的标准进行规范。我国的统计系统也是这样,将逐步按照国际通行的标准,规范我们的统计行为,包括指标设置、指标定义、调查方法,以及数据的发布方法等等。国际货币基金组织(IMF)制定的“数据公布通用系统(GDDS)”,就是这样一个国际通用的一般数据发布标准。按照这样的标准去做,可以使统计数据的发布制度化、透明化,可以更好地为政府服务和为社会服务,也可以更方便地进行国际比较。从上面的比较分析中,我们可以看到在人口普查工作中,我国正是按照国际通行的做法在不断改进和完善自己的统计方法,规范自己的行为,这就是一种进步。
我国人口数据主要有这样几个指标:人口总数、分性别人口、人口出生率、死亡率、自然增长率、城镇人口、乡村人口、人口年龄构成等等,这些数据又主要从人口普查和人口变动情况抽样调查获得。人口普查登记结束后,通过对若干指标进行先期快速汇总,我国一般在3—5个月内就能够发布主要数据。所有指标的计算机交叉汇总相对慢一些,要经过编码、录入、编辑、逻辑审核、数据净化、最后汇总等工作程序,因此,全部数据的汇总和发布,约在距普查登记标准时间后的一年左右。我国人口普查主要数据的发布和全部数据处理完成和发布的时间,同世界各国比较是处于领先地位的,普查数据完成和发布速度之快,曾引起许多国家的惊讶。《统计法实施细则》规定,在两次人口普查中间年份进行一次人口状况的简易普查。因此,每逢年号末尾为5时,就进行1%人口抽样调查,也称为“人口小普查”。“小普查”的内容、组织实施形式和数据发布时间与方法等,都与大普查相似。人口变动抽样调查一般在每年的10月进行,调查表在住户登记之后,被收集集中到省级统计局,由省级统计局进行编码、数据录入、编辑审核等项工作,然后,将净化后的原始数据传输到国家统计局,进行最后的汇总工作。汇总出各项主要数据并根据科学方法推算出年度的总体数据,这些数据将在距调查标准时点(10月1日)四个月左右,也就是在第二年的1、2月份发表的“国民经济与社会发展统计公报”中公布。这种做法也是国际通行的,是符合GDDS标准的。
从上面的对比分析中,我们可以看到,随着中国经济的不断发展,我国与世界经济联系的日益密切,我国人口普查工作不断的规范和完善,逐步与国际标准相吻合。当然也存在一些差异,有领先的地方,比如我国人口主要数据指标发布的及时性方面,也存在不足,比如人口统计口径的不断变化,这主要是我国各时期社会经济发展不平衡所致,这里就不一一列举。
最后,我希望我国的人口普查工作能为我国社会经济的发展和人口的研究提供高质量的数据,也感谢那些在这项意义重大的工作中努力工作的人。
参考资料:
美国人口普查局网:http:///tjlj/index.htm
《统计研究》 2002 第10期
《当代中国的统计事业》 中国社会科学出版社1989年10月第1版 《中国统计年鉴》(中/英文)国家统计局
《中国人口统计年鉴》
《人口科学词典》
第二篇:人口普查统计总结
人口普查小结
自2010年9月底进入 社区工作后,有幸参与十年一次的“全国第六次人口
普查”工作,在社区书记和主任的安排下,我的主要工作是资料数据汇总和报表报送。
我社区流动人口众多,人口普查的难度相当大。在街办和社区领导耐心的指
导和帮助下,我绘制了包括虚拟片区在内的20片小区图,方便普查员进行入户摸底工作。在普查期间,社区实行“5+2”、“白加黑”的工作方式,无论天晴下雨或是双休日、节假日,坚持入户登记。人口普查工作中,最难的工作要算与公安户籍比对的工作。为了确保不错不漏,我都要和普查员事先掌握各小区户籍人口基本情况,在普查登记过程中逐个核实,确保全部登记到位,数据真实准确。作为汇总统计人员,为了把户主姓名底册、人口普查过录表、人口普查长短表相一致,出现数据误差时,往往加班加点,直至数据正确,才能松口气。
11月25日晚,当时钟直指深夜1点时,我为了17片区的几个数据还在忙
碌。说真的,作为一个刚从大学毕业的女孩子,我从没经过这样的事情,当时泪水不知不觉就流了下来。但是,一看到其他主任陪着我一起加班,我一直坚持到将数据做准才回家。在社区书记和主任们的大力帮助和支持下,我社区的人口普查数据终于合格过关了!
为期两个多月的人口普查工作终于落下帷幕,日后的社区工作还有很多,通
过这次人口普查工作,对个人来说是次很好的历练,我将以老同志为榜样,扎根基层,为社区居民奉献我的青春。
2010.12.20
第三篇:室内空气评价中国和美国标准
海南室内空气—海口室内甲醛—室内空气质量评
价,美国标准和中国标准比较
2012-12-10 10:29:02 来源:蓝清环保 作者:海南蓝清环保科技有限公司 字体: 大 中 小 | 关闭本页 海南室内空气—海口室内甲醛—室内空气质量评价,美国标准和中国标准比较
1、美国ASHRAE标准62-2001
该标准提出了可接受的室内空气质量和可感受的室内空气质量这两个概念、其中可接受的室内空气质量定义:空调房间中绝大多数人没有对室内空气不满意,并且房间中没有已知的污染物达到了可能对人体健康产生严重威胁的浓度。这一定义体现了把客观评价和主观评价相结合的评价标准。室内空气质量的主、客观相结合的评价方法是一种综合的评价方法,这种方法不仅运用人体的感觉器官作为评价工具,而且还利用专业仪器对室内空气污染物进行检测,能克服单一的主管或可观评价的局限,从而全面正确地反映室内空气现状。
2、国内的综合评价标准
20世纪90年代有人提出建立了一套既符合国际通用模式又符合我国国情的室内空气质量综合评价标准。这一评价程序主要分为三条路径,即客观评价、主观评价和背景调查,最后进行综合。其中,客观评价选择常用的综合指数法来评价室内空气质量;主观评价主要是通过对室内人员的问询得到的,即利用人体的感觉器官对环境进行描述和评价;北京调查包括个人资料调查和排他性调查;最后综合主客观评价,做出结论。根据要求,提出总裁、咨询或调整对策。
第四篇:统计方法总结
一、统计分析方法总结
1.连续性资料
1.1 两组独立样本比较
1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。
1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。
1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。
1.2 两组配对样本的比较
1.2.1 两组差值服从正态分布,采用配对t检验。
1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。
1.3 多组完全随机样本比较
1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。
1.4 多组随机区组样本比较
1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:
(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**
(3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料
2.1 四格表资料
2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。
2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的 检验或Fisher’s确切概率法检验。
2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。
2.2 2×C表或R×2表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。
2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3 R×C表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。
2.4 配对分类资料的统计分析
2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对 检验。(2)b+c<40,则用校正的配对 检验。
2.4.1 C×C资料,(1)配对比较:用McNemar配对 检验。(2)一致性检验,用Kappa检验。
二、医学科研程序
⑴科研选题——⑵研究设计——⑶实施方法——⑷统计分析——⑸总结归纳
其中科研选题和研究设计最关键。科研设计分为⑴专业设计⑵统计设计
统计设计的内容:研究对象数量的确定、对照组的选定、随机化分组原则、控制误差及统计分析方法的选定等。
一、科研选题:⑴、查阅文献;⑵、选题原则:创新性、先进性、科学性、可行性;⑶、研究条件和优势
二、实施方法:⑴、调查;⑵、实验⑶、临床观察。
三、统计分析:⑴、正确搜集资料;⑵、描述资料统计特征⑶、统计推断并得出结论统计资料的要求:准确、完整、及时
描述资料:统计表、统计图、统计指标
统计推断:参数估计、假设检验
医学科研设计基本内容(临床实验设计参考用)
(社区干预试验设计可参照)
临床科研是以病人为研究对象,因此,在进行临床科研设计时应注意:①人有社会属性,受精神因素、心理因素影响,要注意临床科研要符合医学伦理要求;②必须设立对照(设立对照的注意问题附后);③随访的起点和止点应有明确的定义;④注意影响实验研究结果的因素,并适当控制(具体内容附后)。
1.国内外研究现状、水平、发展趋势(简要介绍与本课题有关研究的国内外现状、水平、发展趋势等,写明本课题提出的依据及本课题研究目的;简要介绍预试验内容及结果。)。
2.研究对象:
(1)具体诊断标准(用公认的或统一的,并阐明出处;如没有统一的标准也应写明是自定标准。)、制定入选(纳入)标准及排除标准;
(2)研究对象选择范围(包括对照组)及选样和分组方法(使用正确的随机方法选样和分组;在实验对象的分组和施加因素分配实验组、对照组上,都要随机化);
(3)样本含量。(说明确定样本含量的依据)3.处理因素:(详细写)
处理因素设置要求:①抓住主要因素;②找出非处理因素(混杂因素);③处理因素标准化。
(1)设备(或试剂或药物)生产厂家(来源)及型号(剂量);(2)治疗方法及操作程序(包括对照组);(3)操作过程中的质量控制(包括方法、人员、设备三统一及实验质控手段等);(4)技术关键。4.研究结果:
确定研究效应的测量指标及测定方法,要考虑与待评价的结果有关联性、客观性、灵敏性、特异性及实用性等。
(1)疗效判断标准(用公认的或统一的,并阐明出处;如没有统一的标准也应写明是自定标准。);
(2)(近期、远期)观察指标(各组观察指标应一致)及观察方法;(3)科研记录表格及汇总表格式样;(4)统计方法及指标确定,预计结果;(5)科研质量控制措施(包括科研全过程的各环节,如预试验工作、分组、施加处理因素、临床观察及随访、原始资料的记录及收集、资料整理等方面质量控制措施)。
5.创新设想(本研究的):
6.工作时间安排(包括调研、设计、研究、统计分析、总结鉴定等): 7.研究人员分工(包括姓名、性别、年龄、职称、工作单位及在本研究中的详细分工):
8.经费的筹措及使用计划:
9.存在(可能出现)的问题、困难及解决办法: 临床科研的对照问题
为保证临床科研实验组与对照组之间具有可比性,对照组中的观察对象除了实验因素不同以外,实验过程中的实验条件和辅助措施,都应与实验组相同。常用对照方式如下:
1、空白对照:对照组不施加任何处理因素。这种对照仅用在某些病情较轻或长期稳定无任何危险的疾病,如:慢性关节炎、HbsAg携带者、近视等。
2、安慰剂对照:对照组采用无药理作用且无害的“药“,如:淀粉、生理盐水等经加工后其外形、味道等与试验药相似,不被受试者识别。这种对照仅用在研究的疾病尚无有效治疗方法,或使用安慰剂后该病的病情、临床经过、预后等影响小或无影响时。
3、实验对照:对照组不施加处理因素,但施加某种与处理因素有关的实验因素。
4、标准对照:用现有标准方法或常规方法做对照,注意以一种低疗效的方法作对照来提高试验的疗效是毫无意义的,甚至是有害的。
5、历史对照:以过去的研究结果作对照,这是一种非随机和非同期的对照,容易产生偏倚(可能因为疾病自然病程会随时间而变化,或医生的收治病人诊断标准和治疗方法或水平因时间而变化等,使两组失去可比性)。这种对照可用于狂犬病、骨折愈合等疗效对照。
6、自身对照:对照和实验在同一受试对象进行,这种对照简单易行,但应注意该方法的两个缺陷:一是实验总是把处理前作对照,这不符合随机分配原则;二是实验前后某些环境因素或自身因素发生了改变,可能影响实验结果。可考虑用交叉实验解决。
7、相互对照:多种待研究观察因素相互对照。
目前常用的设计方案有:随机对照实验、配对实验、交叉实验(适于病程较长的实验研究),可根据具体情况,选用适合的方法进行实验研究。
10、影响实验研究结果的因素及其控制
一、误差:
1、随机误差:通过增加样本含量,可减小随机误差,但不能消除。
2、非随机误差:
非系统误差:偶然失误造成的。
系统误差:误差值遵循一定的规律而存在或变化,增加样本量,不能纠正。
二、编倚:(可以看成是一种系统误差)
1、选择性偏倚:防止选择性偏倚的措施:①正确拟定观察对象的纳入和排除标准;②采用分层抽样方法;③正确设立对照;④遵守随机化原则。
2、测量偏倚(或称观察偏倚或信息偏倚):
产生原因:①沾染(对照组也接受了处理措施);②干扰;③依从与非依从;④失访(>20%);⑤检查与诊断结果不一致;⑥观察记录有误;⑦心理因素的干扰。
防止措施:①用盲法试验;②签定实验合同;③检查实验对象的依从情况;④注意医德问题;⑤定期检查研究记录;⑥对实验方法、诊断标准的一致性在实验前应做出估计。
3、混杂偏倚:
产生原因:多在总结分析阶段,评价被研究因素与疾病之间的关系时,如果存在外来因素与该病和研究因素均有联系,使研究因素效应与外来因素效应混
在一起,从而掩盖或夸大研究因素与疾病的真实联系。
防止措施:①设计时,用配对设计或采用分层抽样方法;②分析阶段,用分层分析技术或多变量回归分析技术。其目的是平衡混杂因素的作用。
医学科研设计基本内容(调查设计参考用)
1、国内外研究现状、水平、发展趋势(简要介绍与本课题有关研究的国内外现状、水平、发展趋势等,写明本课题提出的依据及研究目的。注意:研究目的应很明确,且围绕一个中心;简要介绍预试验内容及结果。)。
2、调查计划:
⑴、确定观察对象(所要研究的总体)和观察单位(总体中的个体统计对象)⑵、选定调查指标(调查指标是调查目的的具体体现):指标选择要求:①精选、重点突出,不要贪多求全,分散精力。②计量指标比计数指标敏感。③客观指标优于主观指标。④选用灵敏度高,特异度高的检查方法作为诊断依据。
⑶、调查方法(普查、抽样调查等)
⑷、样本含量(说明确定样本含量的依据)
⑸、收集原始资料的调查方式(直接观察、直接采访(访问调查、自填调查)、间接采访(信访、电话))
⑹、设计调查表和问卷(调查表和问卷设计相关问题附后)
⑺、调查阶段的组织工作(包括组织领导、关系协调、调查员培训等)
⑻、设计阶段质量控制:①正确划分调查范围;②尽量选择客观、明确的指标;③对调查问题进行精选,避免问题过于繁杂;④对于可能引起混淆的调查项目给出明确的定义。
⑼、调查阶段质量控制:①通过预试验工作完善调查设计;②抓好调查员的选拔和培训,避免因调查员工作态度不好或业务水平不足而影响调查结果;③对被调查者可能存在的拒绝、躲避、隐瞒、等问题,采取相应措施,如:开展宣传、摸清被调查者在家的时间规律、对敏感问题做好解释和保密工作,对记忆不清者,可请知情人帮助回忆;④在问卷中设置相反问题,以了解应答的可靠性;⑤选择调查方式时应考虑年龄和文化水平因素;⑥对检测项目的调查应注明检测设备、试剂等生产厂家、型号、批号;操作过程应注意操作方法(包括诊断标准)、人员、设备(应有明确的校正灵敏度及准确度的方法及时间)三统一;⑦注意调查的效度(真实性)与信度(可靠性)问题,常采用现场抽样复查来评价调查信度等。
3、整理计划:(去粗取精,去伪存真)
⑴、计算机录入与整理工作:应提出确保录入质量的措施:①在建立数据库时,编写逻辑查错程序;②同一资料用两个录入员输入并用计算机核对;③资料录入完成后,做频数表或散点图,发现异常值;④正确选择合适的指标和分析方法等。
⑵、资料分组:(按数值大小分组、按类型分组等)⑶、分组组数确定:
4、统计分析计划:(包括:①说明指标的内涵和计算方法及预期进行统计描述和推断内容;②拟进行的探索性分析;③控制混杂因素的措施;④列出统计分析表,并通过统计分析表检查调查、整理计划有否遗漏。)
5、创新设想(本研究的):
6、工作时间安排(包括调研、设计、研究、统计分析、总结鉴定等):
7、研究人员分工(包括姓名、性别、年龄、职称、单位及在本研究中的详细分工):
8、经费的筹措及使用计划:
9、存在(可能出现)的问题、困难及解决办法:
10、调查表及问卷设计相关问题 一、一般结构:
1、前言:用于说明调查目的、重要性、回答问题的必要性以及对调查内容保密等,以取得调查对象的合作。
2、填写说明:为保证所有调查员和调查对象均能对调查项目和填写方法正确理解,统一认识而编写。
3、核(备)查项目:该部分与调查目的无关,作核查核对用。内容包括调查员姓名、调查日期、复核结果、未调查原因等。
4、调查(分析)项目:为直接用于调查指标所必须以及排除混杂因素所必须的项目,包括调查对象的①背景资料,如:姓名、住址、单位、电话等;②人口学项目,如:年龄、性别、民族、婚姻状况、文化程度、职业等;③研究项目(该部分是调查表的核心内容,依不同调查目的而定,分问题项目和检测项目)。
二、问题的形式:问题的基本形式有提问式和陈述式两种;根据问题答案的形式分开放式问题(无统一答案)和封闭式问题(有固定答案)。
封闭式问题设计注意:
1、答案应包括所有可能的答案,还应有“其它”一栏;
2、各选择答案不应相互包含,不应有重叠情况。
三、问题设计的一般原则:
1、尽量避免用专业术语(提问一般就低不就高);
2、避免混淆,对语义较模糊的词(如:经常、偶尔、普通、大概等)应给出本次调查的定义或标准。
3、避免双重问题,避免一个问题中实际提出两个问题。
4、提问避免诱导或强制性(否定形式的提问有诱导之嫌);对有社会期望偏倚的问题应注意。
5、问题应适合全部调查对象并符合逻辑。
6、敏感问题的处理:对国家政策、伦理道德、经济收入、生活行为、其它个人隐私等敏感问题,可以采用对象转移法或假定法提问;关于敏感问题调查的随机应答技术问题,须参考有关统计学专著。
7、调查项目的安排顺序(注意问题顺序的逻辑性)①、一般问题在前,特殊问题在后; ②、易答问题在前,难答问题在后;
③、敏感问题一般在最后;如敏感问题较多,可分散在问卷中,以降低其敏感性;
④、一般将问题项目放在前,检测项目放在后。
第五篇:农民收入统计方法
农民收入统计方法
一、农村住户调查简介
农民收入的统计是通过“农村住户调查”来完成的。“农村住户调查”是通过对农村居民家庭的生产、收入、消费、积累和社会活动的调查,全面反映农村居民的收入和生活质量的变化,对农村居民实现小康和摆脱贫困的进程进行监测,为各级政府制定农村政策和决策提供依据,也为国民经济核算提供了基础数据。
国际上开展“住户调查”已有很长的历史,我国农村开展住户调查始于1954年,在1954年至1977年间,该调查曾因“人民公社化”运动和“文化大革命”运动两次中断,1977年该调查再次恢复。1984年国家统计局农村社会经济调查队成立以后,农村住户调查获得了长足发展,调查方法、调查内容逐渐与国际接轨,走上了科学化、规范化和现代化的道路。
二、农民人均纯收入的定义与计算方法
(一)“纯收入”指标的定义
在我国农村社会经济统计中,“纯收入”指标的应用起始于“人民公社”时期的“农村经济收益分配”统计。在收益分配统计中,“纯收入”指的是农村经济总收入扣除各项费用后的余额部分,这个余额部分也叫“收益”。“纯收入”根据国家有关规定在国家、集体和个人之间进行分配。个人分配所得叫“农村居民所得”,指的是当年的农村经济纯收入减去国家税收和集体提留后的剩余部分。“农民人均纯收入”指的是按农村人口平均的农村居民所得。这个指标的口径从收入分配的角度说,就是农民初次分配得到的收入。
在开展农村住户调查中,初期的“纯收入”概念与“农村经济收益分配”统计中的概念是一致的,随着我国社会主义市场经济的发展和收入分配政策的调整,现行农村住户调查“纯收入”指标的口径有所调整,主要是包含了部分再分配的收入。“纯收入”指的是农村居民当年从各个来源渠道得到的总收入,相应地扣除获得收入所发生的费用后的收入
总和。“农民人均纯收入”指的是按农村人口平均的“农民纯收入”,反映的是一个国家或地区农村居民收入的平均水平。
(二)计算方法
在农村住户抽样调查中,农民人均纯收入计算的工作流程是,首先,由县级农调队将农户每月记的帐录入计算机,按季度(或按月)上报省农调队,年底由省农调队将全年的原始数据上报农调总队,省农调队和农调总队同时用国家统计局开发的计算机数据处理程序对原始调查数据进行处理,计算各省和全国的农民人均纯收入。整个计算过程完全由计算机自动完成,并有严格的制度规定。
农民人均纯收入的计算方法全国是完全统一的,计算公式为:农民人均纯收入=(农村居民家庭总收入—家庭经营费用支出—生产性固定资产折旧—税金和上交承包费用—调查补贴)/农村居民家庭常住人口
从计算公式看,农民纯收入的计算方法并不复杂。但是,由于农民收入是由两部分组成的,一部分是现金收入,另一部分是实物收入,现金收入好计算,调查结果是多少就是多少,复杂的是实物收入。由于实物收入没有经过市场,因此,必须采取一个客观、准确的计算方法来计算其价值量,才能正确反映农民收入水平。在确保原始调查数据质量的前提下,如何计算实物收入的价值量成为准确计算农民收入水平的关键。
在现行的农村住户调查中规定,实物收入的计算方法是将农户当年生产的农产品产量扣除出售部分,分品种作价后计算得出。对各品种农产品的作价执行的是与市场挂钩的原则,即以农民在市场出售农产品的价格为基础,粮食、肉类打九折,其他农产品打八五折。如果在下年出售了上年的结余农产品,根据出售价格与上年实物作价的高低,将出售结余农产品的损益计入下年收入。
对农作物副产品计算收入的原则是,只有用于生产和生活或明确用于出售的农作物副产品才计算收入,用于生产的农作物副产品在计算收入的同时也要计入生产费用中。农作物副产品作价计算收入的方法,原则上按实物折算收入的作价方法执行。
(三)与农民人均纯收入相关的一些指标与定义
农民既是一个消费单位又是一个生产单位,既有生活消费支出又有生产投入,既有现金收入也有实物收入。由于收入是对农民生产经营活动的全面反映,因此,为了准确反映农民的生产经营活动,在调查方案和分析中设计了较多的概念。主要有:总收入、纯收入、现金收入、实物收入、现金纯收入、实物纯收入和可支配收入等。
1.总收入
总收入是调查期内全部收入的总和,其中未扣除为获得收入所发生的支出(生产费用)和生活消费支出。按收入来源的性质划分,总收入分为:工资性收入(报酬收入)、家庭经营总收入、财产性收入和转移性收入。按收入的形态划分,总收入中包含两部分:实物总收入和现金总收入。
(1)工资性收入:指调查期内农村住户和住户成员受雇于单位和个人,靠出卖劳动而获得的收入。按收入来源渠道划分为在非企业组织中劳动得到的收入(如干部、教师收入)、在本地企业劳动得到的收入、常住人口外出务工收入和从其他单位劳动得到的收入。
(2)家庭经营总收入:指农村住户以家庭为生产经营单位进行生产筹划和管理而获得的收入。家庭经营收入按划分又可分为农业收入、林业收入、牧业收入等(共分为十个行业和其他)。
(3)财产性收入:指拥有金融资产或有形非生产性资产的农村住户向其他机构单位提供资金或将有形非生产性资产供其支配,作为回报而从中获得的收入。如利息、股息、红利、土地征用补偿等。
(4)转移性收入:指农村住户和住户成员无须付出任何对应物而获得的货物、服务、资金或资产所有权等。但不包括无偿得到的用于固定资本形成的资金。
(5)现金总收入:指农村住户和住户成员在调查期内得到的以现金形态表现的收入总和。
(6)实物总收入:指的是农户当年生产的各种农产品总量扣除出售部分,按一定的价格计算得到的总收入。
2.纯收入
和总收入一样,纯收入按收入来源的性质划分,可分为工资性收入、家庭经营纯收入、财产性收入和转移性收入,按收入的形态分为现金纯收入和实物纯收入。
工资性收入、财产性收入和转移性收入与总收入中的定义和口径完全一样。
(1)家庭经营纯收入:指的是家庭经营总收入相应地扣除从事各项生产经营活动获得的支出后的收入总和。家庭经营纯收入按行业又可分为农业纯收入、林业纯收入、牧业纯收入等(共分为十个行业和其他)。
(2)现金纯收入:指当年从各个来源得到的现金总收入相应地扣除所发生的现金费用支出后的收入总和。“现金纯收入”是“纯收入”中已经“变现”的部分,反映的是在当年“纯收入”中,农民对外进行商品交换的现实支付能力。
(3)实物纯收入: “纯收入”减去“现金纯收入”就是“实物纯收入”。
3.可支配收入
可支配收入是收入分配的概念。由农民生产活动的净收益和再分配净收益构成。也是通过总收入计算得到。
计算公式:农村住户可支配收入=农村住户总收入-家庭经营费用支出-税费支出-生产性固定资产折旧-财产性支出-转移性支出-调查补贴
按收入来源划分,与总收入和纯收入一样也可划分为四个部分,但名称略有不同,部分指标的口径也不一样,四个部分分别分为:工资性收入、家庭经营净收入、财产性净收入和转移性净收入。
工资性收入与总收入和纯收入中的定义与口径完全一样;家庭经营净收入等同于家庭经营纯收入。
(1)财产性净收入:指住户和住户成员在调查其内获得的财产性总收入扣除为获得财产性收入所发生的费用后的收入。
(2)转移性净收入:指住户和住户成员在调查其内获得的转移性总收入减去调查期内住户和住户成员的转移性支出(再分配支出)后的收入。
在现行的纯收入口径中,财产性收入没有扣除为获得财产性收入而发生的费用,转移性收入只扣除了部分转移性支出,这就是“纯收入”与“可支配收入”指标口径的区别。