第一篇:统计学 教案
总论
学习重点:本章是全课程的总纲,主要讲述统计学的对象和方法、统计的作用和统计学的基本概念,难点是统计学概念的理解和运用以及概念之间的相互关系。
第一章 统计学的产生和发展
看了上面的资料,你能说出什么是统计吗?你能否体会到统计已是人们在社会经济生活中必不可少的工具,是人们认识世界、探索现象数量差异的本质极其规律的方法,是人们进行明智决策的一门艺术,随着人类社会进入信息时代,统计作为一种方法和工具就变得越来越重要。
一、统计的概念
在日常生活中,我们经常会接触到“统计”这一术语。一提到统计,很多人可能首先想到的是统计工作,这种理解是不全面的。统计作为一种社会实践活动,已有悠久的历史,可以说,自从有了国家就有了统计实践活动。最初,统计只是一种计数活动,为统治者管理国家的需要而搜集资料,通过统计计数以弄清国家的人力、物力和财力,作为国家管理的依据。然而在“统计”一词已被人们赋予多种含义,在不同的场合、不同的语言环境中已有许多种不同的解释。
请思考:下列资料中“统计”一词的含义是什么?
那么,把统计作为一种专业用语,其含义到底是什么?目前,在国际统计理论界,关于统计一词的含义比较趋于一致的解释为:统计包含统计工作、统计资料和统计学三个方面的含义。
一是统计工作,即统计实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。一个完整的统计工作过程一般包括统计设计、统计调查、统计整理、统计分析等环节。统计工作是统计一词最基本的含义,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。如银行的计划统计科,每月编制项目报表,这个过程就是统计工作。又如:我国进行人口普查时要经过方案设计、入户登记、数据汇总、分析总结和资料公布等一系列过程都是统计工作。在我国,各级政府机构基本上都有统计部门,如统计局,它们的职能主要就是从事统计数据的搜集、整理和分析工作。
二是统计资料(统计信息):统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。如:
(1)我国国土面积960万平方公顷,其中山地约320万平方公顷,高原约250万平方公顷,平原约115万平方公顷,丘陵约95万平方公顷。
(2)2003年我国全年全部工业增加值53612亿元,比上年增长12.6%,其中规模以上工业企业(即国有工业企业及年产品销售收入500万元以上的非国有工业企业)增加值增长 17.0%。工业产品销售率98.1%,比上年提高0.1个百分点。
这些由文字和数字共同组成的数字化的信息就是统计资料,是统计提供数据信息的基本表现形式,是统计工作的直接成果。
统计资料包括原始资料和整理后的资料即次级资料。例如企业各车间的统计抬帐、人口普查时初次登记的资料就是原始资料,而统计公报、调查分析报告等现实和历史资料就是次级资料。统计资料的表现形式有统计表、统计图、统计分析报告、统计公报和统计年鉴等。
三是统计学,是系统论述统计理论和方法的科学,是长期统计工作实践的经验总结和理论概括。其中,应用纯逻辑推理的方法研究抽象的随机现象的数量规律性的科学称为理论统计学,而应用统计方法研究各领域客观现象的数量规律性的科学称为应用统计学。社会经济 统计学则是关于国民经济和社会现象数量方面的调查、整理和分析的原理、原则和方式方法的科学,按其性质它属于应用统计学。
统计的三种含义之间具有密切的联系。
首先,统计工作和统计资料是统计活动与统计成果的关系。一方面,统计资料的需求支配着统计工作的局面,另一方面,统计工作的好坏又直接影响着统计资料的数量和质量。
其次,统计工作与统计学是统计实践与统计理论的关系。一方面,统计学于统计实践,只有当统计工作发展到一定程度,才可能形成独立的统计学。另一方面,统计工作的发展又需要统计理论的指导,统计科学研究大大促进了统计工作水平的提高,统计工作的现代化和统计科学的进步是分不开的。总之,三者中最基本的是统计工作,没有统计工作就不会有统计资料,没有丰富的统计实践经验就不会产生统计科学。
二、统计的产生和发展
统计作为一种社会实践活动,是为了适应社会政治经济的发展和国家管理的需要而产生和发展起来的,距今已有四五千年的历史,而统计学或统计理论则是在长期统计实践活动基础上形成和发展起来的,距今只有300多年的历史。回顾一下统计的渊源极其发展过程,对于我们了解统计学的研究对象和性质,学习统计学的理论和方法,提高我们的统计实践和理论水平,都是十分必要的。
(一)统计实践史
人类的统计实践是随着计数活动而产生的。因此,对统计实践发展的历史可追溯到人类社会初期的打绳结、画道道计数,这可算是最初的统计。而统计实践的真正萌芽是在古代奴隶社会。当时的统治阶级为了治理国家的需要,常常进行征税,征兵、服劳役等统治活动,因此有了了解社会基本情况的需要。我国早在公元前21 世纪的夏朝,就 有了人口与土地数字的记载,当时全国分为九州,人口1355万人。世界上,古代埃及、希腊罗马的历史中,也有类似的记载。古代埃及在公元前3000年已经有人口、居民财产统计;古代希腊据说公元前600年就进行过人口普查。古代罗马在公元前400年建立了人口普查和经常性人口出生、死亡登记制度。这些就是原始形态的统计。进入封建社会后,随着人类社会生产的发展,统计的范围逐渐由人口、土地发展到社会经济生活的各个方面。但由于自给自足的自然经济占主导地位,生产力低下,经济落后,长期的封建生产关系阻碍了社会生产力的发展,相应地也阻碍了统计实践的发展。统计实践的广泛发展始于资本主义社会。17世纪以来,资本主义国家由于工、商、农、贸、交通的发展,统计实践从国家管理领域扩展到社会经济活动的许多领域。从18世纪起,各资本主义国家都先后设立专业的统计机关,收集各方面统计资料,定期或不定期举行人口、工业、农业、贸易、交通等项调查,出版统计刊物,建立国际统计组织,召开国际统计会议。
(二)统计学说史
随着统计实践活动的不断发展,统计实践经验的日益丰富,作为统计实践活动理论概括的统计学也就随之而产生了。
17世纪中叶,英国的威廉•配第《政治算术》一书的问世,标志着古典政治经济学的诞生,也标志着统计学的诞生。统计学从诞生开始,许多人从不同的角度,以不同的态度去认识研究有关统计理论,逐渐形成不同的统计学派,它们同时共存,互相影响,互相争论。在各学派的争论中又产生新的学派。在统计学的发展史上,比较主要的学派有政治算术学派、记述学派和数理统计学派。300多年来,统计学就是在这种争论中逐步得到完善、充实和发展。
4(1)政治算术学派。其代表人物是英国学者威廉•配第(1623-1687),在他所著的《政治算术》一书中,对当时的英国、法国、荷兰三国的国情国力作了系统的数量对比分析,明确英国的国际地位并不悲观,提出了英国的社会经济发展的方向和道路。威廉•配第做了前人没有做过的从数量方面来研究社会经济现象的工作。正是在这个意义上,马克思称威廉•配第是“政治经济 学之父,在某种程度上也可以说是统计学的创始人。威廉•配第采用数字、重量、尺度对社会经济现象进行数量对比分析的思想和方法,为统计学的创立,奠定了方法论基础。
配第的朋友约翰•格朗特,通过对伦敦50多年的人口出生和死亡资料的计算,写出了第一本关于人口统计的著作,所用的具体数量对比分析方法,对统计学的创立,同样起到了极其重要的作用,为统计学作为一种从数量方面认识事物的科学方法,开辟了广阔的发展前景。
(2)记述学派,又称国势学派,所谓国势学就是记述国家显著事项的学科。其代表人物是德国哥丁根大学政治经济学教授阿亨•华尔(1719-1772)等,代表著作是《近代欧洲各国国势学概论》,该书通过研究“国家显著事项”,分析各国的政治经济情况,提出一些治国方略。阿亨•华尔在大学中开设了一门新课程叫做“国势学”,后人把从事这方面研究的德国学者称为国势学派。他们所做的主要工作是对国家重要事项的记录,因此又被称为记述学派。也正是阿亨•华尔最早将“统计”一词当作学名来使用。严格地说,这一学派的研究对象和研究方法都不符合统计学的要求,只是登记了一些记述性材料,借以说明管理国家的方法。
政治算术学派和国势学派都以社会经济现象作为研究对象,以社会调查作为研究基础。但政治算术学派注重用数字说话,进行定量分析。而记述学派注重文字表达,进行定性分析。在是否把数量方面 的研究,作为这门学科的基本特征方面,两个学派互相争论了200多年,直到19世纪中叶,德国的克尼斯于1850年发表了《独立科学的统计学》论文,提出“国家论”和“统计学”的科学分工,主张把“国家论”命名为“国势学”,把“政治算术”正名为“统计学”,争论才告结束。
(3)数理统计学派。产生于19世纪中叶,创始人是比利时的天文学家、数学家和统计学家阿道夫﹒凯特勒(1796-1874),其著作有《统计学的研究》、《关于概率论的书信》等。他是当时统计学界的中心人物,担任过比利时中央统计局局长,主持过第一次国际统计会议(1853年),他最先将概率论应用于人口、人体测量和犯罪等问题的研究,完成了统计学和概率论的结合。从此,统计学开始进入更为丰富发展的新阶段。许多学者从各个角度研究统计学,不断增加新内容,相继提出和发展了相关和回归理论、t分布以及抽样理论等,使数理统计学很快发展成为一门比较系统、完善的学科。国际统计学界称凯特勒为“近代统计学之父”,就在于他发现了大量现象的统计规律和开创性地应用了许多统计方法,促使统计学向新的境界发展。由于这一学派主要在英美等国发展起来,故又称英美数理统计学派。
数理统计学派在理论上混淆了自然现象和社会现象之间的本质区别,过分夸大了概率论的作用,认为统计学就是数理统计学,是现代数学的一个分支,是通用于研究自然现象和社会现象的方法体系,否认社会经济统计学的存在,因而又导致了与社会经济统计学派的长期争论。
(4)社会经济统计学派。这一学派于19世纪后半叶兴起于以德国,即原来政治算术意义下的统计学。但由于它在理论上比政治算术学派更加完善,在时间上比数理统计学派提前成熟,因此它很快占领了“市场”,对国际统计学界影响较大,流传较广。主要代表人是恩格尔(1821-1896)和稍后的梅尔(1841-1925)。他们主张统计学是研究社会现象的社会科学。这一学派融会了记述学派和政治算术学派的观点,并把政府统计和社会调查融合起来,进而形成社会经济统计学。
数理统计学派与社会经济统计学派共存并争论至今已有100多年,目前,虽然数理统计学派在国际统计学界占据着优势,但二者已出现了融合的趋势。
统计发展史表明,统计学是从设臵指标研究社会经济现象的数量开始的,随着社会的发展与实践的需要,统计学家对统计方法的不断丰富和完善,统计学也不断发展和演变。从当前世界各国统计研究状况来看,统计学已不仅为研究社会经济现象的数量方面,也为研究自然技术现象的数量方面提供各种统计方法;它既研究确定现象的数量方面,又研究随机现象的数量方面。从统计学的发展趋势来看,它的作用与功能已从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展。它已从一门实质性的社会性学科,发展成为方法论性质的综合性学科。
三、我国统计发展史
解放前,由于我国是半殖民地半封建社会,统计工作非常落后,统计学基本上照抄照搬西方统计理论,传播的主要是数理统计学派的观点。
解放后,我国在学习前苏联统计工作经验的同时,引进了前苏联的统计学即社会经济统计学,数理统计遭到批判。党的十一届三中全会以后,学术界又开始了百花齐放,百家争鸣,数理统计又重新受到了人们的关注。人们突破了以往狭隘的观点,承认社会经济统计学、数理统计学和自然科技方面的统计学都是独立的统计学科,它们可以同时并存,相互借鉴,共同发展。近年来,社会经济统计学和数理统计学出现了融合的趋势,数理统计方法在社会经济统计中得到 了广泛的应用。统计学已划入国家一级学科,随着大统计学学科体系的建立,统计学作为一门独立的科学,其运用已渗透自然科学和社会科学的各个领域。统计科学工在总结本国经验的同时,吸收了世界各国统计科学发展的成果,正在努力建设一门具有中国特色的现代统计学。
请思考:从统计理论的发展看,你认为统计学、数学和数理统计学是一种什么关系?
第二章 统计学的研究对象和研究方法
一、社会经济统计学的研究对象
统计学的研究对象是指统计研究所要认识的客体。只有明确了研究对象,才可能根据它的性质特点指出相应的研究方法,达到认识对象客体规律性的目的。由统计学的发展史可知,统计学是从研究社会经济现象的数量开始的,随着统计方法的不断完善,统计学得以不断发展。因此,统计学的研究对象为大量现象的数量方面。而社会经济统计学的研究对象是在质和量的辩证统一过程中,研究大量社会经济现象总体的数量方面。
所谓数量方面是指现象总体的数量特征、数量关系及数量界限,通过对这些数量方面的研究,表明所研究现象的规模、水平、速度、比例和效益等,以反映社会经济现象发展变化的规律性,反映现象的本质。统计学和统计工作是理论和实践的关系,它们所要认识的研究对象是一致的。
社会经济现象包括自然现象以外的社会的政治、经济、文化、人民生活等领域的各种现象。比如,国民财富与资产、人口与劳动力资源、生产与消费、财政与金融、教育与科技发展状况、城乡人民物质文化生活水平等。通过对这些基本的社会经济现象的数量方面的认 识,达到对整个社会的基本认识。
社会经济统计学虽然不研究自然现象与科学技术本身,但是社会、经济和自然、技术总是密切联系,相互影响的。社会经济统计学也研究自然技术因素对社会生活变化的影响,研究社会生产发展对社会生活自然条件的影响。例如,研究资源条件和技术条件的变化对于社会生产生活的影响程度,研究社会生产的发展引起自然条件的变化等等。
下面举例说明如何根据统计数据说明社会经济现象的数量特征、数量关系及数量界限。
[例1] 我国历次人口普查的总人口情况。
表1-1描述的统计数据,反映了不同时间我国总人口的规模,显示了我国人口基数过大、人口增长速度过快的基本国情,所以控制人口增长、提高人口素质,就成了我国20世纪70年代以来的一项基本国策。
[例2] 2002年,我国接待人境旅游者达到9791万人次,比上年增长10%。旅游业总收人5566亿元人民币,比上年增长11.4%,其中国际旅游收人1688亿元人民币,增长14.6%,国内旅游收人3878亿元人民币,增长10.1%。2003年,我国旅游业虽然受到非典疫情的严重影响,但全年人境旅游者仍达到9166万人次。这些统计数据具体地描述了我国旅游业的发展势头,说明我国旅游业作为国民经济新的增长点,正在进人全面加速发展期,发展势头非常强劲。
[例3] 2003年,全年全国城镇居民人均可支配收入16890元,扣除物价上涨因素,实际增长9.0%;农村居民人均纯收入7540元,实际增长4.3%。居民家庭恩格尔系数(即居民家庭食品消费支出占家庭消费总支出的比重),城市为37.1%,比上年降低0.6个百分点;农村为45.6%,降低0.6个百分点。年末全国私人轿车拥有量已达489 万辆,比上年末增加146万辆。这些统计数据充分说明我国居民生活继续改善和提高。
从以上例子中可以看到,利用各种统计数据说明社会经济现象的发展状况,发扬成绩,揭露矛盾,预测未来,不仅生动形象,而且具有较强的说服力。所以在我们国家,各行各业都离不开统计。要用好统计,便要学习统计。
请思考:降雨量是否属于社会经济现象?降雨量与农作物的产量有关,风调雨顺的时候,农作物的产量是否一定就高?为什么?农作物的产量受降雨童的影响,又是否属于社会经济现象呢?
二、社会经济统计学的研究特点
社会经济统计学研究社会经济现象的数量方面时,具有自己独立的思维形式和研究特点。表现
(一)数量性
社会经济统计学最基本的研究特点就是以数字为语言,用数字说话。具体地说,是用规模、水平、速度、结构和比例关系等,去描述和分析社会经济现象的数量表现、数量关系和数量变化,揭示事物的本质,反映事物发展的规律,推测事物发展的前景。
但应注意,统计学研究现象的数量方面,不同于数学上研究的纯数量,它不是抽象的数量,它是以现象质的规定性为基础的,是带有一定具体内容的数量。因为任何事物都是质和量的辨证统一,没有质也就没有量。
例如:要了解哈尔滨市重工业产值,首先要明确什么是重工业。所谓重工业是为国民经济各部门提供技术装备、动力和原材料的工业,包括采掘工业、原材料工业和制造工业。然后要确定重工业产值的含义和统计口径以及哈尔滨市哪些企业属于重工业企业,这些都是质的规定。在此基础上,还要解决怎样搜集、整理和汇总重工业产值 资料,最后才能得到哈尔滨市重工业产值的具体数值。(二)总体性
总体性又称大量性或综合性。统计研究的着眼点是大量社会经济现象总体,而不是少量或个别现象,它是通过对个别事物大量观察,占有丰富材料,加以分析综合,来反映现象总体的数量特征,揭示现象的本质和规律性。例如,2004年全年居民消费价格总水平比上年上涨3.9%,这个数量反映的是550多种消费商品及服务项目价格总的平均上涨水平,而不是指哪一种具体消费商品或服务项目的价格上涨水平。而要对这550多种消费商品及服务项目的价格上涨情况进行调查,就必须先对每一种个别消费商品及服务项目的价格情况进行调查,然后进行汇总综合,从而达到对550多种消费商品及服务项目价格的总体认识。
统计研究并不排除从个别现象入手,但统计研究个体是为了综合个体而认识总体,是手段而不是目的,其最终目的是要认识总体。例如,2000年11月1日进行的第五次全国人口普查,逐一登记了全国大陆31个省、自治区、直辖市(不包括香港特别行政区、澳门特别行政区、台湾省)的每个人的性别、年龄等特征,但人口普查的目的并不是要了解关于某个人的特征,而是为了通过对全国人口情况进行汇总计算,得出关于我国人口总体的特征资料,从而达到对全国人口现象总体的认识。汇总后结果显示,祖国大陆31个省、自治区、直辖市(不包括福建省的金门、马祖等岛屿,下同)和现役军人的人口共126583万人。同第四次全国人口普查1990年7月1日0时的113368万人相比,十年零四个月共增加了13215万人,增长11.66%。平均每年增加1279万人,年平均增长率为1.07%。同1990年第四次全国人口普查相比,0-14岁人口的比重下降了4.80个百分点,65岁及以上人口的比重上升了1.39 个百分点。从总体着眼,从个体入手,体现 了统计工作中总体和个体之间的辨证关系。
(三)社会性
社会经济统计学通过研究大量社会经济现象总体的数量方面,来认识人类社会活动的条件、过程和结果,反映物质资料的占有关系、分配关系、交换关系以及其他的社会关系。其定量研究是以定性分析为前提的,而定性使其在客观上就有了社会关系的内涵。社会经济现象与自然科学技术问题是不同的,对于同一社会经济现象,站在不同的立场,持有不同的观点,运用不同的方法,可以得出差别较大的结论。这些都体现出社会经济统计活动的社会性。
(四)变异性
又称差异性。统计研究同类现象总体的数量特征,它的前提是总体各单位的特征表现存在着差异,而且这些差异并不是由某种固定的原因事先给定的。例如一个地区的居民人口有多有少,居民的文化程度有高有低,住户的生活消费水平有升有降等等,正是各单位之间这种差异的存在,才需要研究地区的人口总数、居民文化结构、住户平均生活消费水平等统计指标。如果各单位不存在这些差异,也就无需进行统计,如果各单位之间的差异是按已知条件事先可以推定的,也就无需进行统计调查研究。
(五)具体性
统计研究的总体数量是一个有具体时间、具体地点、具体条件限定的数量。如利润额800万元,在团结看来,它只是一个毫无意义的抽象数量。如果说2004年12月某企业利润额800万元,这就是统计中所说的具体数量了。可见具体性就是指在时间、地点、条件三方面有着明确的规定性。
统计工作虽然是研究具体的数量,但为了进行复杂的定量分析,还需要借助抽象的数学模型和数理统计方法,遵循一定的数学规则。以抽象方法为手段,以具体数量为目的,体现了统计研究中具体和抽象的辨证关系。
请思考:统计研究的总体性排斥对个别典型事物的深入研究吗? 统计数据与数学中的数字有什么区别?
三、统计学的研究方法
统计学作为一门方法论科学,具有自己完善的方法体系。统计研究的具体方法有很多,这将在后续课程中学习,而从大的方面看,其基本研究方法有:
(一)大量观察法
这是统计活动过程中搜集数据资料阶段(即统计调查阶段)的基本方法:即要对所研究现象总体中的足够多数的个体进行观察和研究,以期认识具有规律性的总体数量特征。大量观察法的数理依据是大数定律,大数定律是指虽然每个个体受偶然因素的影响作用不同而在数量上几存有差异,但对总体而言可以相互抵消而呈现出稳定的规律性,因此只有对足够多数的个体进行观察,观察值的综合结果才会趋向稳定,建立在大量观察法基础上的数据资料才会给出一般的结论。统计学的各种调查方法都属于大量观察法。
(二)统计分组法
由于所研究现象本身的复杂性、差异性及多层次性,需要我们对所研究现象进行分组或分类研究,以期在同质的基础上探求不同组或类之间的差异性。统计分组在整个统计活动过程中都占有重要地位,在统计调查阶段可通过统计分组法来搜集不同类的资料,并可使抽样调查的样本代表性得以提高(即分层抽样方式);在统计整理阶段可以通过统计分组法使各种数据资料得到分门别类的加工处理和储存,并 为编制分布数列提供基础;在统计分析阶段则可以通过统计分组法来划分现象类型、研究总体内在结构、比较不同类或组之间的差异(显著性检验)和分析不同变量之间的相关关系。统计学中的统计分组法有传统分组法、判别分析法和聚类分析法等。
(三)综合指标法
统计研究现象的数量方面的特征是通过统计综合指标来反映的。所谓综合指标,是指用来从总体上反映所研究现象数量特征和数量关系的范畴及其数值,常见的有总量指标、相对指标,平均指标和标志变异指标等。综合指标法在统计学、尤其是社会经济统计学中占有十分重要的地位,是描述统计学的核心内容。如何最真实客观地记录、描述和反映所研究现象的数量特征和数量关系,是统计指标理论研究的一大课题。
(四)统计模型法
在以统计指标来反映所研究现象的数量特征的同时,我们还经常需要对相关现象之间的数量变动关系进行定量研究,以了解某一(些)现象数量变动与另一(些)现象数量变动之间的关系及变动的影响程度。在研究这种数量变动关系时,需要根据具体的研究对象和一定的假定条件,用合适的数学方程来进行模拟,这种方法就叫做统计模型法。
(五)统计推断法
在统计认识活动中,我们所观察的往往只是所研究现象总体中的一部分单位,掌握的只是具有随机性的样本观察数据,而认识总体数量特征是统计研究的目的,这就需要我们根据概率论和样本分布理论,运用参数估计或假设检验的方法,由样本观测数据来推断总体数量特征。这种由样本来推断总体的方法就叫统计推断法。统计推断法已在统计研究的许多领域得到应用,除了最常见的总体指标推断外,统计模型参数的估计和检验、统计预测中原时间序列的估计和检验等,也都属于统计推断的范畴,都存在着误差和臵信度的问题。在实践中这是一种有效又经济的方法,其应用范围很广泛,发展很快,统计推断法已成为现代统计学的基本方法。
上述各种方法之间是相互联系、互相配合的,共同组成了统计学方法体系。
请思考:这些方法中你以前运用过哪几种呢?
四、统计的职能与工作任务(一)统计的职能
统计是在质的规定的前提下,对客观事物进行量的研究。它既可以观察量的活动范围,又可以研究质的数量界限,还可以观察现象之间相互影响的数量关系。因此,统计具有信息、咨询、监督三大职能。
统计信息职能是指统计具有信息服务的功能,也就是统计通过系统地搜集、整理和分析,得到统计资料,在统计资料的基础上再经过反复提炼筛选,提供大量有价值的、以数量描述为基本特征的统计信息,为社会服务。
统计咨询职能是指统计具有提供咨询建议和对策方案的服务功能,也就是指统计部门利用所掌握的大量的统计信息资源,经过进一步的分析、综合、判断,为宏观和微观决策,为科学管理提供咨询建议和对策方案。统计咨询分为有偿咨询和无偿咨询两种。统计咨询应地走向市场。
统计监督职能是指统计具有揭示社会经济运行中的偏差,促使社会经济运行不偏离正常轨道的功能,也就是统计部门以定量检查、经济监测、预警指标体系等为手段,揭示社会经济决策及其执行过程 中的偏差,使社会经济决策及其执行过程按客观规律的要求进行。统计信息职能是统计最基本的职能,是统计咨询和统计监督职能能够发挥作用的保证,反过来统计咨询和统计监督职能的强化又会促进统计信息职能的强化。统计的三种功能相辅相成,相互作用,构成了一个有机整体,故又称为整体功能。
请思考:试从统计职能的角度说明统计的现实意义。(二)统计工作的任务
统计的职能决定了统计工作的任务。《中华人民共和国统计法》第一章第二条规定:“统计的基本任务是对国民经济和社会发展情况进行统计调查,统计分析,提供统计资料和统计咨询,实行统计监督。”与其相适应的具体任务是:调查、整理社会经济活动的各种数字资料;在此基础上,对社会经济活动过程极其结果进行主观与客观、横向与纵向、静态与动态的综合分析,提供信息产品;判断社会经济活动的运行状态,提出相应的咨询意见,监督社会经济活动的运行过程,为国民经济宏观调控、企业经营管理和科学研究提供客观依据。为了完成上述任务,统计工作必须做到“准确、公正、及时、方便”,这是衡量统计工作质量的重要标准。
五、统计工作过程
统计工作是对社会经济现象进行调查研究以认识其本质和规律性的一种工作。作为人类认识客观世界的一种活动,统计工作是无止境的,但就一次具体的统计活动而言,一个完整的统计工作过程一般要经过统计设计、统计调查、统计整理和统计分析四个阶段,才能完成由定性认识到定量认识再到定性认识与定量认识相结合这一完整过程,从而使人类的认识得到升华。
统计设计是对统计活动各个方面和各个环节所作的通盘考虑和 合理安排。如确定调查对象、设计指标体系、编制分类目录、制订调查、整理和分析方案等。优良的统计设计是科学、有效地组织统计活动的前提。
统计调查就是根据一定的目的,通过科学的调查方法,搜集社会经济现象的实际资料的活动。从统计工作的全过程来看,统计调查是搜集资料获得感性认识的阶段,它既是认识客观经济现象的起点,也是统计整理和统计分析的基础环节。
统计整理是对调查来的大量统计资料加工整理、汇总、列表的过程。通过统计调查取得的原始资料只能反映总体各单位的具体情况,是分散的、零碎的、表面的,而且精粗并存,真伪混杂,不能说明事物的全貌。要说明总体情况,揭示出总体的特征,还需要对这些资料进行去粗取精、去伪存真、由此及彼、由表及里的加工整理,以便对总体做出概括性的说明。统计整理处于统计工作过程的中间环节,起着承前启后的作用。
统计分析是将加工整理好的统计资料加以分析研究,采用各种分析方法,计算各种分析指标,来揭示社会经济过程的本质及其发展变化的规律性。通过统计分析阶段,对事物由感性认识上升到理性认识。
统计工作过程的四个阶段并不是孤立、截然分开的,它们是紧密联系的一个整体,其中各个环节常常是交叉进行的。例如,小规模的调查,常把调查和整理结合起来;在统计调查过程中就有对事物的初步分析;在整理和分析过程中仍须进一步调查。第三章 统计学中的几个基本概念
统计学中的概念很多,为了叙述方便,有利于以后各章学习,本节先集中介绍几个常用的贯穿于全书的基本概念。
一、统计总体和总体单位
根据一定的目的和要求,统计需要研究有关的统计总体。所谓统 计总体,是由客观存在的、具有某种共同性质又有差别的许多个别单位所构成的整体,当这个整体作为统计研究对象时称统计总体,简称总体。例如,研究某个工业部门的企业生产情况时,该部门的所有工业企业可以作为一个总体,因为它是由许多客观存在的工业企业组成的,而每个工业企业都是进行工业生产活动的基层单位,具有同质性。
如果一个统计总体中包括的单位数是无限的,称为无限总体,例如,连续大量生产某种零件时,其总产量是无限的,构成一个无限总体。总体中包括的单位数是有限的,称为有限总体。例如,在特定时点上的人口总数、工业企业总数等等,都是有限总体。对于有限总体,既可以进行全面调查,也可以抽样调查。对于无限总体来说,只能进行抽样调查,根据样本数据推断总体特征。此外,统计总体还可以分为静态总体和动态总体,前者所包含的各个单位属于同一个时间,后者所包含的各个单位则属于不同时间。根据一定的目的,针对这两类总体就可以分别进行静态研究或动态分析。
综上所述,可见总体和总体范围的确定、取决于统计研究的目的要求。而形成统计总体的必要条件,亦即总体必须具备三个特性:大量性、同质性和变异性。(一)大量性
大量性是总体的量的规定性,即指总体的形成要有一个相对规模的量,仅仅由个别单位或极少量的单位不足以构成总体。因为个别单位的数量表现可能是各种各样的,只对少数单位进行观察,其结果难以反映现象总体的一般特征。统计研究的大量观察法表明,只有观察足够多的量,在对大量现象的综合汇总过程中,才能消除偶然因素,使大量社会经济现象的总体呈现出相对稳定的规律和特征,这就要求统计总体必须包含足够多数的单位。足够多数,是指足以反映规律的数量要求。当然,大量性也是一个相对的概念,它与统计研究目的、客观现象的现存规模以及总体各单位之间的差异程度等都有关系。
(二)同质性
总体的同质性,是指构成总体的各个单位至少有一种性质是共同的,同质性是将总体各单位结合起来构成总体的基础,也是总体的质的规定性。例如,全国工业企业作为统计总体,则每个总体单位都必须具有从事工业生产活动的企业特征,而不具有这些特征的就不能称之为工业企业。如果违反同质性,把不同性质的单位结合在一起,对这样的总体进行统计研究,不仅没有实际意义,甚至会产生虚假和歪曲的分析结论。
同质性的概念是相对的,它是根据一定的研究目的而确定的,目的不同,同质性的意义也就不同。例如,研究全国工业企业的生产状况时,所有工业企业都是同质的,而研究民营工业企业生产状况时,那么,民营工业企业与国有工业企业就是异质的。可见,同质性是相对研究目的而言的,当研究目的确定后,同质性的界限也就确定了。
(三)变异性
总体各个单位除了具有某种或某些共同的性质以外,在其他方面则各不相同,具有质的差别和量的差别,这种差别称为变异。正因为变异是普遍存在的,才有必要进行统计研究,是统计的前提条件。总体中各个单位之间具有变异性的特点,这是由于各种因素错综复杂作用的结果,所以有必要采用统计方法加以研究、才能表明总体的数量特征。
请思考:要研究某银行职工的工资情况,其统计总体是什么?想一想这个总体是否同时具备统计总体的三个特征?
构成总体的每一个事物或基本单位称为总体单位。原始资料最初 就是从各个总体单位取得的,所以总体单位是各项统计数字最原始的承担者。例如,研究某个工业部门的生产情况时,该工业部门的所有工业企业可以作为一个总体,每个工业企业则是总体单位,将每个工业企业的某些数量特征加以登记汇总,就取得该工业部门的统计资料。
总体和总体单位是相对而言的,在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系。但是随着统计研究目的及范围的变化,统计总体和总体单位可以相互转化。同一事物在不同情况下,可以作为总体,也可以作为总体单位。例如,在上述某一工业部门所有工业企业的统计总体中,每个企业是一个总体单位。但为了要研究一个典型企业的内部问题时,则被选作典型的某一企业又可作为一个总体。
请思考:总体和总体单位可以指单位也可以指人,请问可以指物吗?举例说明。
二、标志
每个总体单位都具有许多属性和特征。例如,就全国工业企业这一总体来说,每个工业企业所属的经济类型、行业性质、职工数目、产品产量和产值等的特征,可以说明每个企业的具体情况。这些说明总体单位属性或特征的名称,在统计上称为标志。
标志的属性或数量在各总体单位的具体表现称为称为标志表现。如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现。统计研究是从标志表现开始的,标志表现是最基础的统计资料,是形成指标数值的原材料。每个标志的具体表现就是 在标志名称之后所表明的属性或数值,例如,当我们研究的总体是全国工业企业时,企业的“行业性质”、“经济类型”、“工业总产值”是调查标志,企业的“工业”特征就是“行业性质”的标志表现;企业的“国有经济”、“集体经济”、“股份制经济”、“私营经济”等,就是“经济类型”的标志表现;企业的工业总产值“4000万元”、“6000万元”、“9000万元”就是“工业总产值”的标志表现。
(一)品质标志和数量标志
标志按其性质可以分为品质标志和数量标志。品质标志是表明总体单位的质的特征的名称。例如,工人的性别、民族、文化程度、工种等这一类标志,不能用数量而只能以性质属性上的差别即文字来表示,称为品质标志,表示事物的质的特征。
数量标志是表明总体单位的量的特征的名称。例如,工人的年龄、工龄、工资,工业企业的工人数、产量、产值、固定资产等等,只能以数量的多少来表示,称为数量标志,表示事物的量的特性。
就一个品质标志或数量标志而言,其具体表现可能多种多样,不能将标志与标志表现混为一谈。例如对三个工人的月工资计算平均数,只能说是对三个标志表现或三个标志值计算平均数,不能说对三个数量标志计算平均数,因为数量标志只有一个,即工人的“月工资”。
(二)不变标志和可变标志
标志按变异情况可以分为不变标志和可变标志。如上所述,标志在总体单位之间各有一定的具体表现,有的相同,有的则不尽相同。标志如果在总体各单位之间的具体表现完全相同,该标志就称为不变标志。例如,国有工业企业的经济类型是属于国家所有,这个标志对国有工业企业这一总体来说,就是不变标志。任何总体的各个总体单位至少要有一个共同的不变标志,才能使它们结合在一起,这个不变标志就是构成总体同质性的基础。总体单位的标志的具体表现,大多数都是在各单位之间变化其性质和数值的。如果某些标志在总体各单位的具体表现不完全相同,这些标志称为变异标志或可变标志。例如,国有工业企业的产量、产值、工人数等标志,是随着每个企业的具体情况而变动的,这些标志就是可变标志。
请思考:每一个学生作为总体单位具有哪些标志?指出其中的品质标志和数量标志。
三、统计指标和统计指标体系
根据统计研究的目的和要求,确定了总体、总体单位及其各种标志以后,就应采用一定的统计方法对各单位的标志的具体表现进行登记、核算、汇总和综合,以说明各个总体的数量特征。这主要是通过统计所特有的指标来实现的。
(一)统计指标
统计指标是反映统计总体的数量特征的概念和数值。与标志不同,它是依附于统计总体的。例如,人口数目,土地面积、工农业产品产量、工农业总产值、成本、利润、国民收人等等,这些概念用于反映一定统计总体的数量方面时,就是统计指标。任何统计指标总是要通过一定的数值来加以说明的,这种数值称为统计指标数值。统计指标数值是现象发展变化的规律性在一定时间、地点和条件下的数量表现。一个完整的统计指标是由两个部分所构成,即指标名称和指标数值。指标名称和指标数值是两个既有联系又有区别的概念。指标名称是统计所研究的社会经济现象的科学概念,表明社会经济现象的质的规定,反映某一社会现象内容所属的范围;指标数值则是统计所研究现象的具体数量综合的结果,对某一社会经济现象总体特征从数量上加以说明。统计指标名称及其指标数值的有机结合,也就是事物质的规定性和量的规定性有机联系的表现。统计指标一般包含有六个要素:即指标名称、计量单位、核算方法、时间限制、空间限制和指标具体数值。例如,我国2004年国内生产总值为136515亿元。该统计指标就包含上述六个要素。
从事统计指标的理论设计主要是制订和规范前三个要素,而从事具体的统计调查和数据搜集工作,则是要准确核算后三个要素,这也是具体统计工作所要承担的繁重任务。
统计指标按其所反映的数量特点和内容的不同,可以分为数量指标和质量指标两类。凡是反映社会经济现象范围的广度、规模大小和数量多少的指标叫数量指标,它表示事物外延量大小。例如人口总数、企业总数、耕地面积、工业总产值和商品流转额等,都属于这一类指标。数量指标是用绝对数表示的,并具有实物的或货币的计量单位。统计实践中这类指标通常是以总量指标的形式出现。由于数量指标反映的是现象总体的绝对量,因此其指标数值大小随总体范围的大小而增减变动。
反映现象本身质量、现象的强度、经营管理工作质量和经济效果等的统计指标,称为质量指标,它表示事物的内涵量状况。例如产品合格率、固定资产的利用程度、单位成本指标、利润率、劳动生产率等等。质量指标是用相对数或平均数表示的,统计工作中,这类指标通常是以相对指标或平均指标的形式出现。由子质量指标反映的是现象总体内部的数量关系,因此其指标数值大小与总体范围大小没有直接的关系。数量指标和质量指标的关系表现在,数量指标是计算质量指标的基础,质量指标往往是相应的数量指标进行对比的结果。最后还应指出,统计指标与标志之间的区别和联系。
两者的区别主要表现在:①反映的对象和范围大小不同。统计指标说明的是总体的数量特征,而标志则是反映总体单位的数量特征。②表述形式不同。统计指标都可以用数值表示,而标志既有能用数值 表示的数量标志,又有不能用数值只能用文字表述的品质标志。
两者的联系主要表现为:①具有对应关系。在统计研究中,标志与统计指标名称往往是同一概念,具有相互对应关系。因此,标志就成为统计指标的核算基础。②具有汇总关系。许多统计指标的数值是由总体单位的数量标志值汇总而来的。如某地区工业总产值就是各企业总产值加总之和,这里,地区工业总产值就是统计指标,而各企业总产值则是标志。同时,通过对品质标志的标志表现所对应的总体单位数进行加总,也能形成统计指标。例如上述的工业企业经济类型,汇总后可得出具有某种属性的总体单位数,如国有经济企业数、集体经济企业数等。③具有变换关系。由于统计研究的目的不同,统计总体和总体单位具有相对性。统计总体和总体单位规定的非确定性,导致相伴而生的统计指标和标志也不是严格确定的。随着研究目的的变化,原有的总体转变为总体单位,相应的统计指标也就成为标志;反之亦然。这说明指标与标志之间存在着一定的联系和变换关系。
(二)统计指标体系
社会经济现象是一个复杂的总体,各类现象之间存在着相互依存和相互影响的关系。一个统计指标往往只能反映复杂现象总体某一方面的特征,要了解客观现象在各个方面及其发展变化的全过程,仅靠单个的统计指标是不行的,必须建立和运用统计指标体系。
所谓统计指标体系,就是若干个反映统计总体数量特征的相对独立又相互联系的统计指标所组成的整体。例如,一个工业企业把产品产量、净产值、劳动生产率、质量、消耗、成本、销售收人等统计指标联系起来就组成了指标体系,这便于我们全面、准确地评价该企业的生产经营情况。
由于现象之间相互联系的多样性和人们认识问题的多视角,反映 现象总体的统计指标体系也可以从不同的角度进行分类。
指标体系按其反映内容不同,可分为社会统计指标体系、经济统计指标体系和科学技术统计指标体系。它们分别从人口社会、国民经济运行和科学技术发展三个方面,反映一定时期、一定范围内国民经济和社会科技发展的总体状况。
指标体系按其考核范围不同,可分为宏观指标体系、中观指标体系和微观指标体系。宏观指标体系反映整个社会、经济和科技情况;中观指标体系反映各个地区和各个部门、行业的社会、经济和科技情况;微观指标体系反映各企、事业单位的生产经营或工作运行情况。
指标体系按其作用功能不同,可分为描述性指标体系、评价性指标体系和预警性指标体系。描述性指标体系主要是反映社会经济现象的现状、运行过程和结果;评价性指标体系主要是比较、判断社会经济现象的运行过程、结果是否正常;预警性指标体系是对经济运行过程进行监测、起预警作用的指标。
上述各类统计指标体系都有其自身的特点,实际工作中可以根据统计研究的目的选择运用或结合运用,以便充分发挥统计的信息、咨询和监督的整体功能。
请思考:你平时对哪些统计指标体系有过了解?请举例说明。
四、变量
可变的数量标志称为变量,各种统计指标也是变量。变量的具体表现,就是可变数量标志或统计指标的不同取值,称为变量值(亦即标志值)。一个变量可以取多个变量值,二者不能混淆。例如,工资这个变量,可具体表现为840元、780元、900元、680元等多个变量值。按照变量值的连续性不同,变量可以分为连续变量和离散变量。前者是指它的数值是连续不断的,即在任意两个相邻数值之间可以取无限多个不同的数值。例如,人体的身高、体重等都是连续变量。连续变量的数值是通过测量或计算方法取得的,既可用小数表示,也可用整数表示;离散变量的数值是通过逐个计数的方法得出的,变量值只能以整数断开,而不能表现为小数的。例如,职工人数、企业数、机 器台数等都是离散变量,其可能数值的个数是有限的,构成有限总体。
请思考:人的年龄是连续变量还是离散变量?为什么?
变量按其性质可以分为确定性变量和随机变量。在一个系统中,如果某一变量的值能够被另一个变量或若干个变量(因素)的值,按一定的规律惟一地确定,则该变量就可以称之为确定性变量。例如,在销售价格P为一定的条件下,某商品的销售额Y的变动完全由销售量X所确定,Y就成为确定性变量。所谓随机变量,其数值的变动受到许多种因素的影响,在相同条件下进行观测,由于影响因素的作用不同,其可能的实现值(或观测值)不止一个,数值的大小随机波动,带有偶然性,事前无法确定。例如,除了某种正常的、起决定性的因素外,影响某企业生产的同一批次灯泡的质量波动还有许多因素,如果抽取一部分灯泡进行检验,这种灯泡的寿命值不尽相同,数值的大小带有偶然性的波动,检验前是不能预先确定的,则灯泡寿命就是随机变量。随机变量具有随机性或偶然性,但它的数值变动却有一定的规律性,通过大量观察,应用统计技术方法,可以揭示和描述其数量特征以及变动的规律性。
第四章 统计指标和指标体系的设计
一、统计指标的设计要求 由于统计指标具有反映现象总体数量特征的作用,因而也就成为统计设计的主要内容。设计统计指标应符合以下基本要求。
(一)目的性
设计任何一个统计指标,首先应当明确要解决什么问题,达到何种目的。换言之,设计统计指标取决于统计研究的目的。只有明确了目的,才有可能确定所要研究总体应设计哪些指标进行观察和考核。不同的目的.就有不同的需要,就应设计不同的指标。例如,当研究的目的是为了观察零售商业企业人力资源的利用效果时.应设计业务人员劳动效率和全员劳动效率指标进行度量;当研究的目的是为了观察零售商业企业房屋设备使用效果时,应设计每平方米营业面积所产出的营业额和每平方米经营利润率指标进行度量。
(二)科学性
设计统计指标要求以正确、科学的理论作指导,以客观事物内部及事物之间的本质联系为依据。无论是统计指标名称与含义的确定,还是统计指标计算方法的选择,都应准确地反映研究对象内部及其彼此之间的相互联系。例如,我们研究商业企业的劳动效率问题,在设计指标时就有三种选择,即营业员劳动效率、业务人员劳动效率和全员劳动效率。在这三个指标中,前两个指标只是反映企业局部的劳动效率,唯有选择全员劳动效率指标才能全面、准确地反映企业劳动效率的全貌,这样才体现了指标科学性的要求。
(三)度量性
统计指标是用数据反映社会经济现象特征的,是可以测定和计量的,没有不能用数量表现的统计指标。统计指标的量化特点既区别于纯数学计算又为运用数学方法研究社会经济现象提供了条件。设计统计指标要求现象总体的数量特征在量化层次、计量单位、量化方法和形式等方面具有可操作性。例如,研究人们的“精神生活”是一个非 常抽象的内容,在国家统计局和国家计委联合研制的“小康生活水平指标体系”中,将“精神生活”设计了两个指标,即“教育娱乐支出比重”和“电视机普及率”,这使得“精神生活”的内容具有了度量性。
(四)可比性
在设计统计指标时应注意各地区、各部门指标的一致性和不同时期统计指标的相对稳定性,以便同类指标能在不同空间和不同时间相互比较。随着客观情况的变化和统计资料使用要求的变化,统计指标的含义和计算方法将会有所修改,修改时就必须考虑到前后时期的可比性。特别是在指标口径、分类标准、计算价格和计算方法等方面发生变更时,应当规定统一的换算方法。
二、统计指标的内容设计
统计指标就其完成形态而言,由定性规范、定量方法和指标数值三大要素组成。定性规范包括指标名称和指标含义,定量方法包括计量单位和计算方法,指标数值是在具体时间和空间上所获得的实测值。设计统计指标,就是将其定性规范、定量方法和资料操作化。(一)确定统计指标的名称和含义
确定统计指标的名称和含义要以相应学科的理论为依据。如国内生产总值、国民收人,工资、利润、劳动生产率等统计指标的概念,就离不开经济学的有关理论。但是,某些学科的概念是通过科学抽象得出来的理论概念,而统计指标是反映客观现实数量特征的概念,它不可能完全照搬理论,而应当在统计实践中对其加以“改造”,即在设计和构建统计指标时,凡借用有关学科的理论概念,都必须结合统计对象和统计指标的特点,准确界定指标的内涵,使之成为可以计量的数量概念。统计指标的内涵确定以后,还需要明确其外延,应统计哪些内容,不应统计哪些内容,即确定指标口径。(二)确定统计指标的空间标准和时间标准
统计指标数值的大小受一定的空间范围影响,空间范围包括全国范围、地区范围和系统范围等,如职工人数统计指标有全国职工人数、某省职工人数、某部门职工人数之分,如果空间范围发生变化,就要规定具体的处理方法。统计指标的时间标准有两种,即时期指标和时点指标。时期指标要规定时间长度(如月、季、半年、一年)和具体的起止日期;时点指标要规定统一的标准时点,如第一次至第四次全国人口普查就规定为当年7月1日零时,第五次全国人口普查规定为2000年11月1日零时。
(三)确定统计指标的计量单位和计算方法
统计指标有无名数指标和有名数指标。无名数指标是一种抽象化的数值,大多数用百分数、系数、倍数等形式表示,多用于质量指标。有名数指标包括实物量、价值量、劳动量等,多用于数量指标。实物量指标要规定用自然实物计量单位或标准实物计量单位,并且还要规定自然实物量折合为标准实物量的方法。复合计量单位适用于表现强度一类的相对指标的数值,如人口密度用“人/平方公里”、医疗床位保证程度用“人/张”计量等。统计指标计量单位的确定.主要取决于所研究的社会经济现象的内容特征。
有些统计指标通过登记、点数、测量和简单的加总即可求得指标数值,如职工人数、播种面积、牲畜存栏数、在校大学生人数等。这类指标在确定了总体范围和指标口径之后,一般不需要再规定具体计算方法。有些统计指标的计算则比较复杂,如国内生产总值、国民收入、社会劳动生产率等,这类指标必须以一定的经济理论为依据来确定其计算方法。理论概念是反映客观事物一般的、本质特征的一种思维形式,而统计指标是认识、管理的工具,它既要正确反映事物的本质特征及其相互之间的内在联系,又要符合客观实际.满足人们认识 和管理的需要。因此,这类指标的计算方法必须结合统计实践加以具体化,使之能够度量。
三、统计指标的体系设计
统计研究的对象是社会经济现象总体的数量方面,而一个总体往往具有多种数量表现和数量特征.因此,必须借助统计指标体系,从不同的视角、不同的层面揭示现象总体的特征及其发展变化的规律性。由于统计研究目的不同.指标体系的设计也会有所变化,不同指标体系突出的重点会有所区别,具体内容更是各具差异,但其基本要求是一致的,都要遵循统计指标设计的目的性、科学性、度量性和可比性原则。为了比较具体地阐述指标体系的设计内容,现以企业生产经营活动统计指标体系为例进行介绍。
我国实行的是社会主义的市场经济,企业是国民经济的细胞,企业生产经营活动是社会再生产运行的基本组成部分。为了便于国家宏观调控,也为了企业对自身的行为作出校正,以适应市场经济的需要.必须对企业的产销情况、经济效益和外部环境做的分析研究。故此,需要建立一套完整的企业生产经营统计指标体系。设计这一指标体系时应考虑以下几个问题:
(一)全面系统与简明扼要相结合,突出重点指标
在设计统计指标体系时,应尽可能地从各个方面、各个环节反映企业生产经营活动的全貌。既要有投人方面的内容,也要有产出方面的成果;既要反映当前的生产经营状况,也要反映长远的发展问题。同时.还应保持指标的系统性和指标间的逻辑性,并尽可能减少指标数,本着少而精的原则进行筛选,选出其中富有综合性、代表性、实用性和可操作性的指标。(二)静态分析与动态分析相结合,突出动态分析
静态分析着重于企业的现实状况,反映企业生产经营活动在现阶段达到的水平、规模和发展程度。动态分析则是揭示企业生产经营活动发展变化的过程和趋势。静态分析的结果为动态分析提供基础,动态分析的成果可以指导和影响企业生产经营决策,这在相当大的程度上决定企业的生存和发展。
(三)定性分析与定量分析相结合,突出定量分析
一个产品的上马,一种营销方式的诞生,一个重大决策的形成等,都是大量的定性分析和定量分析综合而成的结果。由于企业的生产经营活动过程具有渐进性和微观性的特点,因而定量分析显得特别重要。企业的生产经营活动大多需要量化而且可以量化,这种量化是内部分析和外部判断的重要依据。
(四)微观分析与宏观分析相结合,突出微观分析
企业生产经营活动是构成国民经济运行的基本要素,国民经济总体运行会对企业生产经营活动产生影响。因此,在建立指标体系时不仅要看到本企业,还要看到同行业、相关行业以至整个国民经济;不仅要观察国内市场,还要观察国际市场;不仅要分析生产、流通,还要分析科技进步;不仅要研究经济因素,还要研究非经济因素。当然,在微观与宏观结合的过程中要突出为微观服务,围绕微观看宏观,以便分析企业的利弊得失。
影响企业生产经营活动的因素是多种多样的,除了本企业的内部状况以外,还有许多与本业业生产经营活动有关的外部因素,这决定了企业生产经营活动统计指标体系内容的广泛性和复杂性。为此,设计统计指标体系时,应抓住主要因素进行。其基本框架见图1-1。
统计指标体系是研究社会经济现象总体数量方面的一个重要工具,企业可以根据不同的研究目的设计不同的指标体系。随着时间的
推移和客观环境条件的变化,同一企业在不同时期也可以设计不同的指标体系,以便有重点地研究和解决一些问题。在现实的统计工作中,国家统计部门和各地统计部门都设计了一些标准的社会经济方面的统计指标体系,其中相当一部分作为制度下发执行,研究社会经济问题时可以直接运用或借鉴这些统计指标体系。
图1-1 企业生产经营活动统计指标体系
第二篇:社会统计学教案
一、大样本(Large-sample)总体均值检验
根据大样本的假定(n≥50)(这在社会调查中都是满足的)。样本均值X趋向于正态分布:XN(,2n)
其中,:总体均值;2:总体方差;当2未知时,可以用样本方差S2来代替,2S2;n:样本容量。其标准化形式为:
ZXnN(0,1)
该值当原假设H0:0成立的条件下,可以唯一地为样本值所确定。因此,大样本总体均值检验所用的统计量为
ZXnX0X
有了统计量Z,再根据显著性水平,就可以对大样本均值检验作如下的归纳:
(一)原假设H0:0
(二)备择假设H1:
单边 双边
H1:0 H1:0
或 H1:0
(可以省略)
(三)统计量
ZX0XXnN(0,1)
如果未知,可以用s。
(四)拒绝域
单边 1.ZZ(H1:0)
Z2.ZZ(H1:0)
Z双边
ZZ2或ZZ2
2Z2Z22
[例]1.为了验证统计报表的正确性,作了共五十人的抽样调查,人均收入的结果有:X=871元,S=21元
问能否证明统计报表中人均收入=880元是正确的(显著性水平=0.05)。解:根据题意,可写作如下的假设
H0:880元
H1:880元 则统计量可选为:ZX880X880 Snn拒绝域:因为=0.05,查附表得拒绝域的临界值Z2=1.96
2拒绝域21.96接收域拒绝域1.96
根据样本值,代入统计量表达式中,得
ZX8808718803.03 S21n50因为Z=3.03>1.96,所以拒绝原假设,即根据抽样调查不能认为人均收入为880元,因此可以认为统计报表是有误的。
[例]2.接上题,如果根据以上的样本资料,但却采用区间估计的方法。试问是否也能作出对原有假设H0:880的判断? 解:可以。根据样本值:
X=871(元);S=21(元);1-=1-0.05=95% 下面计算置信度为95%的区间估计值: 因为Z2=1.96,所以
[XZ2n,XZ2n]≈[8711.962121,8711.96] 5050=[8715.82,8715.82]=[865.18,876.82]
现在根据小概率原理来推论总体880是否成立,首先假设总体均值确为880的话,那么95%样本计算出来的区间估计都应该包含880。而现在一次样本的调查结果,区间[865.18,876.82]并没有包含880,也就是出现了小概率事件。从而推翻了原假设:880(元)。
第三篇:生物统计学教案
生物统计学教案
第四章 抽样分布
教学时间:2学时 教学方法:课堂板书讲授
教学目的:重点掌握样本平均数的t分布、F分布和样本方差的X2分布,掌握两个样本标准差比的分布。
讲授难点:t分布、F分布和X2分布
4.1 从一个正态总体中抽取的样本统计量的分布 4.1.1 样本平均数的分布
标准差已知时的平均数的分布 从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n的样本,其样本平均数为一服从正态分布的随机变量。它的平均数和方差分别为:
xxnσ/n 称为标准误差。标准化的平均数
uxn服从N(0,1)分布。
标准差未知时的平均数的分布-t分布 若上述总体的标准差未知,可以用样本标准差代替总体标准差,标准化的平均数称为t xtsn统计量t不再服从N(0,1)分布,而服从n-1自由度的t分布。S/n称为样本标准误差。
t分布也是一种对称分布,在密度函数中只有自由度一个参数,随着自由度的增加,t分布越来越接近于标准正态分布。
不同自由度下的t分布
与标准正态分布类似,t分布的上侧、下侧和双侧临界值,由以下各式给出: 对于给定的α从附表4中可以查出相应的上侧、下侧和双侧临界值。
PtPtttPtt24.1.2 样本方差的分布
从方差为σ2的正态总体中,随机抽取含量为n的样本,计算出样本方差s2,标准化的s2称为χ2。
2dfdfs22n1s2236 在这里,χ2服从n-1自由度的卡方分布。它是概率曲线随自由度而改变的一类分布。
附表6给出了P(χ2 >χ
2α)=α时的χ
2α,称为上侧临界值。该图形是不对称的,求下侧临界值时不能用标准正态分布和t分布的方法查找。正确的做法是,只要查出1-α的上侧临界值即可。
χ2分布的上侧和下侧分位点
4.2 从两个正态总体中抽取的样本统计量的分布 4.2.1 标准差σi已知时,两个平均数的和与差的分布
xx
1x212211x2n122n237 如果两个总体的分布都是正态或近似正态的,平均数的和与差的分布也是正态的
2212N12,nn21ux1x21221n1标准化的变量服从标准正态分布
22n24.2.2 标准差σi未知但相等时,两个平均数的和与差的分布
当σ1和σ2未知时,可用s1和s2代替,标准化变量t服从df1+df2自由度的t分布,统计量t为:
tdf1df2x1x21221n11s12n21s21n11n21n1n24.2.3 两个样本方差比的分布—F分布
统计量F的定义为:
2s1F212s222F分布的密度函数是由两个自由度df1和df2决定的。属于不对称分布,分布曲线如下图。F分布的临界值的查法,将在下一章中介绍。
第四篇:生物统计学教案
生物统计学教案
第三章 几种常见的概率分布律
教学时间:3学时 教学方法:课堂板书讲授
教学目的:重点掌握正态分布,掌握二项分布,了解泊松分布,中心极限定律。讲授难点:正态分布、二项分布
3.1 二项分布(重点)3.1.1 二项分布的概率函数
满足二项分布的条件:
1、在一随机试验中,每次试验都有两种不同的结果。
2、两种结果是互不相容的。
3、每一种结果在每次试验中都有恒定的概率。
4、试验间应是独立的。
独立地将此试验重复n次,求在n此试验中,一种结果出现x次的概率是多少?
例:从雌雄各半的100只动物中抽样,抽样共进行10次,问
其中包括3只雄性动物的概率是多少?包括3只及3只以下的概率是多少?即求P(X=3)和P(X≤3)
该例符合二项分布的条件。规定以下一组符号:
n = 试验次数
x = 在n次试验中事件A出现的次数
φ= 事件A发生的概率(每次试验都是恒定的)1-φ= 事件A发生的概率
p(x)= x的概率函数=P(X=x)(累积分布函数)F(x)= P(X ≤x)上例中:n=10 x=3 φ=0.5 求p(3)和F(3)。在一次抽样中抽到的结果为:mmmfffffff,它的概率为
P(mmmfffffff)=φ3(1-φ)7 抽到3雄7雌的数目相当于从10个元素中抽出3个元素的组合数
3p3C10317对于任意n和x有以下通式:
pxCxnx1nx,x0,1,2,,n
上式称为二项分布的概率函数。该式正是二项展开式的第x+1项,因而产生“二项分布”这一名称。因为φ+(1-φ)=1,所以
pxx0n1n1将x=0,1,2,3,代入二项分布概率函数,可以得出出现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766 P(1)= 0.0097656 P(2)= 0.0439453 P(3)= 0.1171876 抽到3只和3只以下雄性动物的概率为:
F(3)=P(0)+P(1)+P(2)+P(3)
=0.1718751 3.1.2 服从二项分布的随机变量的特征数
平均数: μ=nφ 或 μ=φ 方差: σ2=nφ(1-φ)或
3.1.3 二项分布应用实例
21n例1 以杂合基因型Wvwv的小鼠为父本,隐性纯合子小鼠wvwv为母本杂交(wv波浪毛,Wv直毛),后代两种基因型的数目应各占一半。实验只选每窝8只的,多于 8只和少于8只的都淘汰。结果列在下表中。直毛后代数 观测频数
(x)(f)fx fx2 p(x)Np(x)0 0 0 0 0.003906 0.124992 1 1 1 1 0.031250 1.000000 2 2 4 8 0.109375 3.500000 3 4 12 36 0.218750 7.000000 4 12 48 192 0.273437 8.749984 5 6 30 150 0.218750 7.000000 6 5 30 180 0.109375 3.500000 7 2 14 98 0.031250 1.000000 8 0 0 0 0.003906 0.124992 总数 N=32 139 665 0.999999 31.99968 样本平均数、总体平均数;样本方差、总体方差如下:
321n84.0000002fx2fx139x4.343750Ns2fxN2N11392665321.974798312n12 例2 遗传学中单因子杂交RR×rr,F1代为Rr,F1自交,F2基因型比符合二项分布。在F2中P(R)=φ=1/2,P(r)=1-φ=1/2,n=2。展开二项式:
1222112122111222221RR1Rr1rr424 27 对于两对因子,n=4 在为人类或动物遗传学研究中,为了保证实验顺利完成,在制定试验计划时,首先要以指定概率求出所需样本含量n。
例3 用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔杂交,F1代为黑色正1111111114464222222221464116161616161/16bbrr。问最少需要多少F2代家兔,才能以99%的概率得到一个棕色短毛兔?
答: φn =(15/16)n = 0.01 n(lg15-lg16)= lg0.01-0.02803n =-2.00000 n =71.4 3.2 泊松分布
3.2.1 泊松分布的概率函数
在二项分布中,当某事件出现的概率特别小(φ→0),而样本含量又很大(n432234常毛长的家兔(BbRr), F1代自交,F2代表型比为:9/16B_R_ : 3/16B_rr : 3/16bbR_ : →∞)时,二项分布就变成泊松分布了。泊松分布是描述在一定空间、长度、面积、体积或一定时间间隔内,点子散布状况的理想化模型。泊松分布的概率函数为:
pxxx!e,x0,1,2,3.2.2 服从泊松分布的随机变量的特征数
泊松分布的平均数: μ= μ
可见,泊松分布的平均数就是泊松分布概率函数中的μ。
泊松分布的方差: σ2= μ
概率函数中的μ不但是它的平均数,而且是它的方差。3.2.3 泊松分布应用实例 例1 在麦田中,平均每10m2有一株杂草,问每100m2麦田中,有0株、1株、2株、„杂草的概率是多少?
解: 先求出每100m2麦田中,平均杂草数μ
μ= 100/10= 10株
将μ代入泊松分布的概率分布函数中,p(x)= 10x/x!e10, 即可求出x= 0,1,2,„ 时所相应的概率。结果如下:
x ≤5 6 7 8 9 10 p(x)0.0671 0.0631 0.0901 0.1126 0.1251 0.1251 11 12 13 14 ≥15 0.1137 0.0948 0.0729 0.0521 0.0835
例2 绘制遗传连锁图时,制图函数是通过泊松分布推演出的。在一对同源染色体之间交换的出现是服从泊松分布的,将x=0代入泊松分布的概率函数中,p000!ee得出两基因座之间无交换出现的概率。两基因座之间至少出现一次交换的概率P(x≥1)= 1-e-μ。从遗传学理论可知,在两基因座之间大于等于1的任何有限次交换其重组频率恒等于50%。因此重组率
RF解出两基因座之间的平均交换次数
11e2 μ= -ln(1-2RF)
两基因座之间平均交换一次,其图距为50m.u.,从而可以得出图距 MD=-50ln(1-2RF)
3.4 正态分布(重点)3.4.1 正态分布的密度函数和分布函数
对于平均数是μ,标准差是σ的正态分布,其密度函数为:
fx1x2222e,x,0正态分布密度函数的图象称为正态曲线
正态分布曲线
以符号N(μ,σ2)表示平均数为μ,标准差为σ2的正态分布。随机变量X的值落在任意区间(a,b)内的概率
PaXb累积分布函数
ba1fxdx2bae2x22dxFxPXx3.4.2 标准正态分布
xfzdz12xez222dz当μ=0,σ=1时的正态分布称为标准正态分布,标准正态分布记为N(0,1)。标准正态分布的密度函数为:
u12eu22,u标准正态分布的分布曲线如下图
v2uPUu122uedv标准正态分布曲线
累积分布函数分布图如下:
标准正态分布的累积分布曲线
标准正态分布有以下特性:
1、在u=0时φ(u)达到最大值。
2、当u不论向哪个方向远离0时,φ(u)的值都减小。
3、曲线两侧对称。
4、曲线在u=-1和u=1处有两个拐点。
5、曲线与横轴所夹面积等于1。
6、累积分布曲线围绕点(0,0.5)对称。3.4.3 正态分布表的查法
为了简化计算,随机变量(U)的值(u)落在区间(a,b)内的概率,根据标准正态累积分布函数,已经把不同u值的Ф(u)值列成表(附表2),称为正态分布表。根据以下关系式可以扩展正态分布表的使用范围。
P0Uuu0.5PUuuPUPUu2uu12uPu1Uu2u2u1例1 查u=-0.82及u=1.15时的Ф(u)值。解:Ф(-0.82)=0.20611 Ф(1.15)=0.87493 例2 随机变量U服从正态分布N(0,1),问随机变量的值落在0,1.21间的概率是多少?落在-1.96,1.96间的概率是多少? 解:
1)P(0
=1-Ф(-1.96)=1-0.05000 =0.95000
对于服从N(μ,σ2)的随机变量X,首先要进行标准化变换,使之变为标准正态分布,再按上述方法查表。变换的方法是:
u对于随机变量X
xxxPXxPU在对x进行标准化变换后,即可从正态分布表中查出相应的概率值。
例3 已知高粱品种“三尺三”的株高X服从正态分布N(156.2,4.822),求:1)X<161厘米的概率;2)X>164厘米的概率;3)X在156-162厘米间的概率。
解:
1)2)161156.2PX16110.843144.82164156.2PX164111.624.8210.947380.05262P152162156.2152156.21624.824.821.20.870.884930.192510.692783)X3.4.4 正态分布的单侧临界值
附表3给出了满足P(U > uα)=α时的uα值。即曲线右侧尾区一定面积(α)下,所对应的u值uα,uα称为α的上侧临界值。
对于左侧尾区,满足P(U <-uα)=α时的-uα值,称为α的下侧临界值。
将α平分到两个尾区,每一尾区的曲线下面积只有α/2,满足P(|U| > uα/2)=α时的uα/2称为α的双侧临界值。
正态分布的单侧(上侧)和双侧临界值
3.6 中心极限定理
假设所研究的随机变量X可以被表示为许多相互独立的随机变量Xi的和,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以认为X服从或近似地服从正态分布。
推理:若已知总体平均数为μ,标准差为σ,那么,不论该总体是否正态分布,对于从该总体所抽取的含量为n的样本,当n充分大,其平均数渐近服从正态分布N(μ,σ2/n)。
第五篇:统计学
1.统计调查方案设计的主要内容是什么?调查目的、调查对象和调查单位、调查项目和调
查表、调查时间、调查的组织实施计划等。
2.统计数据的质量标准有哪些?准确性、精确度、关联性、及时性、一致性和有效性。
3.什么是统计分组?统计分组有何作用?①统计分组就是根据被研究对象总体的内在特
点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。②划分现象的类型、揭示现象的内部结构、分析现象之间的依存关系。
4.统计分组有哪些基本类型?①按分组标志不同,可分为 品质分组和数量分组。②按每组变量值的取值范围,可分为 单项分组和组距分组。③按分组标志的多少及排列方式,可分为 简单分组、平行分组和复合分组。
5.什么是集中趋势?测度集中趋势常用指标有哪些?①集中趋势是指一组数据向某一中心
值靠拢的程度,它反映了一组数据中心点的位置所在。②众数、中位数、四分位数、算术均值、调和均值、几何均值。
6.什么叫离散程度?测度离散程度常用指标有哪些?①离散程度是反映各变量值远离其
中心值的程度。②异众比率、四分位差、极差、平均差、方差、标准差、离散系数。
7.什么是时间序列?分析时间序列研究的目的。时间序列就是将反映某种现象的统计指标
在不同时间上的数值,按时间先后顺序排列而成的数列。时间序列分析研究的目的:①描述现象发展的动态变化;②判断现象发展变化的趋势,并探索其数量规律性;③预测现象未来的发展趋势
8.什么是统计指数?它有何作用?①广义指数泛指两个关联数值对比所形成的相对数。
狭义指数仅指反映不能直接相加的复杂现象总体在不同时间或空间上综合变动情况的特殊相对数。
9.什么是指数体系,指数体系的作用有哪些?①广义指数体系泛指若干个内容上互相关联的统计指数所构成的体系。狭义的指数体系是若干个在经济上有联系、数量上有对等关系的指数所形成的整体。②作用:利用各指数之间的联系进行指数间的相互推算,即根据已知的指数推算未知的指数。进行因素分析,即分析现象的总变动中各有关因素的影响方向与程度。
10.什么是概率抽样与非概率抽样?二者有何根本区别。①概率抽样是指根据随机原则从总
体中直接抽选若干个体构成样本的方法。②非概率抽样是指不遵守随机原则,而是根据调查者的主观愿望、经验和知识,从总体中有意识地抽取若干个体构成样本的方法。③根本区别:概率抽样遵循了了随机原则,非概率抽样则没有遵循随机原则。
11.了解参数估计的特点与概念、作用。①概念:参数估计是在随机抽样基础上,用样本统
计量估计总体参数。②特点:以随机取样为前提;运用概率估计法;存在着可控性误差。③作用:用于不可能或不必要进行全面调查的总体数量特征的估计;用于全面调查资料的评价和验证;用于生产过程的质量控制。