第一篇:统计学教程-理解、心得、笔记
管理统计学学生用讲义
【第一章】绪论
本章学习要求:
1、理解统计学的含义
2、了解统计学的应用领域
3、掌握统计学中的几组基本概念
4、掌握统计应用过程中的注意事项
第一节
统计学概述
一、什么是统计
1.统计活动:指各国政府或其他机构为满足政治、经济、社会等方面的需要以及科学研究的需要而进行的收集、整理、分析、编制有关数据的一系列活动。
2.统计资料:指由统计活动产生的原始的或已经加工、整理过的客观现象的数据资料。3.统计学:
指研究客观现象数量关系及其变化规律的方法论科学,是一门关于统计资料的收集、显示、描述和分析方法的学科。统计研究的过程:
实际问题收集数据(取得数据)解释数据(结果说明)整理数据(处理数据)分析数据(研究数据)
二、统计学的分类
1.描述统计学与推断统计学
描述统计学:准确、真实地反映某种客观现象的数量方面的特征的理论及方法。包括数据的收集、整理、数据的分析和显示等内容。目的是描述数据特征,找出数据的基本规律 推断统计学:通过部分数据特征推断全体数据特征的理论和方法。目的是对总体特征作出推断
概率论(包括分布理论、大数定律和中心极限定理等)样本数据反映客观现象的数据总体数据推断统计描述统计(统计数据的搜集、整理、显示和分析等)(利用样本信息和概率论对总体的数量特征进行估计和检验等)总体内在的数量规律性
2.理论统计学与应用统计学
理论统计学:指对统计学的一般理论和统计方法的数学理论的研究,由一系列的公理、定理以及严格的证明来组成。着重阐明统计学的数学原理,为统计方法提供理论基础。应用统计学:把统计方法应用于解决自然科学和社会科学领域中的实际问题时所产生的统计学,基本统计方法和各专业知识的结合就产生了社会统计学、人口统计学、生物统计学、卫生统计学等。
三、统计学的应用:详见教材第3页
第二节
基本概念
一、总体、样本及个体
总体(population):数据来源的范围 分类1:自然总体与测量总体
自然总体:由客观存在的具有相同性质的许多个别事物构成的整体,即所研究事物的全体。个体(element):组成总体的那些个别事物。
测量总体:个体所具有的某种共同属性的数值的整体
总结:测量总体是依附于自然总体而存在的,一个自然总体至少有一个甚至许多个测量总体 描述统计:总体通常指自然总体
推断统计:总体一般指测量总体 分类2:有限总体与无限总体
有限总体:组成总体的个体数量是有限的 无限总体:组成总体的个体数量是无限的 例:要收集某汽车制造厂生产的汽车质量数据 截止到某一时刻,有限总体 对时间不加以限制,无限总体
样本(sample):总体中的一部分个体所构成的整体 分类:自然样本和测量样本 三者的关系:
总体——集合
个体——集合中的元素
样本——集合的子集
所以,总体是确定的,样本是不确定的,它们都由个体组成。
二、标志、变量及指标
标志(attribute):反映个体所具有的某种属性或特征的概念或名称。分类:品质标志与数量标志 品质标志:反映个体性质特征 数量标志:反映个体数量特征 对标志的回答通常叫标志表现
变量(variable):具有不同标志表现的标志,如工龄、性别 品质变量(qualitative or attribute variable)数量变量(quantitative or numerical variable)指标(indicator):反映总体或样本特征的概念,与标志只是在反映层面上有区别
三、数据分类
1.数据的四种测度水平(measurement level)定类水平(nominal level),列名水准:只能归于某一类别的非数字型数据;对事物进行分类的结果,数据表现为类别,用文字来表述
定序水平(ordinal level),顺序水准、等级:只能归于某一有序类别的非数字型数据;对事物类别顺序的测度,数据表现为类别,用文字来表述
定距水平(interval level),间隔水准;与定比水平(ratio level),比率水准:共性:按数字尺度测量的观察值:结果表现为具体的数值,对事物的精确测度;区别:定距水平的零并不表示没有,定比水平的零表示没有。
变量定性定量特征 定类——列名定序——顺序定距——间隔定比——比率
运算功能 计数
计数;排序
计数;排序;加减
计数;排序;加减;乘除 测度水平定类水平定序水平定距水平定比水平分类
分类;排序
分类;排序;有基本测量单位
分类;排序;有基本测量单位;有绝对零点
课堂练习:
A.列名水准
B.顺序水准
C.间隔水准
D.比率水准
1.对某地区的全部产业依据产业构成分为第一产业、第二产业和第三产业,这里所使用的计量水准是()
2.对某地区某一天的平均温度进行测量,所得测度值为12℃,这里所使用的计量水准是()2.数据的分类
(1)根据变量值是否连续分:
离散型数据(discrete data):变量只能取整数值
连续型数据(continuous data):变量值可以在实数轴上连续变动
(2)根据数据的来源不同分:
横贯数据(cross-sectional data):对同一时间、不同个体(或总体、样本)的观察数据,也叫静态数据,截面数据
纵贯数据(longitudinal data):对同样的个体(或总体、样本)在不同时间上的多次观察所得到的数据,也叫动态数据,时序数据
统计数据的分类按计量层次按收集方法按时间状况分类的数据顺序的数据数值型数据metric观察的数据试验的数据截面的数据时序的数据categoricalrank
experimentaltime series observationalcross-sectional
【第二章】统计资料的收集与整理
本章学习要求:
掌握数据的来源
了解数据的收集组织方式 掌握数据的整理和表现方法
第一节
统计资料的收集与审核
从资料使用者的角度,分为原始资料的收集和次级资料的收集。
原始资料(raw data):指为了研究某一问题,调查者自己或委托他人专门收集的资料。次级资料(secondary data):指在以前就已被收集、整理过的统计资料。
一、原始资料的收集
原始资料收集的方法:试验和调查
1、试验方法(experimental method):通过控制一种或多种因素保持不变,只记录某种所研究因素的变化情况。
广泛应用于自然科学和工程技术
也用于社会科学和经济管理研究中
会刻意对某些个体加上某项处理,以期能够观察其反应:该特定处理是否会使反应改变。
2、统计调查(survey):根据研究的目的,采用一定的方法,对客观存在的事实进行记录,以取得实际统计资料的一种工作过程。
应用:对社会经济和管理现象的研究
目的:描述一个团体或一种状况
原则:观测,但别干扰
二、次级资料的收集
1、公开的出版物
2、来源于内部调查的数据
统计部门和政府部门公布的有关资料,如各类统计年鉴; 经济信息中心、信息咨询机构、专业调查机构提供的数据; 各类专业期刊、报纸、书籍所提供的资料;
各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料; 从互联网或图书馆查阅到的相关资料; 在研究中应优先考虑收集次级资料
注意:统计数据的含义、计算口径和方法,并注明数据的来源
三、统计资料的审核 1.原始资料的审核 完整性审核
检查应调查的单位或个体是否有遗漏
所有的调查项目或指标是否填写齐全 准确性审核
检查数据是否真实反映客观实际情况,内容是否符合实际
检查数据是否有错误,计算是否正确等 2.次级资料的审核 适用性审核
弄清楚数据的来源、数据的口径以及有关的背景材料
确定数据是否符合自己分析研究的需要 时效性审核
尽可能使用最新的数据
确认是否有必要做进一步的加工整理
第二节
统计调查
一、统计调查的组织形式
(一)定期报告制度——我国实行的是全面统计报表(statistical report forms)制度
1、统计调查方式之一
2、过去曾经是我国主要的数据收集方式
3、按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据
4、有各种各样的类型
(二)普查:
1、为特定目的专门组织的非经常性全面调查
2、通常是一次性或周期性的
3、一般需要规定统一的标准调查时间
4、数据的规范化程度较高
5、应用范围比较狭窄
注意:教材18页第五段错误。
(三)重点调查
1、为特定目的专门组织的非经常性非全面性调查
2、只对选择出来的重点单位进行调查
重点单位:单位数量很少,但在所调查变量的数值方面占有较大的比重的个体单位
3、节省人力、物力,可在相对较短的时间内对所要研究的总体有一个基本的了解
4、不能对总体进行推断,有些总体不存在重点单位,因而不能进行重点调查。
(四)抽样调查
1.从总体中抽取一部分单位作为样本进行调查。
2.具有经济性、时效性强、适应面广、准确性高等特点
3、根据获取样本的方法不同可以分为非概率抽样和概率抽样两大类
二、抽样形式
(一)非概率抽样(nonprobability sampling)依据研究任务的要求和对调查对象的分析,主观地、有意识地在总体中选取样本 优点:成本较低而且容易利用
(二)概率抽样(probability sampling)依据概率理论、按照随机原则选取样本 优点:能够说明估计的精度
(一)非概率抽样
1.方便抽样(convenience sampling)调查过程中由调查员依据方便的原则,自行确定入样单位 优点:容易实施,调查的成本低
缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体
在许多试探性调研时,缺乏经验而又急需真实数据的近似值时,这种方法很实用。2.主观抽样(judgment sampling)也叫判断抽样
根据个人的主观意识来选择总体中有代表性个体的方法,在我国也称为典型调查。
抽样结果是否具有代表性主要取决于调查者本人对总体的了解程度。
3.配额抽样(quota sampling)首先将总体按一定标志分层或分类,然后在各层或各类中主观地确定抽样比例,根据比例主观地选取个体单位组成样本。
操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似。
4.滚雪球抽样(snowball sampling)通过初始被调查者的推荐来挑选下一个被调查者的抽样程序。
常用于低发生率或少见的总体中进行抽样。
优点是调查费用大大降低,缺点是调查质量可能被降低
5.自愿样本(补充内容)被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息 自愿样本与抽样的随机性无关 样本是有偏的
不能依据样本的信息推断总体
(二)概率抽样 特点
按一定的概率以随机原则抽取样本
抽取样本时使每个单位都有一定的机会被抽中
每个单位被抽中的概率是已知的,或是可以计算出来的
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率 抽样方法:
重复抽样:每抽出一个单位,登记其特征值后,仍放回原总体之中 非重复抽样:抽出单位登记其特征值以后不再放回原总体之中。
对有限总体抽样时,两种方法会产生不同的结果,在实践中多以非重复抽样为主。1.简单随机抽样(simple random sampling)按照随机原则从总体中随机抽取个体组成一个样本,每一个个体被抽中的机会都是相等的。
特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 局限性
当总体单位数很大时,不易构造抽样框
抽出的单位很分散,给实施调查增加了困难
没有利用其他辅助信息以提高估计的效率
2.等距抽样(systematic sampling)将个体按某一标志排队,然后随机确定某一开始位置,再按一定的相等距离抽取调查单位。优点:操作简便,可提高估计的精度 缺点:对估计量方差的估计比较困难
常用于:工业企业流水线上的产品抽样,化工厂传输管理中化工产品的抽样,农作物产量预测的抽样,公路车流量的抽样等方面。3.分层抽样(stratified sampling)先将总体依照某一种或某几种特性分为若干个层,然后从每一层中随机地抽取个体单位组成样本。
优点
保证样本的结构与总体的结构比较相近,从而提高估计的精度
组织实施调查方便
既可以对总体参数进行估计,也可以对各层的目标量进行估计 注意与配额抽样的区别
4.整群抽样(cluster sampling)
1)将总体按照某种标志划分成为不同的群,每个群大小可以相同,也可以不同
2)然后随机抽取几个群,对抽中的群中所有个体单位都进行调查 特点
抽样时只需群的抽样框,可简化工作量
调查的地点相对集中,节省调查费用,方便调查的实施
缺点是估计的精度较差
5.多阶段抽样(multi-stage sampling)先抽取群,再从选中的群中抽取出若干个单位进行调查,使抽样的段数增多,就称为多阶段抽样
具有整群抽样的优点,保证样本相对集中,节约调查费用
需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开
在大规模的抽样调查中,经常被采用的方法 课堂练习
重点调查中重点单位指的是()A、具有典型意义或代表性的单位
B、那些具有反映事物属性差异的品质标志的单位 C、能用以推算总体指标的单位
D、在总体中具有举足轻重地位的单位
要了解北京市居民家庭的收支情况,最适合的调查方式是()A.普查
B.重点调查 C.抽样调查
D.全面统计报表 在下列调查中,最适合采用重点调查的是()A、了解全国钢铁生产的基本情况 B、了解全国人口总数
C、了解北京市居民家庭收支情况 D、了解某校学生的学习情况
A.普查 B.随机抽样调查 C.判断抽样调查 D.方便抽样调查
某出口企业对其产品质量进行检验,采用的调查方式是()街头拦截式获得样本数据的方式属于()
在抽样前,先将总体各单位按照某个标志区分为性质不同的若干组,然后在各组内随机抽选出各组的样本单位共同组成样本,这种抽样方式是()A.等距抽样
B.分层抽样
C.整群抽样
D.简单随机抽样
连续生产的灯管厂,每天每隔3小时抽10分钟生产的产品进行质量检查,这种抽样的组织形式称为()A.系统抽样
B.简单随机抽样
C.分层抽样
D.整群抽样
了解居民消费水平的变化状况,一般采用入户调查。确定样本户的方式是()A 系统抽样 B 分层抽样 C 整群抽样 D 多阶段抽样
下列适宜采用抽样调查的是()(多选题)A 湖水养殖鱼苗数量调查 B 全国耕地面积调查
C 居民生活消费基本情况调查 D 农产品产量调查
三、统计调查方法 1.观察法
就调查对象的行动和意识,调查人员边观察边记录以收集所需信息
调查人员不是强行介入
能够在被调查者不察觉的情况下获得资料 2.自填法
调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷
通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷交回
问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发、网络等 3.访问法
由调查人员直接对被调查者进行询问并记录调查结果的方法。
包括面对面的访谈、电话访谈、网络访谈等。
第三节
调查方案的设计
一、调查方案的主要内容 1.确定统计调查目的 调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围
调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?” 3.确定调查项目 调查的具体内容 通常表现为表格或问卷 回答“调查什么?” 4.其他
明确调查所采用的方法 确定调查时间和调查期限
调查时间:资料本身所属的时间 调查期限:调查工作的起止的时间 调查的组织与实施细则 课堂练习
某县有35万人口,其中农村居民占90%,现欲作农村居民AIDS感染情况及其影响因素的调查研究,其调查对象为()A.该县所有常住人口
B.该县所有农村居民
C.该县已婚的所有常住人口
D.该县已婚的所有农村居民
E.该县已婚的所有农村育龄妇女
对于上述研究,所确定的调查单位应该是()A.该县的农村居民个体
B.该县的自然村
C.该县的每个农村家庭
D.该县的行政村
E.该县的每个乡镇 对于上述研究,较适宜的调查组织形式是()A.简单随机抽样调查
B.普查
C.系统抽样调查
D.整群抽样调查
二、调查问卷的设计
(一)什么是问卷
用来搜集调查数据的一种工具
调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种 9 调查形式
结构上一般都由开头部分、甄别部分、主体部分和背景部分组成
(二)问卷的结构
问卷的结构—开头部分
包括:问候语、填写说明、问卷编号
问卷的结构—甄别部分
1.甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者进行调查
2.通过甄别,可以筛选掉与调查事项有直接关系的人,以达到避嫌的目的 3.可以确定哪些人是合格的被调查者,哪些人不是
4.甄别的目的是确保被调查者合格,能够作为该市场调查项目的代表,从而符合调查研究的需要
问卷的结构—主体部分 是调查问卷的核心内容
包括所要调查的全部问题,主要由问题和答案所组成 问卷的结构—背景部分
通常放在问卷的最后,主要是有关被调查者的一些背景资料
该部分所包含的各项问题,可使研究者根据背景资料对被调查者进行分类比较分析
(三)提问项目的设计
提问的内容尽可能短。
用词要确切、通俗。可按6W准则加以推敲。6W即Who(谁),Where(何处),When(何时),Why(为什么),What(什么事),How(如何)一项提问只包含一项内容。
避免诱导性提问。
避免否定形式的提问。
避免敏感性问题
(四)回答项目的设计
回答的类型与方法开放性问题(自由回答型)两项选择法多项选择法单项选择型多项选择型限制选择型封闭性问题(选择回答型)顺序选择法评定尺度法双向列联法
开放性问题:
对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由作出回答
属于自由回答型
优点:比较灵活,适合于搜集更深层次的信息,特别适合于那些尚未弄清各种可能答案或潜在答案类型较多的问题。而且可以使被调查者充分表达自己的意见和想法,有利于被调查者发挥自己的创造
缺点:由于会出现各种各样的答案,给调查后的资料整理带来一定困难 封闭性问题:
对问题事先设计出了各种可能的答案,由被调查者从中选择
问题的答案是标准化的,有利于被调查者对问题的理解和回答,也有利于调查后的资料整理 对答案的要求较高,对一些比较复杂的问题,有时很难把答案设计周全 问题的答案是选择回答型,所以设计出的答案一定要穷尽和互斥
回答方法有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种 两项选择法:
答案只有两项,要求被调查者选择其中之一来回答
优点:被调查者只需在二者之中选择一项,回答比较容易;调查后的数据处理也很方便 缺点:得到的信息量较少;当被调查者对两项答案均不满意时,很难作出回答 多项选择法:
在设计问卷时,对一个问题给出三个或三个以上的答案,让被调查者从中选择进行回答 根据要求选择的答案多少不同,有以下类型
单项选择型:要求被调查者对所给出的问题答案选择其中的一项
多项选择型:要求被调查者对所给出的问题答案中,选出自己认为合适的答案,数量不受限制
限制选择型:要求被调查者在所给出的问题答案中,选出自己认为合适的答案,但数量要受一定限制
顺序选择法: 问题答案有多个,要求被调查者在回答时,对所选的答案按要求的顺序或重要程度加以排列。其中,对所选的的答案数量可以进行一定的限制,也可以不进行限制 问题答案不仅可以反映所要调查的内容,而且可以反映出被调查者对问题的看法,从而增加了信息量
评定尺度法(量表式):
问题答案,由表示不同等级的形容词组成,并按照一定的程度排序,由被调查者依次选择
双向列联法(矩阵式/表格式):
将两类不同问题综合到一起,通常用表格来表现 表的横向是一类问题,纵向是另一类问题
这种问题结构可以反映两方面因素的综合作用,提供单一类型问题无法提供的信息 可以节省问卷的篇幅
(五)问题顺序的设计 问题的安排应具有逻辑性 问题的顺序应先易后难
能引起被调查者兴趣的问题放在前面 开放性问题放在后面
版面格式的设计:
问卷的结构安排要合理,问卷的主体部分要突出、醒目 不要编排过密,各问题之间要留出一定的空间
外表及内容的印刷要美观
第四节
资料整理的方法
一、统计分组的概念及作用 统计分组(statistics classification)根据统计研究的需要,将总体按照一定的标志划分为若干个组成部分的方法。步骤:
按照研究目的,选择一个或一个以上的分组标志,对调查资料进行分组
编制适当表格以便汇总资料
将资料逐一进行计数和加总。作用(见教材33-34页):
可以区别事物的不同性质。
可以反映和研究总体内部结构。
反映和研究现象之间的依存关系。
二、按品质标志分组
频数(frequency):落在各类别中的数据个数 频率:某一类别频数占总频数的比值
百分比(percentage):将对比的基数作为100而计算的比值
三、按数量标志分组
分组方法单项式分组组距式分组等距分组异距分组
1、单项式分组
(1)将一个变量值作为一组(2)适合于离散变量
(3)适合于变量值较少的情况
2、组距式分组
(1)将变量值的一个区间作为一组(2)适合于连续变量
(3)适合于变量值较多的情况
(4)需要遵循“互斥”和“穷尽”的原则(5)可采用等距分组
(6)也可采用不等距分组 几个概念:
1.下限(lower limit):一个组的最小值 2.上限(upper limit):一个组的最大值
3.组距(class interval):上限与下限之差
4.组中值(class midpoint):下限与上限之间的中点值
组中值上限下限2 等距分组步骤:
1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K K1lgnlg2
注意:K只是参考数值,不是必分的组数。
2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值(maximum)和最小值(minimum)及所分的组数来确定,即
组距=(最大值-最小值)÷组数
3)统计出各组的频数并整理成频数分布表 等距分组与不等距分组在表现频数分布上的差异 等距分组
各组频数的分布不受组距大小的影响 可直接根据绝对频数来观察频数分布的特征 不等距分组
各组频数的分布受组距大小不同的影响
各组绝对频数的多少不能反映频数分布的实际状况
需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况 课堂练习
1.指出下列分组哪个是按品质标志分组()A.人口按年龄分组
B.产品按等级分组
C.家庭按收入水平分组
D.企业按职工人数多少分组
2.某地区农民人均收入最高为426元,最低为270元,据此分为六组形成闭口式等距数列,各组的组距为()
A.71
B.26
C.156
D.348 3.在分组时,凡遇到某单位的变量值刚好等于相邻两组上下限数值时,一般是()A.将此值归入上限所在值
B.将此值归入下限所在组
C.另立一组
D.将此值归入上限所在组或下限所在组均可
4.采用组距分组时,用组中值作为该组数据的代表值,其假定条件是()A.各组的频数相等
B.各组的组距均相等 C.各组的变量值均相等
D.各组数据在本组内呈均匀分布或在组中值两侧呈对称分布
四、累计频数分布
向上累计频数分布:
将各组的频数由下至上(从最低值组向最高值组)依次累计,由此形成的标志值与频数累计值的分布表格
向下累计频数分布:
将各组的频数由上至下(从最高值组向最低值组)依次累计,由此形成的标志值与频数累计 13 值的分布表格
用于说明截止到某一变量值以上或以下所对应的频数(频率)是多少。
五、统计表
(一)统计表的结构
总(行标题名称)行标题合计(或平均)
(二)统计表编制的一般要求
标题列标题(变量)数字数字顶线列标题(变量)隔线数字数字隔线底线 *表外附加(根据具体要求设置此项)项目总标题行列标题线条要求
1、简洁、概括、明了。
2、写在表的上方。
3、必要时注明时间和地点。
1、文字简明。
2、有计量单位的要注明。
1、不宜过多。
2、一般不使用竖线和斜线。
3、纵标目与内容用线条隔开。
1、一律用阿拉伯数字。
2、小数位数应一致,位次应对齐。
1、丢、漏数字。
2、小数位数保留不一致。易发生的错误
1、过于简略。
2、漏写标题。
3、过于烦琐或不确切。
1、标目过多。
2、层次不清。
1、线条过多。
2、不必要地使用竖斜线。数字
3、表内一般无空格;未记录者用―---‖、无数字者用―-‖表示;数字为0者则标明―0‖。一般不设置―备注‖项;必要时使用―*‖标出,在表的下方说明。不必要地使用备注 课堂练习
A
性别
B 男、女 C “30岁以下”,“30-40岁”,“40-50岁”,“50-60岁”,“60岁以上”
D 年龄组
E 以上都不是
1.要分析中医药机构不同性别的技术人员在年龄结构上有无差别,设计统计表时,列标题应当是()
2.以上统计表中,行标题的名称应当是()课后作业
某商场某年一、二季度末库存适销情况 项目 实际库存总值 其中:畅销商品平销商品 滞销商品 其中:盲目进货 货不对路 过时商品 残损变质 其他 第二季度末 250.8 195.2 32.3 23.3 5.5 10.8 5.6 1.1 0.3 第一季度末 214.0 173.8 26.3 13.9 5.2 4.6 3.2 0.7 0.2
注:数据单位为万元
要求根据表中数据资料对该商场第二季度库存商品的适销情况进行分析。
【第三章】统计资料的描述
本章学习要求:
灵活运用不同种类指标分析问题 掌握集中趋势的应用条件 掌握离散趋势的应用条件
灵活运用统计图描述统计资料
第一节
总量描述与相对比较
一、总量描述
总量指标:用来说明客观现象在一定时间、地点、条件下所达到的总规模或总水平的指标,也叫绝对数。
如:一个国家的人口数、土地面积、一个企业的销售额、年产量等数据 用途:
认识客观事物的起点
编制计划、实行管理的主要依据
计算相对指标和平均指标的基础
分类:按反映总体的时间状况不同来分
时期指标:反映总体(样本)一段时间内发展变化累计的成果 一个企业的销售额、年产量
时点指标:反映总体(样本)在某一时刻达到的总规模或总水平一个国家的人口数、土地面积
资产、负债、所有者权益、收入、费用、利润? 时期指标与时点指标的区别:
1.时期指标在不同时间上的数值可以相加,时点指标数值相加没有意义。
2.时期指标数值大小与包括的时间的长短成正比关系,时点指标与时间的间隔没有直接关系。
3.时期指标值是连续登记得到的,时点指标数值不需要进行连续登记。
二、相对比较
相对指标:两个有联系的指标对比所形成的新的指标,也叫相对数。
如:我国人均粮食产量(粮食产量/我国平均人口)、恩格尔系数(食品消费支出/总支出)表现形式:百分数(%)、千分数(‟)、成数、系数、倍数、复名数等
采用哪种形式取决于相对数的数值大小或实践惯例。应用前提:形成相对指标的两个指标要具有可比性
两个对比的指标有内在的必然联系
两个指标的数值要具有可比性,统计范围、计算时间、方法、价格及计量单位等方面应可比。用途:
可以用来补充说明总量指标
使人们能够更深入地了解总体(样本)内部数量之间的相互联系和相互制约的关系。相对指标的类型及用途
1、计划完成相对数
计划期内某一指标的实际完成数与其计划数对比计算的结果,反映该指标计划完成程度,常以百分数表示计划完成相对数实际完成数计划完成数100%
例1:某企业2001年计划实现利润总额为200万元,而实际完成利润208万元,则该企业利润计划完成程度是多少?是否超额完成计划? 例2:某企业计划产量比上期要增长10%,而实际增长8%,则产量计划完成程度是多少?是否超额完成计划?
例3:某企业某产品单位成本计划比上期要降低6%,实际降低9%,则单位成本计划完成程度是多少?是否超额完成计划? 对计划完成程度的评价:
1.如果计划任务是按最低限额规定的,如产量、利润等,计划完成程度大于100%才算超额完成计划。
2.如果计划任务是按最高限额规定的,如产品单位成本、废品损失等,计划完成程度要小于或等于100%才算完成计划,其中不足100%的部分为超额完成计划的程度。
3.计划规定的既是最高限额,又是最低限额,如职工人数、工资总额等指标,计划完成程度最好为100%,或略低于100%。
课堂练习
下列计划完成情况,超额完成计划的是()A.工业总产值计划完成百分数120%
B.成本计划完成百分数105%
C.单位产品所耗费的劳动时间的计划完成百分数102% D.单位时间的产品产量的计划完成百分数90%
2、结构相对数
在一定范围内的部分数值和全部数值之比,反映该范围内的内部构成状况,一般以百分数表示结构相对数部分数值全部数值100%
一般在统计分组的基础上产生,各组的频率——结构相对数反映各组数据在全部数据中所占的比重,其相加总和为100%。
课堂练习
某地调查结果表明,近年来医院中基本建设费用在医院总费用中的比重呈逐年下降趋势,不 16 可能造成此结果的原因是()A
基本建设费用下降,其他费用基本不变
B 基本建设费用基本不变,其他费用上升
C 基本建设费用基本不变,总费用下降
D 基本建设费用下降快,其他费用下降慢
3、比例相对数
在同一总体(或样本)中各部分同类数值之间对比所得的比例,反映各部分数值之间的对比关系,一般以倍数或系数表示比例相对数某一部分数值另一部分数值
在统计分组基础上产生的,说明内部构成的状况,还可以将多个部分排列在一起进行比较,以说明各部分之间的配比状况。
4、比较相对数
某一总体的数值与另一总体同类数值对比的比例,反映某种现象在不同总体间差异程度,一般用倍数或系数表示比较相对数某一总体数值另一总体同类数值与比例相对数一样, 也是两个同类数值的对比,不同的是比例相对数是指总体内部不同部分数值之比,而比较相对数是不同总体数值之比。
5、强度相对数
两种不同类别数值对比的比例,用以说明现象的强度、密度和普及程度等
大多数用复名数表示,如人均国内生产总值(元/人),也有些用无名数表示,如资金利税率(%)分类:
正指标:比值的大小与其反映的强度、密度和普及程度成正比
逆指标:比值的大小与其反映的强度、密度和普及程度成反比
某病患者100人,其中男性95人,女性5人,分别占95%和5%,则结论为()A.该病男性易得
B.该病女性易得
C.该病男、女性易患程度相等
D.尚不能得出结论
E.根据该资料可计算出男女性的患病率
6、动态相对数
某类不同时间数值对比的比值,也称为发展速度,反映某类现象在不同时期的发展变化程度 某一类别数值强度相对数另一类别数值将要说明的时期动态相对数报告期数值100%基期数值作为比较基础的时期
三、常用经济指标
总产值(gross output value):用货币表现的一定时期内全部产品的价值。
增加值(value added):指在报告期内常住单位新创新的价值。
国内生产总值(gross domestic product,GDP):指一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果。
国民总收入(gross national income, GNI):指一个国家(或地区)的国民一定时期内在国内外生产的最终产品及劳务的价值总和。
人口自然增长率(natural growth rate of population)年内出生人数年内死亡人数1000‰
年平均总人口数 失业率(unemployment rate)
第二节
集中趋势的描述
集中趋势:一组数据向其中心值靠拢的倾向和程度,用来代表现象的一般水平和发展状态
测度集中趋势就是寻找数据的代表值或中心值
不同测度水平数据用不同的集中趋势测度;
低测度水平数据的测度值适用于高水平的测量数据,但高水平数据的测度值不适用于低水平的测量数据。
一、算术平均数(arithmetic mean)也叫均值,是一组数据的和除以数据的个数,通常用μ(总体均值)或x(样本均值)表示。
Xi1NiNxxi1nin
1.未分组资料——简单算术平均数 2.单项式分组资料
3.组距式分组资料 4.均值的应用问题
1)当数据中有极大值或极小值存在时,均值会受到很大影响,其结果会掩盖数据的真实特征,使均值失去代表性。
2)使用分组资料数据计算总平均数时,由于各组频率对平均数的影响,在对总平均数进行对比时,要注意结合组平均数补充说明。3)要以分布数列和典型事例作为补充
5、算术均数的用途
(1)适用于正态分布的资料,用于反映其集中趋势。(2)用于计算标准差。
(3)用于构造检验统计量,进行统计推断。
二、调和平均数(harmonic mean)调和平均数就是数据倒数平均数的倒数
xhn111x1x2xnn1xxhm1m2mnmnm1m2x1x2xnmmxmi是第i个数据的权数,但不是频数
调和均数的特点及其与算术均数的关系
(1)调和均数实际上就是算术均数的变形。当分母已知时就直接用算术均数;当分母未知时,就要使用调和均数。
(2)当有x为0时,不能计算调和均数。
三、几何平均数(geometric mean)几何平均数是指n个数据连乘积的n次方根。
xgnx1x2xnnxi分组资料xgffffx11x22xnnfxifi
应用及特点:
1.主要用于各种比率的平均,尤其在计算动态比率的平均时,如平均发展速度。
2.用于表现呈倍数关系(等比)资料的集中趋势或平均水平。在医学中常用于求抗体滴度的平均水平;某些疾病(中毒、传染病)的平均潜伏时间。(对数正态资料)3.对同一组资料,调和均数≤几何均数≤算术平均数
四、众数(mode)是指全部数据中出现次数最多的数值,一般用Mo表示。
1、未分组资料
如果在一组数据中:
只有一个变量值出现次数最多,一个众数;
有两个(或多个)变量值出现次数相同并最多,则有两个(或多个)众数;若出现次数最多但不相同,则出现次数最多的数值为主要众数,其他为次要众数; 变量值出现的次数都相同,没有众数。2.分组资料
3、众数的应用问题
众数的特点是不受极端值的影响,如农贸市场上某种商品的价格水平;市场上各种尺码鞋子的需求量;房地产商关心哪种“格局”房屋销售最多;饮料厂商关心哪一种“颜色”的饮料销售最多;
当样本数据出现两个众数时,它提醒我们应怀疑这样的数据是否来自两个不同的总体;
只有在数据足够多,且有明显的集中趋势时,众数才有代表意义,否则不宜用众数代表集中趋势。
五、中位数(median)19 将一组数据按大小顺序排列以后,处于中间位置的数值,一般用Me 表示
1、未分组资料
n1总结:有n 个数据的有序数列,用Xi 代表第i 项的数值,中位数的位置是2XnXn当n 为奇数时,MeXn1;当n 为偶数时,Me2221
2、分组资料
3、中位数的应用问题
不受个别极端值的影响,表现出稳定的特性,在偏态分布中使用。因此在反映人口、产品质量、价格、居民收入时常用。
方便,在某些场合,不能计算均值时,中位数就是一个较好的测度值。
六、均值、众数、中位数的比较
1.众数(定类):不受极端值影响;具有不惟一性;数据分布偏斜程度较大时应用 2.中位数(定序):不受极端值影响;数据分布偏斜程度较大时应用
3.均值(定量):易受极端值影响;数学性质优良;数据对称分布或接近对称分布时应用
第三节
离散程度的描述
离散程度是数据分布的另一个重要特征;
反映各变量值远离其中心值的程度(即数据分散或离散的程度);离散指标数值越小,数据的变异越小
可说明集中趋势测度值的代表性;
不同类型的数据有不同的离散程度测度值。
一、全距(range)又称极差,是指数据中最大值与最小值之差,用R表示,公式为:R=Xmax-Xmin
优点:易理解,计算简便。可用于:说明一个地区的温度情况;描述一种股票的波动情况;产品质量控制中的R图。
缺点:不能反映组内其它数据的变异度;样本含量相差悬殊时不宜比较其极差;不够稳定。
最粗略的离散指标,一般仅适用于初步判断、观察值很少时,或与其他指标共同使用。
二、平均差(mean absolute deviation)
MAD各项数值与其均值之差(离差,deviation)绝对值之和的平均数,公式为:
|xx|
n分组资料公式:MAD|xx|ff
代表了所有数据离均值的平均距离。但因使用了绝对值,不便于进一步计算,在实际中较少应用,预测时可用于说明误差。
三、方差(variance)、标准差(standard deviation)数据离散程度的最常用测度值;
反映了各变量值与均值的平均差异;
方差(variance)是全部数据离差平方的平均数 标准差(standard deviation)是方差的算术平方根
根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 样本方差s2样本标准差s2(xx)n12(xx)总体方差2总体标准差2(X)N(X)N2n12
分组资料2(X)f总体方差f(X)f总体标准差f(xx)f样本方差sf1(xx)f样本标准差sf12222
标准差的应用
表示变量分布的离散程度。
结合均数描述正态分布规律。
结合均数计算变异系数。
结合样本含量计算标准误。
四、离散系数(coefficient of variation)标准差与其相应的均值之比,也叫变异系数对数据相对离散程度的测度
消除了数据水平高低和计量单位的影响 用于对不同组别数据离散程度的比较
1.()可用于比较身高与体重的变异度 A.方差
B.标准差
C.变异系数
D.全距
2.最小组段无下限或最大组段无上限的频数分布表资料,最好用()描述其集中趋势。A.均数
B.标准差 C.中位数
E.几何均数
某单位有两个部门,上月一部门、二部门平均工资分别为2000元,2200元。本月一部门职工在全单位职工中所占比重上升,二部门所占比重下降,如两部门职工的工资水平不变。该单位平均工资本月比上月()
A.提高
B.下降
C.持平
D.不一定
xn
A 中位数
B 算术均数
C 调和均数
D 几何均数
E 众数 1.玻璃瓶制造商关心的是制造出来的瓶子的正确尺寸,应选用_____ 2.高级家具制造商在某地开拓销售业务,对该制造商来说,反映当地居民家庭平均收入情况更有用的指标是_____ 3.一组观察值为2,4,16,32,64,128„„要描述其平均水平,应选用_____ 4.某种设备生产厂家为确定其生产的设备的规格,需要了解有关的信息。试问对该设备生产厂家来说,反映各药厂产量规模的更有用的指标是_____
已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为()A.9天
B.9.5天
C.10天
D.10.2天
E.11天
第四节
统计资料的图形描述
一、统计图及其作用
统计图:用点的位置、线段的升降(或直条的长短)面的形式表达统计资料,把事物之间的数量关系表示出来,直观地反映数量关系。
作用:统计图与统计表配合使用,可以更直观,更鲜明地表现统计资料的特征和规律。
二、统计图的分类与选用 1.条形图(bar chart)用宽度相同的条形的高度或长短来表示各类别数据的图形 有单式条形图、复式条形图等形式 主要用于反映分类数据的频数分布
绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图 2.饼图(pie chart)也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形
主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用 绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的 3.直方图(histogram)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1 频数密度频数组距
直方图与条形图的区别
条形图是用条形的高度表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示 22 各组的组距,其高度与宽度均有意义
直方图的各矩形通常是连续排列,条形图则是分开排列
条形图主要用于展示分类数据,直方图则主要用于展示数值型数据 4.频数分布图(frequency polygon)在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 折线图的两个终点要与横轴相交,具体的做法:第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的 几种常见的频数分布:
对称分布右偏分布(正)左偏分布(负)正J型分布反J型分布U型分布
偏态(skewness):数据分布的不对称性,用偏态系数SK来测量。SK=0,对称
SK>0,正偏(右偏)
SK<0,负偏(左偏)
SK的绝对数值越大,表示偏斜的程度就越大。
与标准正态分布比较!
峰态(kurtosis):数据分布的平峰或尖峰程度,用峰态系数K来测量。K=0,正态分布 K>0,尖顶峰 K<0,平顶峰
5.累计频数分布图
6.线图(line plot)普通线图:用线条的变化,表现事物某现象随另一现象(多指时间)变动的趋势。横纵坐标均为算术尺度。半对数线图:通过线条的对比,比较两种或多种事物的相对变化的速度。横坐标为算术尺度,纵坐标为对数尺度。
7.散点图(scatter chart)用点的密集程度和变动趋势表示两现象之间的相互关系的图形。
三、统计图绘制的一般要求
1.选择图形:按资料的性质及分析的目的选择合适的图形。2.标题:一般在图的下方,与统计表的标题要求相同。
3.纵横坐标轴与标目:条图、直方图、线图、散点图都有纵横轴。纵横轴应有标目,标目如有单位应予注明。
4.尺度:尺度有算术与对数两种。条图与直方图的纵轴尺度必须从零开始,并要标明零点。横轴尺度不必一定从零开始。纵横轴比例一般以5:7为宜。
5.图例:比较不同事物时,要用不同的线条或颜色区分,并应配以图例和说明。
A.直条图
B.直方图
C.构成图
D.普通线图
E.半对数线图 1.表示各相对独立指标的数值大小宜用_____ 2.表示某现象随时间而变动的趋势宜用_____ 3.表示全体中各部分的比重宜用_____ 4.表示连续性变量资料的频数分布宜用_____
A.散点图
B.半对数线图
C.直条图
D.直方图
E.普通线图
1.要比较两个地区从1980年~1995年结核病发病率变动速度,应绘制____ 2.描述某地1983至1993年肝炎发病率的变动情况,应绘制_____ 3.描述正常人血铅值含量的分布情况,应绘制_____ 4.分析新生儿体重与围产期死亡率的关系,应绘制_____ 5.某地区两年的三种死因别死亡率,可选用_____
四、看图注意事项 1.留意象形图 2.注意刻度
【第四章】推断理论基础
本章学习要求:
掌握标准正态分布表的使用 理解参数、统计量
理解抽样分布及抽样误差的概念 掌握样本均值的抽样分布
第一节
概率(请自已课下复习)第二节
随机变量与概率分布
一、随机变量(请自己课下复习)
二、离散型随机变量的概率分布(请自己课下复习)
三、连续型随机变量的概率分布
连续型随机变量可以取某一区间或整个实数轴上的任意一个值 它取任何一个特定的值的概率都等于0 不能列出每一个值及其相应的概率 用概率密度函数的形式来描述
通常研究它取某一区间值的概率
包括均匀分布、正态分布、指数分布、t分、F分布和2分布。
概率密度函数(probability density function)
设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),其性质为:
(1)f(x)0(2)f(x)bf(x)dx1a(3)P(aXb)f(x)dxabx
正态分布(normal distribution)描述连续型随机变量的最重要的分布; 许多现象都可以由正态分布来描述;
可用于近似离散型随机变量的分布; 经典统计推断的基础。
f(x)1f(x)e2(x)222 xx= 正态随机变量X的均值
= 正态随机变量X的方差= 3.1415926;e = 2.71828x = 随机变量的取值(-< x< )简记作:X~N(,)
和对正态曲线的影响f(x)BACx
2连续变量x服从正态分布N(,),当变动,而不变时,正态分布的曲线会()A.改变中心,也改变曲线的形状B.不改变中心,改变曲线的形状
C.改变中心,不改变曲线的形状
D.不改变中心,也不改变曲线的形状
标准正态分布(standardize normal distribution)均值为0,标准差为1的正态分布
简记作:Z~N(0,1)2.概率密度函数(z)12ez22 z
查332页表求标准正态分布的概率(1)P(0≤Z≤1.2)(2)P(-1.10≤Z≤1.49)(3)P(-0.48≤Z≤0)(4)P(-1.37≤Z≤-0.5)(5)P(Z>1.33)任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布ZX
例:已知研究生完成一篇硕士论文的时间服从正态分布,平均花费2500小时,标准差为400小时,现随机找到一个已完成论文的学生,求:(1)他完成论文的时间超过2700小时的概率;
(2)他完成论文的时间低于2000小时的概率;
(3)他完成论文的时间在2400~2600小时之间的概率;
(4)完成论文最快的前5%的学生花费时间的界限是多少小时?
观察某地100名12岁男孩身高,均数为138厘米,标准差为4.12厘米,z1281382.431(2.43)0.9925,结论是()4.12,已知A.理论上身高低于138厘米的12岁男孩占99.25% B.理论上身高高于138厘米的12岁男孩占99.25% C.理论上身高在128厘米至138厘米的12岁男孩占99.25% D.理论上身高低于128厘米的12岁男孩占99.25% E.理论上身高高于128厘米的12岁男孩占99.25%
第三节
抽样分布
一、参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值; 所关心的参数主要有总体均值()、总体标准差()、总体比例/成数()等; 总体参数通常用希腊字母表示。
二、统计量(statistic)描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数; 所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等; 样本统计量通常用小写英文字母来表示。统计量是()
A.是统计总体数据得到的量
B.反映总体统计特征的量
C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的E.是由样本数据计算出的统计指标
三、抽样分布(sampling distribution)
样本统计量的数值是根据被抽取的样本数据计算的,在没有抽出具体样本之前,样本统计量的数值是不确定的,它是个随机变量。抽样分布样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
随机变量是 样本统计量
样本均值, 样本比例,样本方差等
结果来自容量相同的所有可能样本 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据
抽样分布指的是()
A.抽取样本的总体的分布
B.样本自身的分布
C.样本统计量的分布
D.抽样观测变量的分布
四、样本均值的抽样分布
在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布 一种理论概率分布
推断总体均值的理论基础
x(1)样本均值所有可能取值的标准差,测度所有样本均值的离散程度;
(2)也称为平均数的抽样误差或叫标准误(差)(standard error of mean);(3)从无限总体或从有限总体重复抽样时(4)从有限总体非重复抽样时xn
nNnN1x
均数的标准误是衡量()
A.变量值之间的差异
B.总体均数间的变异度
C.样本均数间的变异度
D.均数与某一标准指标之间的差值
E.样本比例间的差变异 正态总体抽样:
当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布。
x~N(,2n)x~N(,2NnnN1)
例:长途电话时间服从μ= 8 分钟,σ= 2 分钟的正态分布.现抽取一个包含25 次长途电话的随机样本, 试问样本均值在7.8 到 8.2分钟的概率是多大? 中心极限定理(central limit theorem):
设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ/n的正态分布 例:已知某省乡卫生院平均病床为20张,标准差为10.85张,现从该省抽取36个乡卫生院,问这36个乡卫生院平均病床数大于24张的概率是多少? 样本均值的抽样分布与总体分布的关系:
2总体分布正态分布样本非正态分布大样本小样本正态分布正态分布非正态分布
总结:
1.样本均值抽样分布的特征值与总体参数存在确切关系
xxn或nNnN1
2.样本均值是个随机变量,当n 30,不论总体为何种分布,它总服从正态分布。所以n 30的样本被称为大样本,反之则为小样本。
3.重复抽样的抽样误差大于非重复抽样,因此,实践中大多数抽样均使用非重复抽样。
【第五章】参数估计
本章学习要求:
理解区间估计的原理
大样本与小样本在参数估计时的区别 均值、成数的抽样分布 最小样本容量的计算
第一节
参数估计的原理
一、估计量与估计值
估计量(estimator):用于估计总体参数的随机变量,如样本均值、样本比例、样本方差等 参数用表示,估计量用ˆ表示
估计值(estimated value):估计参数时计算出来的统计量的具体值
二、点估计(point estimate)28 估计方法点估计矩估计法最大似然估计法区间估计 用样本统计量的某一具体数值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:用样本比例直接作为总体比例的估计
没有给出估计值接近总体参数程度的信息,即不能提供估计参数时估计误差的大小 为许多定性研究提供一定的参考数据,或在对参数要求不精确时使用,而需要用精确总体参数的数据进行决策时则很少使用 常用总体参数的点估计量
总体参数均值比例方差样本统计量xp2s2
三、区间估计(interval estimate)
1、在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的
2、根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量
为小于1大于0的数值,设是待估的总体参数,如果由样本确定的两个统计量L和U满足P(LU)1,就称随机区间(L,U)是的置信度为1-的置信区间。1-称为置信度(水平),L,U分别称为置信度为1-的置信下限和置信上限。
P(LU)1,(L,U)为双侧置信区间
P(L)1,(L, +∞)为单侧置信区间,L称为单侧置信下限
P(U)1,(+∞, U)为单侧置信区间,U称为单侧置信上限
置信度
将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信度
表示为(1-)
是总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90% 相应的为0.01,0.05,0.10 置信度与置信区间的关系
样本容量一定时,置信度越高,置信区间的范围就越大,即估计参数的相对精度就会越低。解决这一矛盾的方法就是增加样本容量。
但样本容量的增加意味着抽样费用的增加,所以在实践中需要权衡利弊。置信度表达了区间估计的()
A.精确性
B.规范性
C.显著性
D.可靠性
置信度定的愈大,则置信区间相应()A.不变
B.越大
C.越小
D.有效
四、优良估计量的评价标准
无偏性(unbiasedness)指一个估计量的所有可能估计值的平均结果等于待估参数的真值。有效性(efficiency)对同一总体参数的两个无偏点估计量,有更小标准差(变异)的估计量更有效 一致性(consistency)就是要使统计量随着样本容量n的增加,不断趋近于总体指标。在n→∞时(有限总体时n→N),估计值与总体参数完全一致。已知是总体的未知参数,ˆ是该总体参数的一个估计量,则该估计量是一个()A.近似等于的数
B.随机变量
C.数学期望等于的统计量
D.方差固定的统计量
()小,表示用该样本均数估计总体均数的可靠性大。
A.变异系数
B.标准差
C.标准误
D.极差 从同一总体中随机抽出的两个样本,要用样本均数估计总体均数,可靠性较大的是()A
样本均数小的样本
B
标准差小的样本 C
样本含量小的样本
D
标准误小的样本
第二节
总体参数的区间估计 一、一个总体均值的区间估计
(一)大样本(n≥30)条件下的区间估计
无论总体何种分布,均有x~N(,2n)1.已知,的置信度为1-的置信区间为Nnxz2nxz2.未知,的置信度为1-的置信区间为xz22nN1snxz2snNnN1注:为简化,后面不再列出包含修正因子的公式,请自己根据给定条件来确定是否需要修正
例:某大学从某一学院中随机抽取学生100人,他们平均每天用于体育锻炼的时间为26分钟。据以往数据可知该院大学生每天体育锻炼时间的标准差为12分钟,试求该学院大学生平均 30 每天体育锻炼时间的置信区间,置信度为95%。
例:前例中,如果已知该学院全部学生为1800人,其他条件不变,求置信区间。
随机抽取某市120名新生女婴,其均出生体重为3.1kg,标准差为0.5kg,则用算式0.53.11.96120得到的区间可以解释为()
A.该市95%的女婴出生体重在此范围内 B.该市95%的女婴平均出生体重在此范围内 C.该市女婴出生体重在此范围内的可能性为95% D.95%的可能性认为此范围包含了该市女婴的出生体重
E.此范围包含该市女婴平均出生体重,但可信的程度为95%(二)小样本(n<30)条件下的区间估计
2前提:必须是正态总体x~N(,n)
1、已知x~N(0,1)n总体均值在1-置信水平下的置信区间为xz2n
2、未知
xsn~t(n1)xsn服从自由度为n1的t分布 t(n1)表示随机变量t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。随着自由度的增大,逐渐趋于正态分布(见教材117页)标准正态分布t(df= 13)t(df= 5)z不同自由度的t分布t
关于t分布的图形,下述哪项是错误的()A.当自由度逐渐增大,t分布逐渐逼近标准正态分布 B.自由度越小,t分布的尾部越高
C.t分布是一条以自由度为中心左右对称的曲线
D.t分布是一簇曲线,故临界值因自由度的不同而不同
例:从某公司生产的一批罐装产品中,随机抽取10罐产品,测得每罐的重量(g)分别为318, 320,322,321,321,323,319,320,320,324。要求以95%的置信度估计这批产品平均重量的置信区间。已知罐装产品重量服从正态分布。
例:前例中,如果我们只关心产品重量的下限是否达到标准,其他同上。二、一个总体成数的区间估计
表示总体成数,p表示样本成数,当n为大样本,np>5且n(1-p)>5,则样本成数p的抽样分2(1)p~N(,pp)p~N, 布近似正态分布。p是p的抽样分布的均值
pnp是p的抽样分布的标准差, 也称标准误p(1)p~N, nP(z2(1)nP(pz2p(1)2n(1)(1)pz)1nn2npz2p~N(0, 1)(1)nz)1pz2(1-)
例:某商场从顾客中随机抽取200人,其中持信用卡消费的顾客有6人,求在90%的置信度下,顾客持信用卡消费比例的置信区间。
第三节
样本容量的确定 抽样之前,必须确定适当的样本容量。
样本容量直接影响到抽样的误差大小及抽样费用的多少。
样本容量较大,可减少抽样误差,提高估计总体参数的精度,但抽样费用会相应增加
样本容量较少,抽样费用可降低,但抽样误差就会增大。
适当的样本容量:指能够满足研究者对抽样误差要求的应抽取的最少样本单位。
抽样误差:指由于被抽取样本的代表性所产生的误差,是样本统计量的实际数值与总体参数之间的差值,常用表示
其值可正可负,实际是指围绕总体参数左右波动的范围。
p(1-p)pzn2p(1-p)NnnN1x表示总体均值允许的抽样误差|x|xp表示总体成数允许的抽样误差|p|p样本含量的估计是()
A.经济条件允许的条件下,越多越好
B.时间允许的情况下,越多越好
C.根据实际情况,能选多少是多少
D.不必估计,调查整个总体最好 E.保证研究结论具有一定可靠性的前提条件下确定的最少例数
抽样误差是指()
A.样本统计量和总体参数值之差
B.样本统计量和样本统计量之差
C.个体值与样本统计量之差
D.个体值与总体参数之差 E.总体参数和总体参数之差
A 总体变异
B 抽样误差
C 总体均数不同
D 抽样误差或总体均数不同
E 以上都不是
1.甲矿全体职工的医疗费统计结果:均数为185元,标准差为43元。后者反映的是___ 2.甲矿随机抽取若干名职工,其医疗费统计结果为214元,标准差为58元。214元与上题中185元不等的原因是____
A.样本例数太小
B.抽样误差 C.总体均数不同
D.个体差异太大
1.某地25岁正常成年男性的平均收缩压为113mmHg,从该地随机抽取20名25岁正常成年男性,其平均收缩压为119 mmHg,113与119不同,原因是()2.从上题的同一个地区中再随机抽取20名8岁正常男孩,测得其平均收缩压为90 mmHg,标准差为9.8 mmHg,90与113不同,原因是()
确定样本容量时需考虑的因素:
1、总体中变量值的离散程度大小
正比,用总体标准差表示
2、置信度的大小
正比,用1-表示
3、允许的抽样误差大小
反比,用表示
4、抽样的组织形式及抽样方法
只讨论简单随机抽样
5、有限总体和无限总体
一、估计时的样本容量
xz2nxz2nNnN1NnN1NnN1|x|z2nn|x|z2nnxz22xz2z2nxnNz2(N1)2xz222
如果未知,可按如下方法确定:
用以前类似研究的数值最大的样本标准差代替 做一次试点调查,用调查所得的样本标准差代替
如已知变量的最大值和最小值,则:XmaxXmin4
例:要估计一家化工厂某种产品的平均日产量,已知日产量变动的标准差为2吨,如果要求估计平均日产量的置信度为95%,估计允许的误差为 0.5吨,求应抽取多少工作日进行调查?
二、估计时的样本容量
pz2(1-)npz2(1-)NnnnnN1N1N1|p|z2(1-)n|p|z2(1-)Nnpz2(1-)npz2(1-)Nn2Nz2(1)n2z2(1)2pn2(N1)2pz2(1)
p的取值一般小于0.1 的确定方法:
用以前类似研究的最接近0.5的样本成数代替
通过试点调查,用样本成数代替
直接用0.5代替
例:某市电视台欲通过抽样调查估计该电视台的家庭收视率,要求估计的抽样误差不超过3%,置信度为95%,应抽取多少家庭进行调查?
【第六章】假设检验
本章学习重点:
1、假设检验的基本思想和原理
2、假设检验的步骤
3、一个总体参数的检验
4、两个总体参数的检验
第一节
假设检验原理
假设检验(hypothesis test):
先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程 逻辑上运用反证法,统计上依据小概率原理
一、原假设与备择假设
1.假设(hypothesis)
对总体参数的具体数值所作的陈述
总体参数包括总体均值、总体比例、总体方差等
分析之前必需陈述
2.原假设(null hypothesis)研究者想收集证据予以反对的假设 又称“零假设”、“无效假设” 总是有符号= 表示为 H0
3.备择假设(alternative hypothesis)研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号,或 表示为 H1
原假设与备择假设都是关于总体的叙述,所以一定要用总体参数来表示。4.结论与建议:
原假设和备择假设是一个完备事件组,而且相互对立 先确定备择假设,再确定原假设
等号“=”总是放在原假设上
因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)5.双侧检验与单侧检验
1)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为“<”,称为左侧检验
备择假设的方向为“>”,称为右侧检验
2)备择假设没有特定的方向性,并含有符号“‖的假设检验,称为双侧检验或双尾检验(two-tailed test)
二、拒绝域
在假设设定以后,还需要设定一个判别标准,用以判断样本数据为多少时才能拒绝原假设。这个判别标准就是给定一个小概率,并根据“小概率事件原理”作出判断。1.小概率事件原理
(1)小概率是指在一次试验中,一个几乎不可能发生的事件发生的概率;(2)在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设;(3)小概率由研究者事先确定。2.显著性水平(significant level)是一个概率值
原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 表示为(alpha)
常用的值有0.01, 0.05, 0.10 由研究者事先确定的小概率
拒绝域(rejection region):能够拒绝原假设的检验统计量的所有可能取值的集合。临界值(critical value):根据给定的显著性水平确定的拒绝域的边界值。
判断原则:样本数值落入拒绝域,则拒绝原假设,同时接受备择假设 双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 <-临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
三、两类错误
第Ⅰ类错误(弃真错误、错误)原假设为真时拒绝原假设 第Ⅰ类错误的概率记为 称为显著性水平
是已知的,即研究者事先确定的小概率 第Ⅱ类错误(取伪错误、错误)36 原假设为假时接受原假设 第Ⅱ类错误的概率记为(Beta)
一般是未知的(“接受”原假设实质是不能拒绝,即在没有足够证据证明下只能接受)
进行假设检验时,分别取以下显著性水平,以()时犯第二类错误最小。A.=0.05
B.=0.01
C.=0.10
D.=0.20
E.=0.25
四、假设检验的步骤
1.根据问题建立原假设和备择假设
2.选择适当的样本统计量,并确定以H0为真时的抽样分布 3.选定显著性水平,确定临界值 4.进行判别,得出结论
第二节
一个总体均值的假设检验
一、大样本条件下的假设检验
例:有人说某院学生平均每天锻炼时间超过30分钟。在该学院中随机抽取100名学生,他们每天平均的锻炼时间为31分钟,已知学生锻炼时间的标准差为12分钟,试在=0.05的显著性水平下,检验该人说法是否可信。
二、小样本的正态总体,已知
例:已知某种袋装食品的标准质量为250克。现从一批产品中随机抽取10袋,经测量平均质量为249.5克。已知质量服从N(,0.52),问在=0.05的显著性水平下,该产品是否符合标准.三、小样本的正态总体,未知
例:某停车场管理人员认为,该停车场每辆车平均停车时间小于30min。现从停车场随机抽取16辆车观察,其平均停车时间为28min,标准差为5.3min。设停车时间服从正态分布,试在=0.05的显著性水平下,检验管理人员的说法是否可信。
A.zx0nB.zx02nC.tx0snD.zx0sn
1、大样本情况下,当总体方差未知时,检验总体均值所使用的统计量是()
2、小样本正态总体情况下,当总体方差未知时,检验总体均值所使用的统计量是()
3、小样本正态总体情况下,当总体方差已知时,检验总体均值所使用的统计量是()
第三节
两个总体均值之差的假设检验
对两个总体进行推断必须考虑样本数据的来源
如果是从两个相互之间没有影响的样本中得到的数据,称之为来自独立样本;
如果一个样本的数据与另一个样本的数据是成对出现(或相互影响),则称之为来自配对样本或匹配样本。
一、1,2已知的正态总体,独立样本
例:甲乙两条生产线同时灌装产品,已知它们的产品重量都服从正态分布。甲X1~N(1,0.3),乙X2~N(2,0.4)。现分别从甲乙两条生产线上随机抽10件和822件产品,测得它们的平均重量分别为249.4g和250.2g。问甲、乙两条生产线灌装产品的重量是否有明显差异。(=0.05)
二、1,2未知的正态总体,独立小样本
例:某灯饰厂声称该厂生产的新型节能灯的平均寿命比老型节能灯的寿命更长。现随机从新老两种节能灯各抽取15只进行检测。新型检测结果为x15306h,s1150h;老型为x25200h,s2120h.已知服从正态分布且方差相同,问=0.05时,上述样本数据能否证明灯饰厂的说法。
三、独立大样本,任何总体分布
四、配对样本
1.由同一个体在前后进行两种不同试验得到的数据
为检验某种降压药的效果,观察同一批人服药前后血压的数据
对同一生产线,研究作业程序改变前后生产效率的数据 2.由一对个体分别进行两种试验得到的数据
一对很胖的双胞胎分别使用两种减肥药,以观察两种减肥药效
在一个人的两只眼睛中分别使用两种药水,观察两种药水的效果 同等条件下,配对样本检验比独立样本精确。
第四节
总体成数与方差的假设检验
一、总体成数的假设检验
例:某公司欲出台一项政策,有人估计支持率大于80%。随机抽取230人询问,有190人表示支持,设=0.05,问该支持率的估计是否可信?
例:随机调查339名50岁以上男性,其中205名吸烟者中有43人患慢性气管炎;在134名不吸烟者中有13人患慢性气管炎,设=0.05, 检验吸烟者患此病的比率是否明显高于不吸烟者?
二、总体方差的假设检验
例:某公司有A、B两条生产线,两条生产线的方差相等。对A改造后,从两条生产线各抽取了25件产品进行测量。结果A生产产品的方差为0.28,B生产产品的方差为0.35。设 =0.1, 检验改造后A生产线是否与B的方差明显不同。假设A、B两条生产线产品的总体服从正态分布。
P值是在原假设为真的条件下,出现象检验统计量的观察值这样极端以及更极端的值的概率 双侧检验为分布中两侧面积的总和
反映实际观测到的数据与原假设H0之间不一致的程度 被称为观察到的(或实测的)显著性水平判断规则:P值<,拒绝H0,接受H1
两个样本均数不一致,t检验时P>0.05,说明这种误差是由()所致 A.抽样误差
B.总体均数不同
C.样本均数不同
D.样本数不同
A.P<0.05
B.0.05>P>0.01 C.P>0.01
D.P<0.01
E.P>0.05 1.单侧检验,当tt0.05(n1)时,()
2.单侧检验,当t0.05(n1)tt0.01(n1)时,()3.单侧检验,当tt0.01(n1)时,()4.单侧检验,当tt0.05(n1)时,()检验公式总结
【第七章】2检验和方差分析
本章学习要求:
掌握的拟合优度检验掌握的独立性检验与一致性检验掌握方差分析原理掌握单因素方差分析掌握无交复作用的双因素方差分析
第一节拟合优度的检验拟合优度:指实际观察的频数与期望(理论)频数相似的程度。拟合优度的检验:通过统计量来检验变量的实际分布是否与理论分布相同。
一、多项分布的检验多项分布:实验结果多于两个的概率分布。特点:试验结果有多个,但每次有且仅有一个结果发生,试验是独立的,每种可能出现结果的概率保持不变。例:某大型超市在去年全年饮料销售中,A、B、C三种饮料的销售比例分别是58%,33%和9%。今年C品牌的厂家在进行了一系列的促销活动后,要求超市提供更多的货架位置以摆放更多的C品牌饮料。为此超市对C品牌促销活动后销售的270瓶饮料进行了统计分类,结果如下:A种150瓶,B种85瓶,C种35瓶。根据这样的数据,超市能否判断销售比例发生了变化?
46
检验主要用来检验频数,即检验各类实际观察的频数是否显著不同于假设的期望频数使用条件: 每次的试验是独立进行的 如果试验有个类别,那么每次试验的结果是个类别中的某一个 每次试验时每个类别发生的概率都保持不变为了满足上述条件,在进行检验时,应使试验次数n较大,且每一类别的期望频数都要大于等于5。
期望频数小于5的解决方法: 去掉期望值小于5的类别 增加试验次数n 将期望频数小于5的合并到相邻类别中(常用,但要注意使合并后的类别要有意义
二、泊松分布的检验检验除了可以对假设的频数检验外还可对各种假设的分布进行检验对各种分布进行检验时,应将各变量值适当分类,并使每一类别的期望频数大于等于。分类方法:变量值是有限个,每一取值作为一类变量值是无限个,则变为有限个区间,每一区间视为一类例:第二次世界大战快结束时,德军用了用火箭推进的炸弹轰炸伦敦。盟军司令不知道这些炸弹是随机发射服从泊松分布还是使用了某种瞄准装置。为了弄清这一点,他把伦敦分成了个区域,每个区域遭到轰炸的次数如下所示。轰炸次数:区域数:
三、正态分布的检验正态分布的变量是连续型变量,因此要用区间来定义类别,即将连续变量值根据已给定的区间或等概率区间确定为不同的类别。变量值划分几个区间,类别数就等于区间的数量。例:有人认为某种不规则商品的重量服从正态分布,下表是他随机抽取的40个该种商品的质量数据。问这些数据是否支持他的说法。
第二节独立性和一致性的检验
一、列联表分析方法拟合优度检验:一个变量的拟合程度两个变量间的关系:是否相互独立独立性检验是否来自同一总体一致性检验使用列联表进行分析。列联表:行列交叉的表格。研究的两个变量,一个按类分行排列,另一个按类分列排列,行列交叉处是同属于两个变量不同类的数据。
二、独立性检验独立性:两个变量之间互不相关H0:两个变量相互独立H1:两个变量不独立
例:某研究机构欲对个人收入与学历关系进行研究,获得的样本如下,试在下,检验收入与学历是否有关系。
三、一致性检验一致性:指多个总体在某一变量的各个类别上是否具有相同的分布特征。例:某保健品厂家想了解老年和儿童对三种口味的滋养品的喜欢程度是否一致,在老年人和儿童中各抽取人调查,数据如下问下老年人与儿童喜欢的口味是否一致
一致性检验与独立性检验的区别、检验目的不同 独立性检验:检验两个变量是否相关 一致性检验:检验不同总体在某一变量分类中是否具有相同的分布、抽样程序不同 独立性检验:从一个总体中抽一个样本,然后按两个变量的类别进行分类 一致性检验:从多个总体中抽样,抽出多个样本,然后按不同样本进行分类、推断期望频数的理论不同 独立性检验:基于独立事件的假设 一致性检验:基于不同总体具有相同概率的假设当列联表的周边合计不变时,如果某格实际频数有变化,则其理论频数()A.增大 B.减小 C.不变 D.不确定
E.随该格实际频数的增减而增减
22对抽样得到的四个样本比例作一致性检验,有0.05(df),可认为()
A.各总体比例不同或不全相同 B.各总体比例均不相同 C.各样本比例均不相同 D.各样本比例不同或不全相同 E.两个总体比例相同
第三节单因素方差分析
一、方差分析原理方差分析(analysis of variance,ANOVA): 检验多个总体均值是否相等的统计方法。包括单因素方差分析和双因素方差分析。优点:、检验的效率高、检验的可靠性高基本概念:
1.因变量(dependent variable):将要研究的特征指标,必须是定量变量。2.因素或因子(factor):影响因变量的条件。3.水平(level)或处理(treatment):因素的不同状态。4.观察值:在每个因素水平下得到的样本数据 方差分析的假定条件:
对于检验的每一个总体,因变量都要服从正态分布
在每一个总体中,因变量的方差都相等,即各总体具备方差齐性 从各个总体抽取的是独立样本 组内变异(within groups)因素的同一水平(同一个总体)下样本数据的误差 组内误差只包含随机误差 组间变异(between groups)因素的不同水平(不同总体)下各样本之间的误差 组间误差既包括随机误差,也包括系统误差 数据之间的变异用平方和(sum of squares)表示
二、单因素方差分析的步骤
第二篇:统计学心得
这学期专业开设了统计学课程,通过一学期的学习我们对统计学应用领域及其类型和基本概念有了一个基本的了解,掌握了数据的收集、展示、分析的技术。但这都是些书本上的理论知识,是纸上谈兵。统计是处理数据的一门科学,统计学是收集、处理、分析、解释数据并从数据中得出结论的科学,统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。理论须用来指导实践,把我们学习到的理论知识运用到我们的工作和生活中去,这是我们学习的目的也是教育改革的方向。
统计学原理是广播电视大学经济与管理学科各专业学生开设的一门必修的重要的基础课,也是经济管理工作者和经济研究人员所必备的一门知识。它研究如何用科学的方法去搜集、整理、分析国民经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的联系关系和变动规律,也是进一步学习其他相关学科的基础。
《统计学原理》是一门比较灵活的课程,我觉得也是学的有滋有味的一门课。通过这一个学期的《统计学原理》知识学习,在授课老师的讲授和指导下获益良多。老师喜欢和我们同学一起互动,不象有的老师只是填鸭式教学,而不管学生吸收了没有。《统计学原理》不好懂是众所周知的,老师在上课时列举了很多生动鲜活的例子让我们更容易理解。老师还会给我们留出提问的时间,解答疑难问题,更难得是在课后的时间里对我们同学提出的问题作了详细的解答。
首先,明确各章内容在整个教学过程中所处的位置和所占的份量;
其次,突出各章的学习重点,使教材变“薄”,便于掌握内容的精髓;
统计学原理教学内容的掌握,离不开大量的练习。结合辅导课讲授的内容进行练习,方面可通过做不同类型的练习,总结所学内容的异同,掌握其应用条件、解题程序;另一方面可提高运算能力和解题速度,避免犯低级错误。如相对指标中计划完成程度相对指标,动态数列中发展速度、增长速度和序时平均数的计算,看起来都比较简单,我们容易产生麻痹思想,平时如不予以重视,缺乏训练,考试时会因小错而造成大错。而对于诸如已知变量数列资料、概率保证程度条件下的区间估计等分析计算内容,必须通过边学边练,才能逐渐理解和掌握。老师在辅导教学中,通常在讲授了一种指标或计算方法后,即布置相应的练习题让我们马上在课堂上做,并针对我们解题时出现的问题,及时进行个别辅导或讲解。辅导课上的练习只能集中在一些带有普遍性的问题和内容上。而课后的平时作业,可以检查我们对所学理沦与动手能力是否能有机结合,使我们加深对书本知识理解,巩固和促进我们自学的重要手段,也是教师了解学生自学效果的途径。统计学原理中大量的计算公式和计算方法,都必须通过反复的运算练习才能真正掌握。
随着人们对定量研究的日益重视,统计方法已被应用到自然科学和社会科学的众多领域。几乎所有的的研究领域都要用到统计方法,比如政府部门、学术研究领、日常生活中、公司和企业的生产经营管理中都要统计。因此学好统计学对我们以后的工作和生活斗有好处,通过时间加深对统计学理论的掌握和应用显得更为重要。
第三篇:统计学心得
试验总结与心得
经过了为期两天的统计学实验,主要通过EXCEL这个软件来完成这次的实验。
首先掌握用EXCEL进行数据的搜集整理和显示,要求熟练运用EXCEL搜集数据,统计分组,制作统计图。这是最基础的操作,让我们首先对EXCEL有一个初步的了解和认识。
实验二是用EXCEL计算描述统计量,可以运用函数描述统计量。要求我们掌握基础的常用的函数对数据进行初步归纳,了解统计学中最常用的函数组成。
实验三用EXCEL进行时间序列分析。首先是测定增长量和平均增长量,然后计算出长期趋势。得出我们所要统计的结果的一个预计变动趋势。让调研人员有一个机动的应变对策。这个实验特别主义对时间序列的把握,常常会搞错要除去的年数。这在实验中常常出错。
实验四用EXCEL进行指数分析,指数分析是统计学中最主要的一个数据分析。先计算出总指数,再得出平均指数,最后进行因素分析。其中平均数是通过加权算数平均法得来的。
实验五是用EXCEL进行相关与回归分析。用EXCEL进行相关分析有两种方法,一是利用相关系数函数,在EXCEL中,提供了两个计算两个变量之间相关系数的方法,CORREL函数和PERSON函数,这两个函数是等价的,实验中我运用了用CORREL函数计算相关系数来进行对数据的分析。另一种是利用相关分析宏。EXCEL进行回归分析同样分函数和回归分析宏两种形式,其提供了9个函数用于建立回归模型和预测。这9个函数分别是:INTERCEPT 返回线性回归模型的截距、SLOPE 返回线性回归模型的斜率、RSQ 返回线性回归模型的判定系数、FORECAST 返回一元线性回归模型的预测值、STEYX 计算估计的标准误、TREND 计算线性回归线的趋势值、GROWTH 返回指数曲线的趋势值、LINEST 返回线性回归模型的参数、LOGEST 返回指数曲线模型的参数。在实验过程中我使用的是回归分析宏进行回归分析。
实验六是用EXCEL进行预测。主要有移动平均法、指数平滑法、趋势预测法。在实验过程中分别对这三种方法进行了尝试。都得到了预期的结果。
实验七是用EXCEL进行参数估计和假设检验。主要掌握了解Z检验的操作步骤。
通过这次实验让我对统计学的知识框架有了更深一步的了解,并知道通几种常见的基础的方法,对搜集的资料进行数据归纳,抽样分析,并进行预测,对比这个统计学的过程有了进一步的掌握。在今后的学习生活中,希望可以通过这次学习到的方法和知识,可以对自己所研究的领域,进行进一步的调研,分析,使数据更趋于有用化,可操作化,尽量减少数据的赘余与资源的浪费。学习了统计学就要将之灵活运用于实际的生活中去,让知识造福于人类,让知识拥有自己的生命了。
第四篇:统计学心得
走进统计
在经历了专业导论课的学习之后,我对统计学有了一定的认识。在学习中,有很多感想,也有很多收获。无疑的是,我认识了统计学这门实用的工具,在我未来的人生中,也必将会运用这个工具,陪伴我们前行。
最初对于统计学的了解是因为志愿的填报,上网查阅关于统计学的相关资料,但是抽象的文字,无法清晰地将统计学的概念,统计学的内容展示出来,长篇大论、洋洋洒洒的文字,最后也只是很模糊地了解统计学的历史——18 世纪,德国的阿亨瓦尔首先将“国势学”定了新名词—— “统计学”。在当时英国人眼里,“统计”就是用数字表述事实。相对于统计学而言,统计的历史更为悠远。
在进入大学之前,我一直把统计学看成是会计学的另一种形式。而学校安排的课程里,有专门的学科导论,这为我提供了更方便,更直接地途径去了解我所学的这一门专业知识,课堂上老师从各个方面来阐述统计学在社会生产和国家经济的发展的重要作用及其在人们生活中扮演的必不可少的角色。
在第一节导论课后,我上网查找了统计学的应用历史。统计实践远早于统计学得诞生,在一些文明古国中较早付诸于实践。据历史记载,在中国古代,大禹治水的时候,统计已初具雏型,大禹按山川土质,人口物产,贡赋的多少分中国为九州,著有 “禹贡九州篇”,记载当时的人口约 1355 万,土地约 2438 顷,这便是人口和土地统计的雏型;秦朝“商君书”中已有全国的人口调查记录,并把反映国情、国力的 “十三数”作为富国强兵的重要依据;汉朝实行口钱制,表明当时已有全国户口与人口年龄的统计,并据此征收赋税;明朝初期编有记载全国户口,丁粮的黄册,作为核定赋税、劳役的依据。在世界的其他文明古国中,统计实践也是很早的,埃及在公元前 3000 年建造金字塔时,为了征集建筑费用和劳力,对全国人口和财产进行调查;古罗马在公元前 400 年就建立了出生、死亡登记制度。
这些悠久的历史都证明了统计在我们生活中的广泛应用,统计与我们生活息息相关。进入经济快速发展的现代社会,统计已经渗透到社会的各个领域了。
在听了第二节导论课后,我更加了解了作为经济统计学专业的学生,我今后的发展前途。老师在PPT首页的一张图给我留下了深刻的印象。统计学就是朝阳,做为进入大数据时代后快速发展的新兴学科,统计学具有光明的前途。因为我们的生活已被统计学所充斥,我们的衣、食、住、行无不与统计学挂钩,社会生产发经济发展离不开统计学,国家政府工作与统计学息息相关,统计学的发展趋势呈现乐观的走势,越来越受重视,因为我对我们学习统计的前途充满希望,这也激起了我的学习兴趣。
从刚开始对统计学的陌生,对统计学的不了解,到现在,在未接触到真正的统计学,仅仅是通过听取,查阅资料了解统计学的大概,所以还谈不上热忱,用一种积极说法就是对统计学的憧憬。希望我能在今后的学习生活中,找到学习的兴趣,能够熟练掌握统计学的一种软件,用扎实的知识功底,在大数据的海洋中自由遨游!经济统计学学习规划
在经历了专业导论课的学习之后,我对统计学有了一定的认识。在学习中,有很多感想,也有很多收获。无疑的是,我认识了统计学这门实用的工具,在我未来的人生中,也必将会运用这个工具,陪伴我们前行。我也将对以后的学习进行规划。首先大一,基本上都是公共必修课,极少涉及统计学的专业科目。在学完公共必修课的基础上,我将努力学习大学英语,努力在大学四级六级中考出一个好成绩,并努力提升自己的口语水平,为今后或许自己有留学的机会打下基础。其次,我将努力学好微积分等高等数学的科目,提高自己的数学能力,为今后学习统计打下坚实的基础。
大二大三,关于统计的课程将全部提上课程,我将保持学习的激情,努力学好经济计量学、应用抽样技术、统计指数基础与应用等统计学专业课程,充分利用上课时间。毕竟,学好统计学的必修课,是学好统计的必修课。我还将在课余时间积极参加课外锻炼,参加更多的社会实践,并努力在学习中提出自己的见解,提升自己的综合素质,为今后找工作或选择考研之路打下基础。
进入大四,面临着就业的压力,我不想向别人一样迷茫。所以在大四,我希望对大学四年进行一个总计,如果我在大二大三发现了我对统计学的兴趣,我会选择考研,继续钻研统计学。如果我选择就业,我会积极参与工作招聘会,在检验中提升自己的准备与能力。大四是检验大学前三年学习成果的时期,要以饱满的精神和认真的态度迎接挑战。
在听了五节的导论课后,我对统计学的前途充满希望,暂时不想转专业,考研的问题,现在还没有具体思考过,我希望若是在大二大三发现了对统计的兴趣,我会选择考研。
在接下来的学习生活中,我会树立强烈的进取精神,发扬严谨务实、勤俭刻苦的精神,只争朝夕,提高办事效率,度过一个不让自己后悔的大学四年,让自己的青春熠熠闪光!
第五篇:传播学教程笔记
传播制度与媒介规范理论A、传播制度与媒介控制
1、什么是传播制度?
传播制度即社会制度中对大众传播活动直接或间接的起着制约作用的部分,传播学教程笔记。
2、为什么说传播制度体现了全部社会结构和社会关系的复 杂性?
传播活动作为社会制度的反映,其内容是十分复杂的,体现了社会制度或制度性因素在各个方面对传播媒介活动的制约和影响。它包括:媒介与政府的关系、媒介与社会群体及广大受众的关系。言论自由与权利、言论出版者所应当承担的责任和义务。传播制度体现了全部社会结构和社会关系的复杂性,不同的社会制度下,传播制度也有不同的性质。
3、分析国家和政府的政治控制。
控制目的:保障媒介为国家制度、意识形态以及各种国家目标的实现
控制性质:直接控制(主要方面,而非唯一)
控制手段:法律、法规、政策
控制范围:(1)规定传媒组织的所有制形势。(取决于政治制度和经济制度)
(2)对传媒的活动进行法制和行政管理。
(3)限制或禁止某些信息内容的传播。
(4)对传媒事业的发展做出总体规划或国家援助。
4、分析经济势力和利益群体的控制
控制目的:通过媒介维护自身的利益,传播自己的主张,参与国家政治、经济、文化生活。
控制手段(资本主义):(1)以强大资本后盾成立超大型传媒企业,实行垄断。
(2)通过其控制的议会党政团体对公营媒介活动进行干预。
(3)通过赞助、广告来间接的控制中小媒体。
5、分析广大受众的社会监督控制
控制目的:行使受众的正当社会监督权利,保证传播活动的真实、健康、使受众的利益不受到伤害。
控制手段:(1)个人的信息反馈。
(2)结成受众团体
(3)诉诸于法律手段
(4)通过影响媒介的销售市场来制约媒介活动。
B、几种传播制度规范理论
1、众传播规范包含什么内容?
(1)对大众传播影响力的认识
(2)对大众传播所承担的社会功能的期待
(3)基于这种期待对传播制度的构想。
2、分析极权主义制度下的媒介规范理论
极权主义定义:从外部权力的关系上考虑问题,主张社会事物必须一切以权力为转移,强调社会等级秩序和上下之间的绝对支配与服从。
理论主张:媒介必须一切以权力为转移。
产生背景:(1)15世纪中期印刷术的产生
(2)封建王朝的统制,反专制统治思想的产生。
(3)英国1529年产生第一个禁书法案
主要内容:(1)报刊必须对当权者负责,维护国王和专制国家的利益
(2)报刊必须绝对服从于权力或权威
(3)政府有权对出版物进行事先检查,且合法。
(4)对当权者和当局者的批判是违法的,将受到严厉法律制裁。
3、分析资本主义下的媒介规范理论
a、自由主义媒介规范理论
理论主张:报刊应当是观点的自由市场,是实行自律的自由企业。
产生背景:(1)
17、18世纪资产阶级革命开始,对封建制度的批判。
(2)1789年把有关内容写入美国宪法。
主要内容:(1)任何人都有出版自由而不需经过政府或当局的特别许可。
(2)新闻出版不需经第三者的实现检查,出版内容不能受到强制。
(3)在涉及观点、意见、信念的问题长,真理与谬误的传播必须同样保证。
(4)除人身攻击外,报刊有权批评官吏合政府,正当合法
理论与现实矛盾:资本与媒介的结合,传播活动实际上依然是资产阶级的特权
b、社会责任理论
理论主张:大众媒介对社会和公众应该承担一定的责任和义务,不是绝对的自由!
产生背景:(1)传媒的高度垄断与所谓的观点的公开市场产生矛盾。(大众丧失传播权力)
(2)自由主义强调传播者,忽视受传者权力
(3)自由主义强调的意见、观点、思想的自由,忽视了作为私有传媒的营利活动。
主要内容:(1)大众传播具有很强的公共性,因此传媒机构必须承担一定的责任和义务。
2)媒介传递的信息必须真实、客观、公正
(3)媒介必须在法律和制度内自我约束不能煽动社会犯罪,传播宗教、歧视
(4)受众有权力要求媒介从事高品位的传播活动。
c、民主参与理论(牵制作用、非统治地位)
理论主张:要求大众传媒像一般民众开放,允许民众个人和群体的自主参与。
产生背景:(1)信息化发展加快,信息及其传播直接作用于人们的生活,作用加深
(2)垄断性加强,民众自主使用媒介意识提高,但现实缺乏可利用传播资源。
主要内容:(1)任何民众个人和弱小社会群体都有知晓权、传播权、对媒介的接近使用权、接受服务的权力。
(2)媒介应主要为受众存在,而不是为媒介组织、职业宣传家或广告赞助人。
(3)社会各群体、组织、社区都应当有自己的媒介
(4)与大规模的,单向的、垄断性的巨大的媒介相比,小规模的,双向的,互动的媒介更加合乎社会理想。
4、资本主义媒介理论变化的过程揭示了什么?
由极权主义到早期产生的自由主义媒介规范是一个进步的过程,它的出现,打破了极权主义专制制度和等级支配观念,确立自由,平等和权力思想起了巨大的作用。马克思恩格斯创办工人报刊,从事工人工人运动,也是充分利用了这种言论和出版自由的环境。但是资本主义的一切,终究是和资产阶级的利益以及资本密不可分的,一切和金钱挂钩,人民群众的利益无法得到保障。尽管随后产生的社会责任理论、民主参与理论在某些方面有所改良和进步,但是这些也只能够缓解矛盾进一步激化。人们群众利用媒介的需求越来越高,但是媒体的垄断却又进一步加强。两者之间的矛盾是资本主义自身性质所决定的,这个矛盾的运动促成了资本主义媒介理论的发展。
C、社会主义的媒介规范理论
1、我国社会主义媒介规范理论包括那些方面?
(1)我国的新闻传播事业实行社会主义公有制
(2)我国社会主义新闻事业是中国共产党领导下的事业,(3)必须坚持党性原则。
(4)社会主义新闻传播事业执行报道新闻、传递信息、引导舆论、提供娱乐等多方面的社会职能。
(5)社会主义新闻传播事业具有重要的经济功能。
A、新闻传播事业通过沟通生产、流通和消费对国民经济的发展起着服务作用
B、新闻传播事业本身也是社会主义市场经济的重要组成部分。
我国的社会主义传播制度还在不断的改革与完善,我们要在不断的摸索中总结经验,建立符合中国国情的,具有中国特色社会主义的传播制度和规范体系。(注意:我国的新闻传播事业也面临着媒体企业化经营的经济利益与商业主义、营利主义的出现)
2、发展中国家媒介规范理论包括哪些方面?(生存与发展是最大课题)
(1)大众传播活动必须与国家政策保持一致,(2)推动国家发展。(政治的生存发展)
(3)媒介的自由活动伴随相应责任,(4)自由必须在经济优先和满足社会需求的原则下进行。(经济的生存发展)
(5)传播内容上,(6)优先本国文化,(7)本族预言。(文化的生存发展)
(8)新闻和信息的交流合作领域,(9)优先发展与本国地理,(10)政治文化接近的其他发展中国家的合作关系,读后感《传播学教程笔记》。(文化的生存发展),(11)在有关国家发展和社会稳定的利害关系上,(12)国家有权对媒体进行检查,(13)干预或管制。(政治的生存发展)
传播媒介的性质与作用
(一)作为技术手段和工具的传播媒介
(载体,其属性决定着信息的物理形式、时空范围、速度快慢和量的规模)
A、麦克卢汉的媒介理论(媒介自身的作用和影响)
1、媒介的双重含义是什么?
信息传递的载体。传媒机构
2、为什么要研究传媒的载体含义?
媒介的发展与社会的演化变革紧密的结合在一起,同时它在社会发展中的意义是多方面的。
3、麦克卢汉的媒介理论包括什么观点?
媒介即讯息。媒介:人的延伸。热媒介与冷媒介。
(1)、媒介即讯息的含义是什么?
媒介本身才是真正有意义的讯息。媒介是传播的基础,真正有意义的不是媒介所传播的内容,而是这个时代所使用的传播工具的性质、它所开创的可能性、相应带来的社会变革。
此观点表现出麦克卢汉把媒介作为社会发展和社会形态变化的决定因素来来看待。
(2)、媒介:人的延伸,如何理解其含义?
任何媒介都是人类感觉和感官的延伸。人类感官能力的发展是“统合—分化—再统合”。麦乐卢汉通过此观点说明传播媒介对人类感觉中枢的影响。
(3)、热媒介与冷媒介的含义是什么?(麦提出的两个著名概念)
热媒介:传递的信息比较清晰,接受者不需要动员更多的感官活动和联想活动就能够理解
冷媒介:传达的信息含量少,且模糊,在理解时需要动员多种感官的配合和丰富的想象力。
此观点的提示在于:不同的媒介作用于人的方式不同,引起的心理和反应也有所不同,研究媒体应该把这些因素考虑在内。
4、麦克卢汉的理论意义和局限性是什么?
(1)、理论意义
开拓了从媒介技术手段发现观察人类社会发展的视角,强调了媒介技术的社会历史作用。
(唯物论观点---信息技术也是生产力的一部分)
媒介即人的延伸的观点对于我们理解不同的媒介作用机制富有启迪意义。
地球村的语言符合了世界发展的趋势
(2)、局限性(强调了人的生物延伸性,而不是人的社会延伸性)
强调技术是社会发展和变革的决定性因素----忽略了生产关系、社会关系等社会因素的作用
其理论强调人被媒介技术和工具主宰-----忽略了人的主体性、能动性。
其理论依据集中在媒介对人的中枢感觉系统的影响----忽略了人的理性活动。
5、如何正确认识媒介工具和技术在社会发展和社会形态变革中的作用呢?
马哲观点:决定社会形态发展和变革的基本因素是:生产方式和内在的矛盾运动
生产方式:生产力和生产关系,生产力是矛盾的主要方面,生产关系有制约作用
媒介技术和工具属于生产力的方面,具有推动社会发展的作用,但是媒介被人创造,利用和控制。社会的各个因素都对其有制约着其活动。
B、媒介技术和工具对现实社会的影响(媒介内容及媒介形式的影响)
1、电视人和容器人的概念是什么?
媒介不仅利用其内容影响人的认识、价值观、行为、一种媒介的出现、使用和普及都会在很大程度上改变人的个性和性格。
电视人:注重感官刺激,行为方式感性化,与印刷人的理性,逻辑思维能力形成对比,缺乏社会互动,容易自我封闭,以自我为中心,缺乏责任感。
容器人:在电视媒体包围中成长,人的内心世界呈“罐”的容器状。感觉孤立,封闭,希望与人接触,但是接触仅仅是一种容器的碰撞,无法深入人心内部,因为彼此之间都不希望对方深入自己的内心世界。于是保持一定的距离,成了人际关系的最佳选择。
2、媒介依存症的特点是什么?
(1)、过度沉溺于媒介接触而无法自拔。
(2)、价值和行为选择一切必须从媒介中寻找依据。
(3)、满足于媒介的虚拟活动而逃避现实的社会互动。
3、电视与人的充欲主义的概念是什么?
电视不仅本身作为一种人们欲望追求的对象,同时它也在把充满诱惑力,丰富的意境展现于人们面前,直接刺激人们的占有欲和享乐欲。
C、新媒介的发展趋势及其冲击
1、什么是新媒介?
伴随卫星通信,数字化,多媒体和计算机技术的发展而出现的新型的传播媒介。
2、新媒介的特点是什么?
(1)、传播过程的双向性的增强。(传统媒介的单向性)
意义:改善了受众被动性,增强双方的互动性。
(2)、多媒体化和媒介功能的融合(传统媒介的单一性)
意义:为人们信息的收集、处理、传输提供了空前的便利条件,有助于提高传播活动的质量和效率
(3)、媒介资源的丰富化(传统媒介资源的稀缺性)
意义:改变少数大众传播机构垄断资源的状况,为更多的社会成员、群体和组织成为能动的传播者提供了条件
(4)信息传播的全球化(传统媒介的地域性)
意义:把人的传播范围扩展到整个世界,使人们的认识、判断和行为受到更多变量的影响。
3、什么是电子乌托邦?
对美俄借技术的发展给予了无条件的乐观主义期待,认为新的技术必将会把人类带入一个高度自由、民主和平等的理想国。
4、如何看待电子乌托邦和媒介技术的思想?
单纯技术上的可能性并不能必然保证理想的社会形态的出现。一种理想社会的到来,不仅需要技术上的支持,而且需要更为复杂的社会条件,其中包括社会结构、社会制度的合理化以及自身素质的提高等等。简单的断言传播技术或工具必然导致某种社会形态的观点是幼稚的。媒介是中性的,自身并不必然导致社会善或者社会恶。重要的是如何利用它,利用它传播什么。
(二)作为社会组织的大众传媒
(传媒机构,其属性决定着信息内容的生产和传播)
A、传播者与大众传播
1、什么是大众传媒?
传播者是传播行为的发起人,借助某种手段或工具、通过发出信息主动作用于他人的人,报社、电台、电视台是从事信息的采集、选择、加工、复制、传播的专业组织,从其生产规模的巨大性和受传者的广泛性而言,我们称之为大众传媒。
2、大众传媒的特点是什么?(为什么说大众传媒的力量是所有传播者中最强大的?)
(1)、地位稳固(始终保持其信息发出者的位置)
(2)、大众传媒是一种社会组织,具有自身的组织结构和组织目标。(个人活动的组织性、信息产品的组织性)
(3)、大众传媒是大众传播生产资料的直接控制者和使用者
4、如何看待互连网媒体以及出现的电子媒介?
网络仅仅是一个硬件平台,而不是传播的主体,真正的主体是使用这个设施进行信息生产、处理、传播的人或组织。其也成为大众媒介的发展新空间。传统媒介进入互联网传播,逐渐在互联网传播中确立了新的领导地位。
原因归结为:
(1)、传媒是专业的媒介组织,其效率远远高于一般个人或非正式组织。
(2)、大众媒介的信息更加可靠,真实。
(3)、大众传媒在其长期发展中形成了一整套行业规范和职业道德,并在此基础上形成了一套吸引和联系受众的有效机制。
B、大众传媒的组织目标与制约因素
1、传媒的经营目标是什么?
积极收益目标(经营目标)、非经济收益目标(宣传目标)
2、什么是传媒的经营目标?(传媒活动的约束条件之一)
企业的经营活动是维持传媒组织的自身生存和发展的前提。盈利是目标之一。
收益来源于:广告和产品的销售。压力来源:广告主和消费者。
3、什么是传媒的宣传目标?(传媒活动的约束条件之二)
传媒在从事经营活动的同时,也对某种思想进行宣传,灌输某种意识形态,提倡某种信念。
信息生产属于社会的上层建筑直接相关的精神生产,每种社会信息产品中都不可避免的包含着特定的观念、价值和意识形态,对社会意识和社会行为有着重要的引导和控制作用。因此各种利益集团和政党都把传媒当成自己的发挥影响力,维护自身利益的工具。
4、宣传目标的实现途径是什么?
言论活动----具有直接的宣传功能,传媒组织可以通过社论,评论等形式直接宣扬某种思想。
报道活动-----具有间接的宣传功能,主要是在信息的选择,加工和刊载上贯彻传媒的方针和意图,达到潜移默化。
5、什么是传媒的公共性和公益性。(传媒活动的约束条件之三)(权力的基础,制约的标准)
(1)传媒是现代社会必不可少的信息生产者和提供者,在满足社会的普遍信息需求方面起着一种公共服务的作用。
(2)大众传媒的信息生产和传播活动对社会的政治、经济、文化道德具有广泛而强大的影响力。这种影响力涉及到普遍的社会秩序和社会公共生活。
(3)传媒是某些稀有资源的使用者,作为公共菜站的使用人,必须对社会和公众承担相应的义务和责任。
B、传媒组织在信息生产过程中的作用
1、新闻选择的把关人理论是什么?
新闻的基本功能是帮助社会成员消除关于环境变化的不确定性,并在此基础上协调自己的社会行为。在群体传播中,只有符合群体规范和把关人(媒介)价值标准的信息内容才能进入传播的渠道。把关的行为是一个组织性的行为。
2、传媒进行信息取舍的标准是如何确定的?
真实、及时、新意、新闻的业务标准和市场标准(课本p163)、社会目标、宣传目标
3、把关过程的实质是什么?
把关的过程,不仅仅是对信息价值和信息要素的分析。也应该把政治、经济和意识形态等因素考虑在内。原因如下:
(1)、大众传媒的新闻或信息的生产与传播并不具有纯粹的客观中立性,而是根据传媒一定的立场,方针和价值标准进行的有取舍的活动。
(2)、新闻和信息的选择受到媒体的经营目标,受众需求以及社会文化等多因素的制约,但是与媒介方针利益一致的内容更容易优先传播。
(3)传媒的把关是一个多环节,有组织的过程,虽有个人参与,但是个人作用是有限的,把关过程总体上是传媒组织立场和方针的体现。