第一篇:应用统计学实验报告一
1:
GDP均值:
人居GDP均值:
中位数、标准差、峰度、偏度:
前五位和后五位的省份:
:2:(1)
()
(3)
(4)
第二篇:统计学实验报告一
《统计学》实验报告一
姓名:
专业:
学号:
日期:
地点:
实验项目一 描述性统计、区间估计在EXCEL里的实现
一、实验目的
1、掌握利用EXCEL菜单进行数据的预处理;
2、掌握利用EXCEL进行描述性统计;
3、掌握利用EXCEL进行区间估计。
二、实验要求
1、EXCEL环境与数据预处理的操作;
2、描述性统计,包括统计图表的绘制;数据分组处理;集中趋势描述、离散程度描述、分布形状描述。
3、区间估计,包括总体均值、总体比例、总体方差的区间估计计算。
三、实验内容
(一)分类数据的描述性统计
实验数据:餐厅服务质量和价位评价.XLS 顾客服务质量评价的频数表(按性别分)、条形图、饼图、帕累托图
(二)数值性数据的描述性统计
实验数据:城乡居民储蓄数据.XLS 随着生活水平的逐渐提高,居民的储蓄存款也在日益增加,数据2.XLS是自1990年~2006年城乡居民人民币储蓄存款额,储蓄存款包括定期和活期(单位:元)。利用EXCEL,对数据2.XLS作如下分析:
1、城乡居民人民币活期存款的众数、中位数和均值是多少?
2、城乡居民人民币定期存款的方差和标准差是多少?
3、定期存款和活期存款相比,哪种数据的变动性更大?
(三)总体参数的区间估计
1、成绩分析。实验数据:期末成绩.XLS 假设学生的各门期末考试成绩均服从正态分布,选定一门课程,并给出该门课程平均成绩的置信水平为95%的区间估计。
2、顾客满意度分析。
某超市为了了解顾客对其服务的满意度,随机抽取了其会员中的50个样品进行电话调查,如果有38个顾客对此超市的服务表示满意,试求对该超市服务满意的顾客比例的95%置信区间。
四、实验结果
(一)分类数据的描述性统计
顾客服务质量评价的频数表(按性别分)、条形图、饼图、帕累托图
(二)数值性数据的描述性统计
1、城乡居民人民币活期存款的众数、中位数和均值是多少? 中位数: 11615.9 均值 : 18553.6
2、城乡居民人民币定期存款的方差和标准差是多少? 方差 :887955495.6 标准差:29798.58
3、定期存款和活期存款相比,哪种数据的变动性更大?
活期存款方差 :319632938.5 活期存款标准差:17878.28
因为定期存款标准差:29798.58大于活期存款标准差:17878.28,所以定期存款变动性大
第三篇:统计学实验报告
本 科 生 实 验 报 告
实验课程
统
计
学
学院名称
商
学
院
专业名称
会
计
学
学生姓名
苑蕊
学生学号
指导教师
刘
后
平
实验地点
成都理工大学南校区
实验成绩
二〇一五
年
十
月
二〇一五
年
十
月
学生实验
心得
关于本学期统计学课程得实践心得: 一、实验目得:
实验学习就是贯彻统计教学大纲得教学计划得手段、不仅就是校内教学得延续、而且就是校内教学得总结。实验学习得目得就就是使同学们得理论更加扎实、专业技能操作更加过硬。
通过实验学习需要了解与掌握:
1、熟悉 EXEL 与 SPSS 操作系统、掌握数据管理界面得简
单得操作;
2、熟悉 EXEL 与 SPSS 结果窗口得常用操作方法、掌握输出结果在文字处理软件中得使用方法。掌握常用统计图(线图、条形图、饼图、散点、直方图等)得绘制方法;
3、熟悉描述性统计图得绘制方法;
4、熟悉描述性统计图得一般编辑方法。
二、实验内容:按照要求进行资料得整理、绘制统计表与统计图。
1、某高校二级学院 60 名教职工得月工资资料如下: 1100
1200
1200
1400
1500
1500
1700
1700
1700
1800
1800
1900
1900
2100
2100
2200
2200
2200
2300
2300
2300
2300
2400
2400
2500
2500
2500
2500
2600
2600
2600
2700
2700
2800
2800
2800
2900
2900
2900
3100
3100
3100
3100
3200
3200
3300
3300
3400
3400
3400
3500
3500
3500
3600
3600
3600
3800
3800
3800
4200
依据上述资料编制组距变量数列、并用次数分布表列出各组得频数与频率、以及向上、向下累计得频数与频率、并绘制直方图、折线图。
学生实验
心得
学生实验
心得
2、已知 20012012 年我国得国内生产总值数据如表 216 所示。
要求:(1)依据20012012年得国内生产总值数据、利用Excel软件绘制线图与条形图。
(2)依据 2012 年得国内生产总值及其构成数据、绘制环形图与圆形图。
学生实验
心得
3、计算以下数据得指标数据 1100
1200
1200
1400
1500
1500
1700
1700
1700
1800
1800
1900
1900
2100
2100
2200
2200
2200
2300
2300
2300
2300
2400
2400
2500
2500
2500
2500
2600
2600
2600
2700
2700
2800
2800
2800
2900
2900
2900
3100
3100
3100
3100
3200
3200
3300
3300
3400
3400
3400
3500
3500
3500
3600
3600
3600
3800
3800
3800
4200
4、一家食品公司、每天大约生产袋装食品若干、按规定每袋得重量应为 100g。为对产品质量进行检测、该企业质检部门采用抽样技术、每天抽取一定数量得食品、以分析每袋重量就是否符合质量要求。现从某一天生产得一批食品 8000 袋中随机抽取了 25 袋(不重复抽样)、测得它们得重量分别为:
学生实验
心得
112、5100、5102、6107、5
108、8115、612、35101、6
102、2
116、6
95、4
97、8
108、6
136、8
102、8
101、5
98、4
93、3 已知产品重量服从正态分布、且总体方差为 100g。试估计该批产品平均重量得置信区间、置信水平为 95%、学生实验
心得
5、已知某种电子元件得寿命服从正态分布、现从一批电子元件中随机抽取 16 只、测得其寿命得原始数据如下: 1510
1450
1480
1460
1520
1480
1490
1460
1480
1510
1530
1470
1500
1520
1510
1470 试建立该批电子元件使用寿命 95%得置信区间。
学生实验
心得
6、在探讨不同饲料对动物影响得试验中、测得三组动物服用饲料后每日进食量如表所示、请问三组动物每日进食量就是否相同?
学生实验
心得
由图可知、三组动物进食量不同。
7、三个组别得人群每日增加得体重(kg)数据如表所示。
请问三个组别得人群每日增加得体重数量就是否相同?
学生实验
心得
由图可知、三个组别得人群每日增加得体重数量不同。
8、某企业 20092013 年得销售额资料如表所示。
请用最小平方法求趋势直线方程。
9、某公司 8 个所属企业得产品销售资料如表所示。
要求:(1)画出相关图、并判断销售额与销售利润之间得相关方向。
(2)计算相关系数、指出产品销售额与利润之间得相关方向与相关程度。
学生实验
心得
(3)确定自变量与因变量、求出直线回归方程。
(4)计算估计标准差 Syx。
(5)对方程中回归系数得经济意义做出解释。
(6)在 95%得概率保证下、求当销售额为 1200 万元时利润额得置信区间。
(1)
(2)
(3)
学生实验
心得
10、某公司得 10 家下属企业得产量与单位生产费用之间得关系如表所示。
要求:(1)画出相关图、并判断产量与单位生产费用之间得相关方向。
(2)计算相关系数、指出产量与单位生产费用之间得相关方向与相关程度。
(3)确定自变量与因变量、拟合直线回归方程。
(4)计算估计相关误差 Syx、(5)对相关系数进行检验(显著性水平取 0、05)。
(6)对回归系数进行检验(显著性水平取 0、05)。
(7)在 95%得概率保证下、求当产量为 130 万件时单位生产费用得置信区间。
学生实验
心得
(1)
(2)
(3)
学生实验
心得 三、实验体会
通过实验学习、使我们对统计工作有了一个初步得认识、以及统计软件在统计工作中应用得重要性与方便性、了解信息收集与处理过程、为以后专业理论课程得学习奠定实践基础。学习了 EXEL 与 SPSS 软件、有力得将理论知识与实践联系在一起、并且进一步掌握了理论知识、提高了分析问题、解决问题得能力。在应用软件分析出得数据中、有很多都不知道就是什么意思、还有得数据概念模糊、这都就是在今后得学习中需要改进与加强得。
学生(签名):
2015 年 10 月 25 日
指导
教师
评语
成绩评定: 指导教师(签名):
****年**月**日
第四篇:统计学实验报告
应用统计学实验报告
武汉工大学
管理学院
应用统计学 课程实验(上机)报告专业班级:2010级工商管理01班 学 号: 指导老师:夏剑锋
实验(上机)地点:活动中心 学期:2012—2013第二学期
第 1 页;共 23页
应用统计学实验报告
实验(上机)日期:2013年4月25日
第1 次 实验(上机)主题:统计软件的运用 实验(上机)类别):验证性 完成方式:独立
实验(上机)目的与要求:
1、掌握启动和退出统计软件
2、掌握数据库的建立
3、搜集一些数据并建立数据库
4、进行一些统计计算(函数、描述性统计)
5、制作统计图
6、计算各种统计指标
实验(上机)内容及方法
一、基本操作
1.在EXCEL图标双击,打开工作表。
2.在“文件”菜单下,选择“新建”,在右边“新建工作簿”选择“空白工作簿”。
3.单击页面右上角红色关闭按钮,关闭工作表,并退出软件。如提醒“是否保存”则选择保存,或者选择取消在查看后在退出。
二、描述性统计
1.在数据表窗口输入数据如下:
59 78 86 94
81 76 69
表1-1某学科成绩表 78 94 49 76 89 95 83 58 76 66 81 68
78 76 93
68 63 69 78 2.单击保存,在文件名称中输入“成绩文件”
第 2 页;共 23页
应用统计学实验报告
3.加载数据分析工具:在“工具”下拉菜单下找到“加载宏”,单击,选择“数据分析工具”点击确认。
图1-1 加载分析工具库
4.再在工具下拉菜单下找到“数据分析”选项。
图1-2 打开数据分析
第 3 页;共 23页
应用统计学实验报告
5.单击“数据分析”,选择“描述性统计”
图1-3开始描述性统计
6.数据复选框如下,单击确定,图1-4描述性统计选项卡
7.显示结果如下:
平均 标准误差 中位数 众数 标准差 方差 峰度 偏度
表1-2 描述性指标显示结果 77.91667 区域 1.972982 最小值 78 最大值 76 求和 11.83789 观测数 140.1357 最大(1)-0.24247 最小(1)-0.19707 置信度(95.0%)
第 4 页;共 23页
2805 36 98 49
4.005367
应用统计学实验报告
三、函数计算:
1、简单函数运算:
1)将鼠标定位在单元格,进入编写模式,输入函数:“=A1*A1”,点击回车键,在哦单元格内出现运算结果。把鼠标移到单元个右下角,直到出现“十字”按住鼠标右键往下拉,则将运算复制。显示结果如下:
图1-4 函数输入
2)插入函数:(用函数求和)
3)单击输入框中的函数输入符号,点击确定(如下图),计算书刚刚输入成绩的总和为:2805
图1-5 插入函数选项卡
按照同样的方法可以选择其他函数形式进行统计统计运算。
第 5 页;共 23页
应用统计学实验报告
2、制作统计图:
1)直方图:
在表格上输入分组方式:
表1-3 分组方式
99
在工具菜单下找到数据分析,单击,并在对话框中选择“直方图”,单击“确定”
图1-6 直方图操作选项
图1-7 直方图复选框
第 6 页;共 23页
应用统计学实验报告
统计结果如下:
表1-4 频率分析表 分数
99
其他
频率 8 11 7 7 0
直方图***989分数99其他
图1-8 成绩分析直方图
频率频率 如果在复选框中选择“柏拉图”和“表格输出”,显示结果如下:
直方图***99959其他接收
图1-9 带累计频率的直方图
150.00%100.00%50.00%0.00%频率累积 %2)饼形图:
在“插入”菜单下,选择“图表”,在对话框中选择“饼形图” 频率第 7 页;共 23页
应用统计学实验报告
图1-10 饼形图选择框
根据向导输入数据,分别选择。最终统计图表如下:
成绩分析饼形图90-9919%其他0-590%8%60-6922%80-8919%70-7932%0-5960-6970-7980-8990-99其他
图1-11 成绩分析饼形图
第 8 页;共 23页
应用统计学实验报告
上机总结:
1、通过本次上机,巩固了excel的基本操作,让操作更加流畅。
2、进一步了解了函数的使用,能够熟练的掌握基本的统计量的运算。
3、通过实验的学习和比较,进一步加深了对统计量意义的学习。
实验(上机)成绩:第 9 页;共 23页
评阅老师: 评阅时间:
应用统计学实验报告
实验(上机)日期: 2013年5月9日 第 2 次 实验(上机)主题:假设检验与方差分析 实验(上机)类别):验证性 完成方式:独立
实验(上机)目的与要求:
1、建数据库:(1)假设检验(双样本数据)(2)方差分析:单因素方差分析和双因素方差分析
2、掌握假设检验的计算与分析
3、掌握方差分析的计算与分析
4、输出计算结果并进行分析
5、进行检验和决策
实验上机内容及方法
一、单因素分析
1.检验数据:
表2-1 三种训练方法下工人的日产量
方法1 方法2 方法3 22 18 18 27 24
人均日产量 18 16 21 22 11 17 15
2.将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-1 分析工具选择
第 10 页;共 23页
应用统计学实验报告
3.在数据复选框内选择数据如下;
图2-2 单因素分析复选框
结果输出:
表2-2 单因素分析结果
组 行 1 行 2 行 3 方差分析 差异源 组间 组内 总计 观测数 5 5 5 SS 40 192 232
求和 85 105 95 df 2 12 14
平均 17 21 19 MS 20 16
方差 17.5 15.5 15 F 1.25
P-value 0.321277
F crit 3.885294
分析:F crit=3.885294;F=1.25 因为F=1.25<F crit=3.885294,所以拒绝训练方法对日产量有显著影响,即三种训练方法对日产量没有显著影响。
二、双因素分析(无交互作用)实验数据
表2-3 4个工人和3台机器配合的日产量
A1 A2 A3 B1 50 63 52 B2 47 54 42
第 11 页;共 23页
B3 47 57 41 B4 53 58 48
应用统计学实验报告
将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-3 无交互作用双因素分析选项
在数据复选框内选择数据如下;
图2-4 无交互作用双因素分析复选框
分析结果输出:
表2-4方差分析:无重复双因素分析
SUMMARY 行 1 行 2 行 3 列 1 列 2 列 3 列 4 方差分析 观测数 4 4 3 3 3
求和 197 232 183 165 143 145 159
平均 49.25 58 45.75 55 47.66667 48.33333
方差
8.25 14 26.91667
36.33333 65.33333
显著性水平:1%
第 12 页;共 23页
应用统计学实验报告
差异源 行 列 误差
总计 SS 318.5 114.6667 32.83333
df 2 3 6
MS F P-value F crit
159.25 29.10152 0.000816 10.92477 38.22222 6.984772 0.022015 9.779538 5.472222
466 11
MS
F
P-value
F crit 方差分析:无重复双因素分析
方差分析 显著性水平:5% 差异源 行 列 误差
总计 SS 318.5 114.6667 32.83333
df 2 3 6
159.25 29.10152 0.000816 5.143253 38.22222 6.984772 0.022015 4.757063 5.472222
466 11
分析:
行因素:在显著性水平为1%的时候,F crit=10.92477,在显著性水平为5%时,F crit=5.143253,都远小于F =29.10152。即不同牌号机器上的日产量有高度显著性差别。
列因素:在显著性水平为1%的时候,F crit=9.779538,在显著性水平为5%时,F crit=4.757063,F=6.984772。因为4.757063<6.984772<9.779538。则不同工人的日产量只有显著的差别。
三、双因素分析(有交互作用)实验数据
表2-5 灯泡寿命数据
因 子 B
B1 B2 B3
A1
13.2 15 16.1 17.3 18 17
因子A A2 A3
14.4 14 15.6 13.6 13.7 16.3 14.3 17.1 14.5 17.1 15.7 16.1
第 13 页;共 23页
应用统计学实验报告
将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-5 有交互作用双因素分析
在数据复选框内选择数据如下;
图2-6 有交互作用双因素分析复选框
分析结果输出:
表2-5方差分析:可重复双因素分析
观测数 求和平均 方差
28.2 14.1 1.62
15 0.72
27.6 13.8 0.08
85.8 14.3 0.796
第 14 页;共 23页
应用统计学实验报告
观测数 求和平均 方差
观测数 求和平均 方差
总计
观测数 求和平均 方差
方差分析
差异源 样本 列 交互 内部 总计 2 33.4 28 16.7 14 0.72 0.18 2 35 30.2 17.5 15.1 0.5 0.72 96.6 16.1 3.096 88.2 14.7 0.62 33.4 16.7 0.32 33.2 16.6 0.5 94.2 15.7 2.348 94.8 15.8 2.188
98.4 16.4 1.52
P-value
F crit
显著性水平为5% SS 14.04 6.24 10.92 5.36 36.56
df
MS
F 7.02 11.78731 0.003063 4.256495 2 3.12 5.238806 0.030987 4.256495 4 2.73 4.583955 0.027093 3.633089 9 0.595556
方差分析
差异源 样本 列 交互 内部 总计
显著性水平为:1% SS df MS 14.04 2 7.02 6.24 2 3.12 10.92 4 2.73 5.36 9 0.595556 36.56 17
F
11.78731 5.238806 4.583955
P-value 0.003063 0.030987 0.027093
F crit 8.021517 8.021517 6.422085
分析:
1、因子A(工艺方法)分析:在显著性水平为1%的时候,F crit=8.021517,在显著性水平为5%时,F crit=4.256495,F =6.24,因为4.256495<6.24<8.021517,则工艺方法对灯泡寿命的影响是显著的。
2、因子B(灯丝配方)分析:在显著性水平为1%的时候,F crit=8.021517,在显著性水平为5%时,F crit=4.256495,F =11.78731,因为8.021517<11.78731,则灯丝配方对灯泡的寿命影响是高度显著的。
第 15 页;共 23页
应用统计学实验报告
3、交互作用分析:在显著性水平为1%的时候,F crit=6.422085,在显著性水平为5%时,F crit=3.633089,F =4.583955,因为3.633089<4.583955<6.422085。则工艺和菲方之间存在交互作用。
实验上机总结:
1、学会如何让运用软件进行方差计算和分析;
2、通过提出假设,了解如何通过计算数据进行显著性判断和检验;
3、根据假设和检验结果,明白如何进行判断。
实验上机成绩:
评阅老师:
评阅时间:
第 16 页;共 23页
应用统计学实验报告
实验(上机)日期:2013年5月16 第 3 次 实验(上机)主题:回归分析 实验(上机)类别):验证性 完成方式:独立
实验(上机)目的与要求:
1、搜集数据并建数据库
2、掌握一元线性回归的计算与分析
3、掌握多元线性回归的计算与分析
4、输出计算结果并进行分析
5、进行检验和预测
实验上机的内容及方法 一,一元线性回归 数据显示如下:
(表3-1十个企业的生产费用与产量数据)
企业编号 1 2 3 4 5 6 7 8 9 10 产量X(千克)40 42 48 55 65 79 88 100 120 140 生产费用Y(千元)150 140 160 170 150 162 185 165 190 185 将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。在复选框中选择如下:
(图3-1一元回归分析复选框)
第 17 页;共 23页
应用统计学实验报告
则显示相关数据处理结果如下:
表3-2 回归统计表
Multiple R R Square Adjusted R quare 标准误差 观测值
表3-3 方差分析表
0.807766 0.652486 0.609047 10.5332
回归分析 残差 总计 df
SS MS F Significance F 1666.514 1666.514 15.02064 0.004704 8 887.586 110.9483 2554.1
表3-4 回归分析表
Intercept X Variable 1 Coefficients 标准误差 t Stat
Lower Upper
95% 95% 134.7893 8.643234 15.59477 2.85E-07 114.8579 154.7206 0.397821 0.102646 3.875647 0.004704 0.161118 0.634525
P-value 得到散点图和拟合分析图如下:
Normal Probability Plot20010000204060Sample Percentile图3-2 散点图 Y80100
X Variable 1 Line Fit Plot***0X Variable 1图3-3 拟合分析图
Y预测 Y150Y
第 18 页;共 23页
应用统计学实验报告
相关分析:
1、回归方程
由散点图得知回归方程为一元线性方程。得到回归方程如下: Y=134.7893+0.397821X
2、显著性分析
得到Multiple R=0.807766>0.765(在检验数为0.01时相关系数检验数)表示回归方程显著。
t Stat=3.875647>2.306(α=0.05,自由度=8时t值)则统计检验结果显著。其存在良好的线性关系。
F=15.02064>5.32(在α=0.05,n1=1,n2=8时F值),表示回归结显著。
3、相关预测
在产量为80千件时,平均生产费用的置信区间(α=0.05)生产费用预测Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*0.317=166.614-7.707=158.844 下界=166.614+7.707=174.321 即总体均值得95%置信区间为(158.844,174.321)
在产量为80千件时,生产费用的置信区间(α=0.05)生产费用预测Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*1.049=166.614-25.503=140.637 下界=166.614+25.503=191.643 即总体得95%置信区间为(140.637,191.643)
二,多元回归 试验数据:
表3-5 某企业10个月的月管理费用与工人劳动日数和机器开工台数的资料
管理费用Y 工人劳动日数X1 29 45 24 42 27 44 25 45 26 43 28 46 30 44 28 45 28 44 27 43
第 19 页;共 23页
应用统计学实验报告
机器开工台数X2 14 15 13 13 14 16 16 15 15 将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。在复选框中选择如下:
图3-4 多元回归复选框
则显示相关数据处理结果如下:
表3-5 回归统计表
回归统计
Multiple R 0.85377 R Square 0.728923 Adjusted R
0.651473
Square 标准误差 1.070639 观测值 10
表3-6 方差分析表
回归分析 残差 总计 df SS MS F Significance F 2 21.57613 10.78806 9.411471 0.010371 7 8.023873 1.146268 29.6
表3-7 回归分析表
Coefficients 标准误差 t Stat
第 20 页;共 23页
P-value 下限 上限
应用统计学实验报告
Intercept X Variable 1 X Variable 2
95.0% 95.0%
-13.8196 13.3233-1.03725 0.334115-45.3242 17.68497 0.56366 0.303274 1.858586 0.10543-0.15347 1.280789 1.099469 0.313139 3.511123 0.009844 0.359013 1.839926 得到散点图和拟合分析图如下:
Normal Probability Plot402000204060Sample Percentile图3-5 散点图 Y80100
X Variable 1 Line Fit Plot***X Variable 1图3-6 拟合分析图
Y预测 Y4647Y
相关分析:
1、回归方程
由散点图得知回归方程为二元线性方程。得到回归方程如下: Y=-13.8196+ 0.56366X1+ 1.099469X2
2、回归方程检验
R Square= 0.728923>0.6516
第 21 页;共 23页
应用统计学实验报告
F= 9.411471>4.74(α=0.05,自由度=2,7时,F值)即:回归方程的拟合程度很好。
3、回归系数:
t 1= 1.858586<2.365(α=0.05,自由度=7时,t值)t2= 3.511123>2.365(α=0.05,自由度=7时,t值)
所以β1不显著,β2显著。即工人劳动日数对管理费用的影响并不是显著;机器开工台数对管理费用影响显著。
4、相关系数分析:
表3-8相关系数分析表
Y X1 X2
Y X1 X2
0.501517 1 0.771462 0.184094 则得到Y与X1之间的相关系数为0.501517;Y与X2之间的相关系数为0.771462,X1与X2之间的相关系数为0.184094 计算相应的偏回归系数Y与X1之间的偏相关系数为0.5748;Y与X2之间的相关系数为0.7987。
又t1= 0.5748*√7/√(1-0.5748*0.5748)=1.86<2.356(α=0.05,自由度=7时,t值)
T2=0.7987*√7/√(1-0.7987*0.7987)=3.51>2.356(α=0.05,自由度=7时,t值)
即:工人劳动日数与管理费用之间的偏相关系数不显著;机器开工台数与管理费用之间的偏相关系数是显著的。
第 22 页;共 23页
应用统计学实验报告
实验上机总结:
1、学会如何让运用软件进行一元与二元方程回归分析的计算;
2、通过提出假设,了解如何通过计算数据进行系数显著性判断和检验;并对方程的拟合优度和相关性进行判断
3、根据回归结果很好的预测,并在给出置信度的情况下对总体均值和个体值进行预测。
实验上机成绩:
评阅老师:
评阅时间:
第 23 页;共 23页
第五篇:统计学实验报告
统计学实验报告
姓名:
学号:
班级:
成绩:
一、实验步骤总结
成绩:
(一)数据的搜集与整理
第一种方式是输入网站,第二种方式是通过网络获取二手数据使用搜索引擎。第一步,将数据录入到Microsoft Excel工作表中。
第二步,选中需要筛选的区域,使用“数据—筛选—自动筛选”菜单通过每列第一个单元格右下角的下拉箭头来选择实现筛选。
(二)描述数据的图标方法
对数值型数据是做出频数频率表,我们用frequency函数来获取频数频率。第一步:将数据输入到Microsoft Excel里的单元格,在单元格输入数据;
第二步:激活单元格,点击函数调用卡片打开“插入函数”对话框,从选择类别下拉框中选“统计”,在选择函数框中选择frequency函数;
第三步:点击“插入函数”对话框确定按钮进入“函数参数”对话框。Data_array选中第一列项单元格;Bins_array选中第二列项单元格;
第四步:使用组合键“ctrl+shift+enter”得到频数结果;
第五步:对结果进行修饰,加入分组标志及其值,再加入频数的具体名称,并且计算频率。
2用直方图来表示
第一步,将数据输入到表里的单元格;
第二步,使用“工具—数据分析”菜单,打开“数据分析”对话框,选择“直方图”; 第三步,单击确定按钮,进入“直方图”分析工具库对话框。
第四步,单击确定按钮,得到直方图分析工具扩展函数的返回结果。第五步,对结果进行修饰。
(三)数值型描述度量
1、在Excel中用Average来计算平均数。直接点函数f(x)中的常用函数Average,然后选中区域就可以计算。还有一种方法是先激活单元格,然后输入公式“=average(A1:E10)”
2、在Excel中使用Geomean来计算几何平均数。用函数f(x)中的Geomean,然后选中区域计算结果。也可以激活单元格,输入公式。
3、在Excel中使用Harmean函数计算调和平均数,同样也是先激活单元格,然后使用函数Harmean,就可以计算出结果。也可以激活单元格,直接用公式。
(四)参数估计
1、抽样
第一步,使用“工具-数据分析”菜单打开“数据分析”对话框,选择抽样。第二步,在输入区域里选择区域,然后点随机,再选择输出区域,点确定
2、区间估计
第一步,选中单元格,并使用“插入-名称-指定”菜单,打开“指定名称”对话框,选择“首行”复选框,对数据命名;
第二步,构建函数表单框架; 第三步,输入框架下对应的数据和函数公式。函数表单中涉及到有样本个数、样本均值、总体标准差、置信水平、抽样标准差、置信区间半径、置信区间下限和上限等等内容。
(五)假设检验
首先构建函数表单,然后进行假设检验。假设检验中求P值要经过五个步骤:
1、写出原假设HO及备择假设H1;
2、选择显著性系数水平α及样本容量n;
3、确定合适的检验统计量及抽样分布;
4、搜集样本数据计算样本统计值和P值;
5、给出统计学意义上的结论和经济管理学意义上的结论。
2、双样本方差分析分析工具扩展函数来完成两个方差的F检验。
第一步,使用“工具-数据分析”菜单,打开数据分析对话框,选择“F-检验:双样本分析”分析工具,点击确定按钮打开
第二步,选择区域
第三步,点击确定按钮,返回分析结果。
(六)方差分析
第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“方差分析:单因素方差分析”分析工具,点击确定按钮打开对话框。
第二步,输入区域点击右侧箭头,选择单元格;
第三步,点击“方差分析:单因素方差分析”对话框确定按钮,返回结果。对无重复双因素方差分析,也要用分析工具的数据分析来完成。
第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“方差分析:无重复双因素方差分析”分析工具;
第二步,输入区域点击右侧箭头,选择单元格; 第三步,点击确定,返回结果。
(七)相关与回归分析
第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“相关系数”分析工具,点击确定;
第二步,在相关系数对话框中,点击输入区域右侧的箭头,选择单元格,数据按列录入,所以选中分组方式中的“列”单选框;点击输出区域右侧的箭头,选择一个下侧和右侧没有数据的单元格;
第三步,点击相关系数对话框中的确定按钮返回结果。
构建线性回归模型Y=a+bX1和二元一次线性回归模型Y=a+bX1+cX2.第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“回归”分析工具,点击确定。
第二步,点击“回归”对话框的确定按钮,返回结果。
(八)时间序列分析
第一步,激活单元格,输入公式“=B3-B2”,回车返回想算出的逐期增长量;
第二步,再次激活输入公式的单元格,使用拖拉权柄,点击鼠标左键,向下拖动拖拉权柄至最后一个单元格,就能依次获得逐期增长量。
累计增长量、平均增长量、环比发展速度、定基发展速度也是如此做。
季节变动分析的第一步,计算时间序列的长期趋势;第二步,利用乘法模型,将时间序列的观察值除以对应的长期趋势值,得到季节因素引起的变动分值;第三步,将数据汇总在同一列上;第四步,求出每一季的变动分量值的平均值;第五步,计算季节调整系数;第六步,计算季节比率。
二、实验心得报告 成绩:
(一)心得体会
统计学,在我看来无非就是统计数据嘛,对于我来说统计数据应该不是什么难题。后来学了统计学,才知道并不是那么简单的事情。统计数据的确是统计学中很重要的一项工作,但并不是登记几个数字就了事的。我们除了记录数据,还要对数据进行整理和分析,从而得出有意义的结论。在上第一节实验课的时候,老师给我们讲了怎样进行数据的搜集与整理,比如我们要搜集全国人口普查的调查数据,可以进入网址http://www.xiexiebang.com/,点击其中的数据目录,然后点统计数据,选择数据,再选人口数据就行了。
除了上述的对数据的搜集可以直接进入网站以外,在实验课上我还得知可以用搜索引擎来得到数据。比如,我们可以使用百度网站,搜索四川省2010年国民经济数据,如下图
而直接数据的搜集可以通过三种途径:科学实验、观察研究或者直接调查。我们生活中用得最多的就是直接调查,可以通过抽样调查来取得直接数据。对数据的搜集对我们来说不是很难,除非我们自己去做一份调查。而对搜集来的数据我们要进行整理,这就需要借助办公软件工具来帮我们了,主要是学Excel的使用,它是统计学中一项很重要的工具。
比如,已经知道某班十四位同学的月生活费数据:其中男生:1100、600、1000、800、700、750、850;女生:900、1000、600、500、650、950、1100,希望得到500~700,700~900,900~1100。当我把数据搜集与整理好了以后,我们就需要描述数据。在实验课中,我们用Excel来对数据描述。就拿我搜集到的数据来说明这十四位学生月生活费的情况,通过下图就可以很直观的看出信息。
这些都只是简单的描述方法,在后面的几节实验课中,我才觉得用Excel来进行一系列的数值型描述、参数估计、假设检验、方差分析等等是比较难的。统计实验课和上课是紧密相联的,课上所学的知识全在实验课上运用了。我的感觉是,实验课就是统计学知识的浓缩和精华,这只是我的理解。当我们在进行数值型描述时,我们就要记下表示集中趋势度量的有哪些函数,表示离散程度度量的函数又有哪些?比如用Average来计算平均数,用Geomean来计算几何平均数,用Harmean函数计算调和平均数等等。将这十四位同学的月生活费支出情况输入到Excel中,然后计算他们的算术平均数、几何平均数、调和平均数、中位数、众数等等。我们可以从这些计算出来的数据中分析结果,从而更了解大学生每月生活费的开支情况,可以通过他们的月生活费来推断。
在Excel中有一项很重要的工具那就是“数据分析”,在后面的几个实验里几乎每个实验都会用到“数据分析”这个工具。对上面的这些函数我们也可以用“数据分析”来得出结果。
我们会发现,这些分析出来的结果和我们自己用公式算出来的结果是完全一致的,那就证明了我们自己算出来的结果是没有错的。使用数据分析更快捷方便,可以大大节省我们的时间。在接下来的参数估计中,我们就要记很多函数表达式,抽样是由下至右,由左至右而且只能对一个变量进行抽样,并可重复抽样的简单随机抽样。对于这些过程都要用到“工具—数据分析”这项工具。这十四位同学的月生活费已经是抽样出来的,所以我们没有必要还从这十四位同学中再次去抽样,那样是没有意义的。
而区间估计的实验就是要通过软件,实现一定置信度水平下的置信区间反映结果。Excel没有提供专门的分析工具库扩展函数来分析各种情况下的参数区间估计结果,所以我们只能使用函数或者函数表单来实现实验目标。从我所收集到的样本数据来看,这十四位同学的月生活费是属于小样本数据,这样,我们就可以用小样本抽样以样本均值推断总体均值。从而我们就要进行构建函数表单。函数表单是一种利用函数和命名组合形成的可以反复使用的电子表格,也是进行参数区间估计的主要方法。
前面的“样本个数”这些名称是要自己输入的,这就是所谓的构建函数表单的方法。构建函数表单使我们更清晰的看到我们统计数据的结果是怎样,也很容易地根据函数表单下结论。从使用“工具-数据分析”我们可以清晰的看出这十四个数据所代表的含义,从而推断出大学生每月生活费到底是一种什么趋势,他们读完大学所用的生活费总共是多少呢等等一系列的问题。当然,小样本是不能很正确的说明这些情况,那就需要大样本来说明,由于我的数据只有14个,大样本要求的是30个以上,所以在这里就用不上大样本来分析数据了。
那么函数表单构建的基本思路是首先确定需要进行假设检验的总体参数,其次确定抽样样本统计量及其服从的分布,然后进行假设设计。在运行扩展函数的时候会计算到P值,P值通常被认为是观察到的显著性水平,是在给定的原假设正确的情况下,统计量等于或超过有样本计算出来的统计量的值的概率。它是原假设能被接受的最小概率水平。如果P值大于等于α,接受原假设;如果P值小于α,则拒绝原假设。这里我们假设这十四位同学的月生活费平均为900,则原假设就是总体均值等于900,备择假设就是总体均值不等于900。通过构建函数表单,然后运用公式来计算出结果,使我们省去了自己动手去计算的过程从而节约了我们的时间,提高了统计效率,而得到的分析结果也是准确的,除非是自己输入公式输错了。
两个方差的检验条件是要有两组数据,而这里我们只有一组数据,所以不能进行两个方差的检验。应用假设检验的方法,我们可以得出关于两个总体差异的相关结论。但有的时候我们要分析的是多个总体(三个以上的总体)之间的差异,就需要使用方差分析。同样的,我这里的数据也是只有一组数据,所以在方差分析中,我的数据毫无意义。但是在Excel使用“方差分析:单因素方差分析”分析工具扩展函数来完成单因素方差分析工作。最后也要使用“数据分析”来得出结果。当我们方差分析后进行相关与回归分析,相关分析是分析两个数值型变量联系的方法之一,它通过计算相关系数测定两个数值变量之间的线性相关强度。在这里,我们同样也要用到“数据分析”此外,我们还要构建线性回归模型,指数回归模型返回结果第一行代表斜率,第二行代表标准误差,第三行代表判决系数,第四行代表检验统计量值,第五行代表回归平方和。根据求出来的结果我们就能得到想要的答案。而时间序列分析主要是动态的分析,即GDP、产值等等的分析。当然我们也可以用时间序列来分析这十四位同学的月生活费情况,但是我们没有统计出他们每学期的生活费,所以在这里也就不能进行时间序列分析。通过上统计学实验我了解到统计没有像想象中那么困难,当我们把概念弄清楚后再来做这些统计工作后,就会发现不是那么枯燥无味,甚至还很有趣。所以,我们要不断练习,加强对excel的运用,做到孰能生巧,这样在以后做统计工作就会很有趣了。
(二)意见和建议1、2、大屏幕如果坐在后面基本上是看不清楚,有点影响听课的效率,希望老师能把字体放大些;
有些步骤老师做得太快,没有反映过来就进行下一个了,希望老师能让我们跟上节奏。