第一篇:管理统计学上机实验报告
学 院 专 业 年级班别 姓 名 指导教师
管理统计学实验报告
2015年12月
第3章
例3.1①实验题目
表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,四门课程成绩都大于70分的学生。
②实验步骤
图3-1 统计学成绩等于75分的学生.图3-2 英语成绩最高的前三名学生
图3-3 四门课程成绩都大于70分的学生
例3.2①实验题目
在某大学随机抽取30名学生,调查他们的性别、家庭所在地、平均月生活费支出、平均每月购买衣物支出和购买衣物时所考虑的首要因素等,得到的数据如下表。试建立一个数据透视表,在表的行变量中给出性别和买衣物首选因素,在列变量中给出学生的家庭所在地区,对平均月生活费和月平均衣物支出进行交叉汇总。
②实验步骤
图3-4 数据透视表
例3.3①实验题目
为研究不同类型软饮料的市场销售情况,一家调查公司对随机抽取的一家超市进行调查。表3-3是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录。生产频数分布表,观察饮料类型和顾客性别的分布状况,并进行描述性分析。
②实验步骤
图3-5 不同类型饮料和顾客性别的频数分布表
图3-6 饮料类型的条形图
图3-7 顾客性别的条形图
图3-8 饮料类型和顾客性别的复式条形图
图3-9 不同类型饮料的帕累托图
图3-10 不同类型饮料构成的饼图
图3-11 按性别绘制的不同类型饮料构成的复式饼图
例3.4①实验题目
表3-9是2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成。
②实验步骤
图3-12 北京、shanghai、天津地区收入法下生产总值构成的环形图
例3.5①实验题目
在一项有关城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”要求回答的类别依次如下:
1、非常不满意;
2、不满意;
3、一般;
4、满意;
5、非常满意。②实验步骤 图3-13 甲、乙城市家庭对住房状况评价的频数分布表及
甲城市家庭对住房状况评价的累积分布图
例3.6①实验题目
表3-12是某电脑公司2005年前4个月每天的销售量数据(单位:台)。试对数据进行分组。
②实验步骤
图3-14 某电脑公司销售量的频数分布表
(一)(二)
(三)例3.7①实验题目
从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表3-16所示。试绘制各科考试成绩的比较箱图,并分析各科考试成绩的分布特征。
②实验步骤
图3-15
例3.8①实验题目
已知1991-2003年我国城乡居民家庭的人均收入数据(单位:元),如表3-17所示。试绘制线图。
②实验步骤
图3-16 城乡居民家庭人均收入线图
例3.9①实验题目
小麦的单位面积产量与降雨量和温度等有一定关系。为了解它们 之间的关系形态,收集到如下数据。试绘制小麦产量与降雨量的散点图,并分析它们之间的关系。
②实验步骤
图3-17 小麦产量与降雨量的散点图
图3-18 小麦产量与降雨量和温度的气泡图
例3.10①实验题目
2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表所示。试绘制雷达图。②实验步骤
图3-19 2003年城乡居民家庭人均消费支出构成的雷达图
第5章
例5.16①实验题目
用Excel计算二项分布概率值
②实验步骤
例5.18①实验题目
用Excel计算泊松分布概率值
②实验步骤 5.4.2①实验题目
用Excel绘制标准正态分布概率密度函数曲线
②实验步骤
例5.22①实验题目
用Excel计算正态分布概率值
②实验步骤 例5.24①实验题目
用Excel绘制正态概率图进行数据正态性的评估
②实验步骤
第9章
例9.1①实验题目
用Excel计算P值
②实验步骤
第10章
表10-6①实验题目
用Excel进行单因素方差分析
②实验步骤
表10-10①实验题目
用Excel进行无重复双因素方差分析
②实验步骤 表10-15①实验题目
用Excel进行有交互作用的双因素方差分析
②实验步骤
第11章
例11.7①实验题目
数据分析-相关系数的计算应用
②实验步骤
例11.9①实验题目
用Excel进行回归分析
②实验步骤 例11.9①实验题目
用Excel进行残差分析
②实验步骤
不良贷款与贷款余额回归的残差图
练习题11.1①实验题目
书本课后练习题11.1
②实验步骤(1)产量与生产费用散点图:
从散点图可以看出,产量与生产费用之间为正线性相关关系。(2)产量与生产费用间的线性相关系数:R=0.920232。(3)略。
练习题11.5①实验题目
书本课后练习题11.5
②实验步骤(1)
从散点图可以看出,运送距离与运送时间之间为正线性相关关系。
(2)运送距离与运送时间之前的线性相关系数R=0.948943,R>0.8,表明运送距离与运送时间之间有较强的正线性相关关系。(3)SUMMARY OUTPUT回归统计Multiple R0.948943R Square0.900492Adjusted R Sq0.888054标准误差0.480023观测值10方差分析df回归分析残差总计SSMSFSignificance F116.6816216.6816272.395852.79E-0581.8433790.230422918.525Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept0.1181290.3551480.332620.74797-0.700840.937101-0.700840.937101X Variable 10.0035850.0004218.5085752.79E-050.0026130.0045570.0026130.004557 ˆx。得到的回归方程为:y0.1181290.003585
练习题11.7①实验题目
书本课后练习题11.7
②实验步骤(1)
从散点图可以看出,航班正点率与顾客投诉次数之间为负线性相关关系。(2)
ˆ430.18924.7x。回归系数表示航班正点率每增加1%,顾客计算得到的回归方程为:y投诉次数平均下降4.7次。
(3)回归系数检验的P-Value=0.001108<0.05),拒绝原假设,回归系数显著。
ˆ80430.18924.78054.1892(次)(4)y(5)略。
练习题11.10①实验题目
书本课后练习题11.10 ②实验步骤
ˆ13.62542.3029x;判定系数R93.74%,表明由上述结果可知:回归方程为y回归方程的拟合程度较高;估计标准误差se3.8092。
2练习题11.13①实验题目
书本课后练习题11.13 ②实验步骤
ˆ46.291815.23977x 得到的线性回归方程为:y
第12章
练习题12.4①实验题目
书本课后练习题12.4
②实验步骤
(1)
SUMMARY OUTPUT回归统计Multiple R0.807807R Square0.652553Adjusted R Sq0.594645标准误差1.215175观测值8方差分析df回归分析残差总计SSMSFSignificance F116.640116.640111.268810.01528868.8599031.476651725.5Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept88.637681.58236756.015882.17E-0984.7657792.5095984.7657792.50959X Variable 11.6038650.4777813.3569050.0152880.4347772.7729520.4347772.772952 得到估计的回归方程:
yˆ88.6376811.603865x1(2)
SUMMARY OUTPUT回归统计Multiple R0.958663R Square0.919036Adjusted R Sq0.88665标准误差0.642587观测值8方差分析df回归分析残差总计SSMSFSignificance F223.4354111.717728.377770.00186552.0645920.412918725.5P-value4.57E-080.0006530.009761Lower 95%Upper 95%下限 95.0%上限 95.0%79.1843387.2758579.1843387.275851.5085613.0718061.5085613.0718060.4765992.1253790.4765992.125379 Coefficients标准误差t StatIntercept83.230091.57386952.88248X Variable 12.2901840.3040657.531899X Variable 21.3009890.3207024.056697得到估计的回归方程:
yˆ83.2300922.290184x11.300989x2
(3)(4)(5)略。练习题12.6①实验题目
书本课后练习题12.6
②实验步骤
(1)
SUMMARY OUTPUT回归统计Multiple R0.947362R Square0.897496Adjusted R Sq0.878276标准误差791.6823观测值20方差分析df回归分析残差总计SSMSFSignificance F***3546.696973.88E-***760.91997831680P-value0.7990360.1310990.0013070.057088Lower 95%Upper 95%下限 95.0%上限 95.0%-1069.021366.419-1069.021366.419-0.270631.900105-0.270631.9001050.3733051.2686540.3733051.268654-0.004580.274665-0.004580.274665 Coefficients标准误差t StatIntercept148.7005574.42130.25887X Variable 10.8147380.5119891.591321X Variable 20.820980.2111773.887646X Variable 30.1350410.0658632.050322得到估计的回归方程:
yˆ148.7004540.814738x10.820980x20.135041x3
(2)(3)(4)略。练习题12.9①实验题目
书本课后练习题12.9
②实验步骤
(1)
销售价格y购进价格x1销售费用x2销售价格y1购进价格x10.3089521销售费用x20.0012141(3)
1-0.85285761(2)根据(1)中结果,用购进价格和销售费用来预测销售价格无用。SUMMARY OUTPUT回归统计Multiple R0.593684R Square0.35246Adjusted R Sq0.244537标准误差69.75121观测值15方差分析df回归分析残差总计SSMSFSignificance F231778.1515889.083.2658420.0737221258382.784865.2321490160.93t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Coefficients标准误差Intercept375.6018339.41061.106630.290145-363.911115.114-363.911115.114X Variable 10.5378410.2104472.5557110.02520.0793170.9963650.0793170.996365X Variable 21.4571940.6677072.1823860.0496810.0023862.9120010.0023862.912001 得到估计的回归方程:
yˆ375.6018290.537841x11.457194x2
F检验表明,y与x1、x2之间的线性关系不显著。
t检验表明,自变量x1、x2对因变量y的影响均显著。
(4)(5)略。
(6)模型中存在多重共线性。
问题与讨论
由于和书上使用的excel版本不一致,使用方法和步骤也不同。例如创建数据透视表时,就需要在网上搜索相应版本的使用方法。在一张excel表里不能存在两个数据透视表,使得数据处理不够方便。另外在数据分组时只能手动输入每一个分组,比较麻烦。第5章、第9章和第10章实验题目较为简单,没有出现什么问题。第11章、12章练习题通过excel计算能很有效率得出答案。
第二篇:上机实验报告
一. 题目1. 建立一个学生档案,内容包括学号,姓名,年龄,性别,数学,物理和英语3门功课成绩。要求实现以下功能:1)数据输入;2)查询某个学生的成绩;3)按平均排列输出;4)统计某门课各分数段人数;5)删除某个学生记录;2. 编程实现对二位数进行加,减,乘运算,每运行一次程序做10道题,完成后给出成绩(每题10分)。二. 设计思想和模块划分1.1.先定义所需要的条件,例如,姓名,学号,性别,三门功课的成绩,平均分等。2.输入姓名,学号,性别,年龄,三门功课的成绩后,就输出相应的姓名,学号,性别,年龄,三门功课的成绩。3.打印表头;4.在求出平均分,并打印出平均分。5.在查找学生,并打印出学生的相关资料;并按照平均分的高低排列;6.在统计学生各科成绩是否》=60分,如果是就是通过,否就是没通过,最后打印出最后的结果。7.删除学生,选中删除的学生,如果确定要,那么该学生的一切记录就变为0;2.1.随机调用函数,产生两个其值为10到99的随机整数分别放在c,d中用作运算时的运算数。2.随机调用函数,产生一个值为1到3 的随机整数放入b中,用来选择不同的运算。根据b的值选择不同的运算。当b=1时,去进行c+d的运算练习;当b=2 时,去进行c-d的运算练习;当b=3时,去进行c×d的运算练习。每完成一个算题就给出是否正确的信息。3.根据答案正确与否统计。正确时,显示’right’;错误时,显示’wrong’。4.步骤1.2.3.4.重复10次。5.输出学生成绩。三. 运行结果1.Input the 1 student :num:03name:wfage:18sex:fmath:98phy:75eng:65Input the 2 student :num:06name:scage:17sex:fmath:78phy:45eng:65Input the 3 student :num:09name:ytage:17sex:mmath:69phy:75eng:501.readin 2.finds 3.del 4.tj 5.exit1-----------------------------table----num name age sex math phy eng ave------3 wf 18 f 98.0 75.0 65.0 79.3------9 yt 17 m 69.0 75.0 50.0 64.7-------6 sc 17 f 78.0 45.0 65.0 62.7-------1.readin 2.finds 3.del 4.tj 5.exit2Into number:3---num name age sex math phy eng ave---3 wf 18 f 98.0 75.0 65.0 79.3----1.readin 2.finds 3.del 4.tj 5.exit3Into number:6---num name age sex math phy eng ave---6 sc 17 f 78.0 45.0 65.0 62.6---true? Y/Ny1----------------table------------------num name age sex math phy eng ave----3 wf 18 f 98.0 75.0 65.0 79.3-----9 yt 17 m 69.0 75.0 50.0 64.7-----0 0 0 f 0.0 0.0 0.0 0.0-----1.readin 2.finds 3.del 4.tj 5.exit4 1.input the math 2.input the phy 3.input the eng 1math: pass num is :3 no pass num is :02.32+82=114right!97*15=1455right!99-58=41right!76-66=10right!58+13=71right!37+49=86right!99+52=151right!49*69=5462wrong!73-38=31wrong!86+34=120right!mark is 80四. 主要错误改正方法1.在本题的编写过程中常出现begin 和end 不配对,只要始它们的个数相同就可以了,就可以了。在程序中常出现的’unknown identifier’没有定义的错误,只要在程序前加上定义,就可以了。还有就是type mismatch’的类型不匹配,只要根据前后内容,重新定义,就可以了。2.在本题编写中,题目要求是两个两位数运算,如果写成c:=random(100)在运行过程中,就会出现一位数运算,只要把它写成c:=random(90)+10,就可以了。五. 实习小结1.第一题的程序编写比较复杂,需要较多的定义,因而在后面的程序部分,就常出现标识符重复,而导致的类型不匹配。还有就是每个部分编好后,上下不能连接,而无法调用。2.第二题较第一题简单,和书上的例题类似,所以,比较简单,但从中也出现一些不问题。以上两大题中出现的问题,要在同学的帮助下,才能完成。总的来说两题程序比较困难六. 程序清单1.program twins;const m=3;n=3;typestudent=recordnum:integer;name:string[3];age:integer;sex:char;s:array[1..n] of real;math,eng,phy:real;ave:real;end;sarr=array[1..m] of student;ta=array [1..m] of student;f=string[6];varstu:sarr;ct:ta;k,d:integer;procedure readin(var stu:sarr);const wrong='0<=data<=100 ,again!';var j,i:integer;a:student;beginwriteln;writeln('Input ',m,' num name sex math phy eng',' of student.');for j:=1 to m dobeginwriteln;writeln('Input the ',j,' student :');with a dobeginwrite('num:');readln(num);write('name:');readln(name);write('age:');readln(age);write('sex:');readln(sex);while(sex<>'m')and(sex<>'f')dobeginwrite('sex:');readln(sex)end;for i:=1 to n do begincase i of1:begin write('math:');readln(s[i]);while(s[i]<0)or(s[i]>100)dobeginwriteln(wrong);write('math:');readln(s[i]);end;end;2:begin write('phy:');readln(s[i]);while(s[i]<0)or(s[i]>100)dobeginwriteln(wrong);write('phy:');readln(s[i]);end;end;3:begin write('eng:');readln(s[i]);while(s[i]<0)or(s[i]>100)dobeginwriteln(wrong);write('eng:');readln(s[i]);end;end;end;end;stu[j]:=a;end;writeln;end;end;procedure ave(var stu:sarr);var j,i:integer;k:real;beginfor j:=1 to m dobegink:=0;with stu[j] dobeginfor i:=1 to n do k:=k+s[i];ave:=k/nend;end;end;procedure px(var stu:sarr);var tm:ta;j,i,p:integer;beginfor j:=1 to m dobeginp:=j;for i:=j+1 to m doif stu[i].ave>stu[p].ave then p:=i;tm[1]:=stu[p];stu[p]:=stu[j];stu[j]:=tm[1];end;end;procedure head(ct:ta);var i:integer;beginwrite(' ');for i:=1 to 72 do write('-');writeln;write('',' num':4,' ','name':9,' ','age':8,' ','sex':5,' ','math':6,' ','phy':9,' ','eng':8,' ');writeln('ave':6,' ');write(' ');for i:=1 to 72 do write('-');writeln;with ct[1] dobeginwrite('',num:7,' ',name:8,' ',age:8,' ',sex:5,' ');for i:=1 to n do write(s[i]:7,' ');write(ave:10,' ');writeln;end;write(' ');for i:=1 to 72 do write('-');writeln;end;procedure find(var stu:sarr);var n,i:integer;u:boolean;beginu:=true;while u dobeginwrite('Into number:');readln(n);for i:=1 to m dobeginif stu[i].num=n then beginct[1]:=stu[i];u:=false;d:=iend;end;end;end;procedure del(var stu:sarr);var i:integer;b:char;beginhead(ct);write('true? Y/N');readln(b);if b='y' then begin write('1');with stu[d] dobeginnum:=0;name:='0';age:=0;sex:='f';for i:=1 to n do s[i]:=0;ave:=0end;endelseend;procedure tj(var stu:sarr);var w1,q1,q2,num,j:integer;h1,h2,h3:boolean;beginh1:=false;h2:=false;h3:=false;q1:=0;q2:=0;writeln(' ':30,'1.input the math 2.input the phy 3.input the eng ');readln(w1);case w1 of1:h1:=true;2:h2:=true;3:h3:=true;end;if h1 thenbeginbeginfor j:=1 to m dowith stu[j] doif stu[j].math>=60 thenq1:=q1+1elseq2:=q2+1;writeln('math:');end;if h2 thenbeginbeginfor j:=1 to m dowith stu[j] doif stu[j].phy>=60 thenq1:=q1+1elseq2:=q2+1;writeln('phy:');end;if h3 thenbeginbeginfor j:=1 to m dowith stu[j] doif stu[j].eng>=60 thenq1:=q1+1elseq2:=q2+1;writeln('eng:');end;end;end;end;writeln(' ':5,'pass num is :',q1);writeln(' ':5,'no pass num is :',q2);end;procedure head1(var stu:sarr);var j,i:integer;beginwriteln('----------------table--------------':60);writeln;write(' ');for i:=1 to 72 do write('-');writeln;write('',' num':4,' ','name':9,' ','age':8,' ','sex':5,' ','math':6,' ','phy':9,' ','eng':8,' ');writeln('ave':6,' ');write(' ');for i:=1 to 72 do write('-');writeln;for j:=1 to m do beginwith stu[j] dobeginwrite('',num:7,' ',name:8,' ',age:8,' ',sex:5,' ');for i:=1 to n do write(s[i]:7:1,' ');write(ave:10:1,' ');writeln;end;write(' ');for i:=1 to 72 do write('-');writeln;end;end;beginreadin(stu);ave(stu);k:=0;while k<>5 dobeginwriteln('1.readin 2.finds 3.del 4.tj 5.exit');read(k);readln;while(k<>1)and(k<>2)and(k<>3)and(k<>4)and(k<>5)dobeginwriteln(' mistake,please again');read(k)end;case k of1: begin px(stu);head1(stu)end;2: begin find(stu);head(ct)end;3: begin find(stu);del(stu);px(stu);head1(stu)end;4: begin tj(stu);end;5: writeln('exit!');end;end;end..2.program shadow;var a,b,c,d,e:integer;right:boolean;procedure s1;beginwriteln('right!');right:=trueend;procedure s2;beginwriteln('wrong!');right:=falseend;procedure s3(x,y:integer);var h:integer;beginwrite(x,'+',y,'=');readln(h);if h=x+y then s1else s2 end;procedure s4(x,y:integer);var h,w:integer;beginif x 应用统计学实验报告 武汉工大学 管理学院 应用统计学 课程实验(上机)报告专业班级:2010级工商管理01班 学 号: 指导老师:夏剑锋 实验(上机)地点:活动中心 学期:2012—2013第二学期 第 1 页;共 23页 应用统计学实验报告 实验(上机)日期:2013年4月25日 第1 次 实验(上机)主题:统计软件的运用 实验(上机)类别):验证性 完成方式:独立 实验(上机)目的与要求: 1、掌握启动和退出统计软件 2、掌握数据库的建立 3、搜集一些数据并建立数据库 4、进行一些统计计算(函数、描述性统计) 5、制作统计图 6、计算各种统计指标 实验(上机)内容及方法 一、基本操作 1.在EXCEL图标双击,打开工作表。 2.在“文件”菜单下,选择“新建”,在右边“新建工作簿”选择“空白工作簿”。 3.单击页面右上角红色关闭按钮,关闭工作表,并退出软件。如提醒“是否保存”则选择保存,或者选择取消在查看后在退出。 二、描述性统计 1.在数据表窗口输入数据如下: 59 78 86 94 81 76 69 表1-1某学科成绩表 78 94 49 76 89 95 83 58 76 66 81 68 78 76 93 68 63 69 78 2.单击保存,在文件名称中输入“成绩文件” 第 2 页;共 23页 应用统计学实验报告 3.加载数据分析工具:在“工具”下拉菜单下找到“加载宏”,单击,选择“数据分析工具”点击确认。 图1-1 加载分析工具库 4.再在工具下拉菜单下找到“数据分析”选项。 图1-2 打开数据分析 第 3 页;共 23页 应用统计学实验报告 5.单击“数据分析”,选择“描述性统计” 图1-3开始描述性统计 6.数据复选框如下,单击确定,图1-4描述性统计选项卡 7.显示结果如下: 平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 表1-2 描述性指标显示结果 77.91667 区域 1.972982 最小值 78 最大值 76 求和 11.83789 观测数 140.1357 最大(1)-0.24247 最小(1)-0.19707 置信度(95.0%) 第 4 页;共 23页 2805 36 98 49 4.005367 应用统计学实验报告 三、函数计算: 1、简单函数运算: 1)将鼠标定位在单元格,进入编写模式,输入函数:“=A1*A1”,点击回车键,在哦单元格内出现运算结果。把鼠标移到单元个右下角,直到出现“十字”按住鼠标右键往下拉,则将运算复制。显示结果如下: 图1-4 函数输入 2)插入函数:(用函数求和) 3)单击输入框中的函数输入符号,点击确定(如下图),计算书刚刚输入成绩的总和为:2805 图1-5 插入函数选项卡 按照同样的方法可以选择其他函数形式进行统计统计运算。 第 5 页;共 23页 应用统计学实验报告 2、制作统计图: 1)直方图: 在表格上输入分组方式: 表1-3 分组方式 99 在工具菜单下找到数据分析,单击,并在对话框中选择“直方图”,单击“确定” 图1-6 直方图操作选项 图1-7 直方图复选框 第 6 页;共 23页 应用统计学实验报告 统计结果如下: 表1-4 频率分析表 分数 99 其他 频率 8 11 7 7 0 直方图***989分数99其他 图1-8 成绩分析直方图 频率频率 如果在复选框中选择“柏拉图”和“表格输出”,显示结果如下: 直方图***99959其他接收 图1-9 带累计频率的直方图 150.00%100.00%50.00%0.00%频率累积 %2)饼形图: 在“插入”菜单下,选择“图表”,在对话框中选择“饼形图” 频率第 7 页;共 23页 应用统计学实验报告 图1-10 饼形图选择框 根据向导输入数据,分别选择。最终统计图表如下: 成绩分析饼形图90-9919%其他0-590%8%60-6922%80-8919%70-7932%0-5960-6970-7980-8990-99其他 图1-11 成绩分析饼形图 第 8 页;共 23页 应用统计学实验报告 上机总结: 1、通过本次上机,巩固了excel的基本操作,让操作更加流畅。 2、进一步了解了函数的使用,能够熟练的掌握基本的统计量的运算。 3、通过实验的学习和比较,进一步加深了对统计量意义的学习。 实验(上机)成绩:第 9 页;共 23页 评阅老师: 评阅时间: 应用统计学实验报告 实验(上机)日期: 2013年5月9日 第 2 次 实验(上机)主题:假设检验与方差分析 实验(上机)类别):验证性 完成方式:独立 实验(上机)目的与要求: 1、建数据库:(1)假设检验(双样本数据)(2)方差分析:单因素方差分析和双因素方差分析 2、掌握假设检验的计算与分析 3、掌握方差分析的计算与分析 4、输出计算结果并进行分析 5、进行检验和决策 实验上机内容及方法 一、单因素分析 1.检验数据: 表2-1 三种训练方法下工人的日产量 方法1 方法2 方法3 22 18 18 27 24 人均日产量 18 16 21 22 11 17 15 2.将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认” 图2-1 分析工具选择 第 10 页;共 23页 应用统计学实验报告 3.在数据复选框内选择数据如下; 图2-2 单因素分析复选框 结果输出: 表2-2 单因素分析结果 组 行 1 行 2 行 3 方差分析 差异源 组间 组内 总计 观测数 5 5 5 SS 40 192 232 求和 85 105 95 df 2 12 14 平均 17 21 19 MS 20 16 方差 17.5 15.5 15 F 1.25 P-value 0.321277 F crit 3.885294 分析:F crit=3.885294;F=1.25 因为F=1.25<F crit=3.885294,所以拒绝训练方法对日产量有显著影响,即三种训练方法对日产量没有显著影响。 二、双因素分析(无交互作用)实验数据 表2-3 4个工人和3台机器配合的日产量 A1 A2 A3 B1 50 63 52 B2 47 54 42 第 11 页;共 23页 B3 47 57 41 B4 53 58 48 应用统计学实验报告 将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认” 图2-3 无交互作用双因素分析选项 在数据复选框内选择数据如下; 图2-4 无交互作用双因素分析复选框 分析结果输出: 表2-4方差分析:无重复双因素分析 SUMMARY 行 1 行 2 行 3 列 1 列 2 列 3 列 4 方差分析 观测数 4 4 3 3 3 求和 197 232 183 165 143 145 159 平均 49.25 58 45.75 55 47.66667 48.33333 方差 8.25 14 26.91667 36.33333 65.33333 显著性水平:1% 第 12 页;共 23页 应用统计学实验报告 差异源 行 列 误差 总计 SS 318.5 114.6667 32.83333 df 2 3 6 MS F P-value F crit 159.25 29.10152 0.000816 10.92477 38.22222 6.984772 0.022015 9.779538 5.472222 466 11 MS F P-value F crit 方差分析:无重复双因素分析 方差分析 显著性水平:5% 差异源 行 列 误差 总计 SS 318.5 114.6667 32.83333 df 2 3 6 159.25 29.10152 0.000816 5.143253 38.22222 6.984772 0.022015 4.757063 5.472222 466 11 分析: 行因素:在显著性水平为1%的时候,F crit=10.92477,在显著性水平为5%时,F crit=5.143253,都远小于F =29.10152。即不同牌号机器上的日产量有高度显著性差别。 列因素:在显著性水平为1%的时候,F crit=9.779538,在显著性水平为5%时,F crit=4.757063,F=6.984772。因为4.757063<6.984772<9.779538。则不同工人的日产量只有显著的差别。 三、双因素分析(有交互作用)实验数据 表2-5 灯泡寿命数据 因 子 B B1 B2 B3 A1 13.2 15 16.1 17.3 18 17 因子A A2 A3 14.4 14 15.6 13.6 13.7 16.3 14.3 17.1 14.5 17.1 15.7 16.1 第 13 页;共 23页 应用统计学实验报告 将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认” 图2-5 有交互作用双因素分析 在数据复选框内选择数据如下; 图2-6 有交互作用双因素分析复选框 分析结果输出: 表2-5方差分析:可重复双因素分析 观测数 求和平均 方差 28.2 14.1 1.62 15 0.72 27.6 13.8 0.08 85.8 14.3 0.796 第 14 页;共 23页 应用统计学实验报告 观测数 求和平均 方差 观测数 求和平均 方差 总计 观测数 求和平均 方差 方差分析 差异源 样本 列 交互 内部 总计 2 33.4 28 16.7 14 0.72 0.18 2 35 30.2 17.5 15.1 0.5 0.72 96.6 16.1 3.096 88.2 14.7 0.62 33.4 16.7 0.32 33.2 16.6 0.5 94.2 15.7 2.348 94.8 15.8 2.188 98.4 16.4 1.52 P-value F crit 显著性水平为5% SS 14.04 6.24 10.92 5.36 36.56 df MS F 7.02 11.78731 0.003063 4.256495 2 3.12 5.238806 0.030987 4.256495 4 2.73 4.583955 0.027093 3.633089 9 0.595556 方差分析 差异源 样本 列 交互 内部 总计 显著性水平为:1% SS df MS 14.04 2 7.02 6.24 2 3.12 10.92 4 2.73 5.36 9 0.595556 36.56 17 F 11.78731 5.238806 4.583955 P-value 0.003063 0.030987 0.027093 F crit 8.021517 8.021517 6.422085 分析: 1、因子A(工艺方法)分析:在显著性水平为1%的时候,F crit=8.021517,在显著性水平为5%时,F crit=4.256495,F =6.24,因为4.256495<6.24<8.021517,则工艺方法对灯泡寿命的影响是显著的。 2、因子B(灯丝配方)分析:在显著性水平为1%的时候,F crit=8.021517,在显著性水平为5%时,F crit=4.256495,F =11.78731,因为8.021517<11.78731,则灯丝配方对灯泡的寿命影响是高度显著的。 第 15 页;共 23页 应用统计学实验报告 3、交互作用分析:在显著性水平为1%的时候,F crit=6.422085,在显著性水平为5%时,F crit=3.633089,F =4.583955,因为3.633089<4.583955<6.422085。则工艺和菲方之间存在交互作用。 实验上机总结: 1、学会如何让运用软件进行方差计算和分析; 2、通过提出假设,了解如何通过计算数据进行显著性判断和检验; 3、根据假设和检验结果,明白如何进行判断。 实验上机成绩: 评阅老师: 评阅时间: 第 16 页;共 23页 应用统计学实验报告 实验(上机)日期:2013年5月16 第 3 次 实验(上机)主题:回归分析 实验(上机)类别):验证性 完成方式:独立 实验(上机)目的与要求: 1、搜集数据并建数据库 2、掌握一元线性回归的计算与分析 3、掌握多元线性回归的计算与分析 4、输出计算结果并进行分析 5、进行检验和预测 实验上机的内容及方法 一,一元线性回归 数据显示如下: (表3-1十个企业的生产费用与产量数据) 企业编号 1 2 3 4 5 6 7 8 9 10 产量X(千克)40 42 48 55 65 79 88 100 120 140 生产费用Y(千元)150 140 160 170 150 162 185 165 190 185 将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。在复选框中选择如下: (图3-1一元回归分析复选框) 第 17 页;共 23页 应用统计学实验报告 则显示相关数据处理结果如下: 表3-2 回归统计表 Multiple R R Square Adjusted R quare 标准误差 观测值 表3-3 方差分析表 0.807766 0.652486 0.609047 10.5332 回归分析 残差 总计 df SS MS F Significance F 1666.514 1666.514 15.02064 0.004704 8 887.586 110.9483 2554.1 表3-4 回归分析表 Intercept X Variable 1 Coefficients 标准误差 t Stat Lower Upper 95% 95% 134.7893 8.643234 15.59477 2.85E-07 114.8579 154.7206 0.397821 0.102646 3.875647 0.004704 0.161118 0.634525 P-value 得到散点图和拟合分析图如下: Normal Probability Plot20010000204060Sample Percentile图3-2 散点图 Y80100 X Variable 1 Line Fit Plot***0X Variable 1图3-3 拟合分析图 Y预测 Y150Y 第 18 页;共 23页 应用统计学实验报告 相关分析: 1、回归方程 由散点图得知回归方程为一元线性方程。得到回归方程如下: Y=134.7893+0.397821X 2、显著性分析 得到Multiple R=0.807766>0.765(在检验数为0.01时相关系数检验数)表示回归方程显著。 t Stat=3.875647>2.306(α=0.05,自由度=8时t值)则统计检验结果显著。其存在良好的线性关系。 F=15.02064>5.32(在α=0.05,n1=1,n2=8时F值),表示回归结显著。 3、相关预测 在产量为80千件时,平均生产费用的置信区间(α=0.05)生产费用预测Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*0.317=166.614-7.707=158.844 下界=166.614+7.707=174.321 即总体均值得95%置信区间为(158.844,174.321) 在产量为80千件时,生产费用的置信区间(α=0.05)生产费用预测Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*1.049=166.614-25.503=140.637 下界=166.614+25.503=191.643 即总体得95%置信区间为(140.637,191.643) 二,多元回归 试验数据: 表3-5 某企业10个月的月管理费用与工人劳动日数和机器开工台数的资料 管理费用Y 工人劳动日数X1 29 45 24 42 27 44 25 45 26 43 28 46 30 44 28 45 28 44 27 43 第 19 页;共 23页 应用统计学实验报告 机器开工台数X2 14 15 13 13 14 16 16 15 15 将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。在复选框中选择如下: 图3-4 多元回归复选框 则显示相关数据处理结果如下: 表3-5 回归统计表 回归统计 Multiple R 0.85377 R Square 0.728923 Adjusted R 0.651473 Square 标准误差 1.070639 观测值 10 表3-6 方差分析表 回归分析 残差 总计 df SS MS F Significance F 2 21.57613 10.78806 9.411471 0.010371 7 8.023873 1.146268 29.6 表3-7 回归分析表 Coefficients 标准误差 t Stat 第 20 页;共 23页 P-value 下限 上限 应用统计学实验报告 Intercept X Variable 1 X Variable 2 95.0% 95.0% -13.8196 13.3233-1.03725 0.334115-45.3242 17.68497 0.56366 0.303274 1.858586 0.10543-0.15347 1.280789 1.099469 0.313139 3.511123 0.009844 0.359013 1.839926 得到散点图和拟合分析图如下: Normal Probability Plot402000204060Sample Percentile图3-5 散点图 Y80100 X Variable 1 Line Fit Plot***X Variable 1图3-6 拟合分析图 Y预测 Y4647Y 相关分析: 1、回归方程 由散点图得知回归方程为二元线性方程。得到回归方程如下: Y=-13.8196+ 0.56366X1+ 1.099469X2 2、回归方程检验 R Square= 0.728923>0.6516 第 21 页;共 23页 应用统计学实验报告 F= 9.411471>4.74(α=0.05,自由度=2,7时,F值)即:回归方程的拟合程度很好。 3、回归系数: t 1= 1.858586<2.365(α=0.05,自由度=7时,t值)t2= 3.511123>2.365(α=0.05,自由度=7时,t值) 所以β1不显著,β2显著。即工人劳动日数对管理费用的影响并不是显著;机器开工台数对管理费用影响显著。 4、相关系数分析: 表3-8相关系数分析表 Y X1 X2 Y X1 X2 0.501517 1 0.771462 0.184094 则得到Y与X1之间的相关系数为0.501517;Y与X2之间的相关系数为0.771462,X1与X2之间的相关系数为0.184094 计算相应的偏回归系数Y与X1之间的偏相关系数为0.5748;Y与X2之间的相关系数为0.7987。 又t1= 0.5748*√7/√(1-0.5748*0.5748)=1.86<2.356(α=0.05,自由度=7时,t值) T2=0.7987*√7/√(1-0.7987*0.7987)=3.51>2.356(α=0.05,自由度=7时,t值) 即:工人劳动日数与管理费用之间的偏相关系数不显著;机器开工台数与管理费用之间的偏相关系数是显著的。 第 22 页;共 23页 应用统计学实验报告 实验上机总结: 1、学会如何让运用软件进行一元与二元方程回归分析的计算; 2、通过提出假设,了解如何通过计算数据进行系数显著性判断和检验;并对方程的拟合优度和相关性进行判断 3、根据回归结果很好的预测,并在给出置信度的情况下对总体均值和个体值进行预测。 实验上机成绩: 评阅老师: 评阅时间: 第 23 页;共 23页 统计学实验报告 姓名: 学号: 班级: 成绩: 一、实验步骤总结 成绩: (一)数据的搜集与整理 第一种方式是输入网站,第二种方式是通过网络获取二手数据使用搜索引擎。第一步,将数据录入到Microsoft Excel工作表中。 第二步,选中需要筛选的区域,使用“数据—筛选—自动筛选”菜单通过每列第一个单元格右下角的下拉箭头来选择实现筛选。 (二)描述数据的图标方法 对数值型数据是做出频数频率表,我们用frequency函数来获取频数频率。第一步:将数据输入到Microsoft Excel里的单元格,在单元格输入数据; 第二步:激活单元格,点击函数调用卡片打开“插入函数”对话框,从选择类别下拉框中选“统计”,在选择函数框中选择frequency函数; 第三步:点击“插入函数”对话框确定按钮进入“函数参数”对话框。Data_array选中第一列项单元格;Bins_array选中第二列项单元格; 第四步:使用组合键“ctrl+shift+enter”得到频数结果; 第五步:对结果进行修饰,加入分组标志及其值,再加入频数的具体名称,并且计算频率。 2用直方图来表示 第一步,将数据输入到表里的单元格; 第二步,使用“工具—数据分析”菜单,打开“数据分析”对话框,选择“直方图”; 第三步,单击确定按钮,进入“直方图”分析工具库对话框。 第四步,单击确定按钮,得到直方图分析工具扩展函数的返回结果。第五步,对结果进行修饰。 (三)数值型描述度量 1、在Excel中用Average来计算平均数。直接点函数f(x)中的常用函数Average,然后选中区域就可以计算。还有一种方法是先激活单元格,然后输入公式“=average(A1:E10)” 2、在Excel中使用Geomean来计算几何平均数。用函数f(x)中的Geomean,然后选中区域计算结果。也可以激活单元格,输入公式。 3、在Excel中使用Harmean函数计算调和平均数,同样也是先激活单元格,然后使用函数Harmean,就可以计算出结果。也可以激活单元格,直接用公式。 (四)参数估计 1、抽样 第一步,使用“工具-数据分析”菜单打开“数据分析”对话框,选择抽样。第二步,在输入区域里选择区域,然后点随机,再选择输出区域,点确定 2、区间估计 第一步,选中单元格,并使用“插入-名称-指定”菜单,打开“指定名称”对话框,选择“首行”复选框,对数据命名; 第二步,构建函数表单框架; 第三步,输入框架下对应的数据和函数公式。函数表单中涉及到有样本个数、样本均值、总体标准差、置信水平、抽样标准差、置信区间半径、置信区间下限和上限等等内容。 (五)假设检验 首先构建函数表单,然后进行假设检验。假设检验中求P值要经过五个步骤: 1、写出原假设HO及备择假设H1; 2、选择显著性系数水平α及样本容量n; 3、确定合适的检验统计量及抽样分布; 4、搜集样本数据计算样本统计值和P值; 5、给出统计学意义上的结论和经济管理学意义上的结论。 2、双样本方差分析分析工具扩展函数来完成两个方差的F检验。 第一步,使用“工具-数据分析”菜单,打开数据分析对话框,选择“F-检验:双样本分析”分析工具,点击确定按钮打开 第二步,选择区域 第三步,点击确定按钮,返回分析结果。 (六)方差分析 第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“方差分析:单因素方差分析”分析工具,点击确定按钮打开对话框。 第二步,输入区域点击右侧箭头,选择单元格; 第三步,点击“方差分析:单因素方差分析”对话框确定按钮,返回结果。对无重复双因素方差分析,也要用分析工具的数据分析来完成。 第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“方差分析:无重复双因素方差分析”分析工具; 第二步,输入区域点击右侧箭头,选择单元格; 第三步,点击确定,返回结果。 (七)相关与回归分析 第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“相关系数”分析工具,点击确定; 第二步,在相关系数对话框中,点击输入区域右侧的箭头,选择单元格,数据按列录入,所以选中分组方式中的“列”单选框;点击输出区域右侧的箭头,选择一个下侧和右侧没有数据的单元格; 第三步,点击相关系数对话框中的确定按钮返回结果。 构建线性回归模型Y=a+bX1和二元一次线性回归模型Y=a+bX1+cX2.第一步,使用“工具-数据分析”菜单打开数据分析对话框,选择“回归”分析工具,点击确定。 第二步,点击“回归”对话框的确定按钮,返回结果。 (八)时间序列分析 第一步,激活单元格,输入公式“=B3-B2”,回车返回想算出的逐期增长量; 第二步,再次激活输入公式的单元格,使用拖拉权柄,点击鼠标左键,向下拖动拖拉权柄至最后一个单元格,就能依次获得逐期增长量。 累计增长量、平均增长量、环比发展速度、定基发展速度也是如此做。 季节变动分析的第一步,计算时间序列的长期趋势;第二步,利用乘法模型,将时间序列的观察值除以对应的长期趋势值,得到季节因素引起的变动分值;第三步,将数据汇总在同一列上;第四步,求出每一季的变动分量值的平均值;第五步,计算季节调整系数;第六步,计算季节比率。 二、实验心得报告 成绩: (一)心得体会 统计学,在我看来无非就是统计数据嘛,对于我来说统计数据应该不是什么难题。后来学了统计学,才知道并不是那么简单的事情。统计数据的确是统计学中很重要的一项工作,但并不是登记几个数字就了事的。我们除了记录数据,还要对数据进行整理和分析,从而得出有意义的结论。在上第一节实验课的时候,老师给我们讲了怎样进行数据的搜集与整理,比如我们要搜集全国人口普查的调查数据,可以进入网址http://www.xiexiebang.com/,点击其中的数据目录,然后点统计数据,选择数据,再选人口数据就行了。 除了上述的对数据的搜集可以直接进入网站以外,在实验课上我还得知可以用搜索引擎来得到数据。比如,我们可以使用百度网站,搜索四川省2010年国民经济数据,如下图 而直接数据的搜集可以通过三种途径:科学实验、观察研究或者直接调查。我们生活中用得最多的就是直接调查,可以通过抽样调查来取得直接数据。对数据的搜集对我们来说不是很难,除非我们自己去做一份调查。而对搜集来的数据我们要进行整理,这就需要借助办公软件工具来帮我们了,主要是学Excel的使用,它是统计学中一项很重要的工具。 比如,已经知道某班十四位同学的月生活费数据:其中男生:1100、600、1000、800、700、750、850;女生:900、1000、600、500、650、950、1100,希望得到500~700,700~900,900~1100。当我把数据搜集与整理好了以后,我们就需要描述数据。在实验课中,我们用Excel来对数据描述。就拿我搜集到的数据来说明这十四位学生月生活费的情况,通过下图就可以很直观的看出信息。 这些都只是简单的描述方法,在后面的几节实验课中,我才觉得用Excel来进行一系列的数值型描述、参数估计、假设检验、方差分析等等是比较难的。统计实验课和上课是紧密相联的,课上所学的知识全在实验课上运用了。我的感觉是,实验课就是统计学知识的浓缩和精华,这只是我的理解。当我们在进行数值型描述时,我们就要记下表示集中趋势度量的有哪些函数,表示离散程度度量的函数又有哪些?比如用Average来计算平均数,用Geomean来计算几何平均数,用Harmean函数计算调和平均数等等。将这十四位同学的月生活费支出情况输入到Excel中,然后计算他们的算术平均数、几何平均数、调和平均数、中位数、众数等等。我们可以从这些计算出来的数据中分析结果,从而更了解大学生每月生活费的开支情况,可以通过他们的月生活费来推断。 在Excel中有一项很重要的工具那就是“数据分析”,在后面的几个实验里几乎每个实验都会用到“数据分析”这个工具。对上面的这些函数我们也可以用“数据分析”来得出结果。 我们会发现,这些分析出来的结果和我们自己用公式算出来的结果是完全一致的,那就证明了我们自己算出来的结果是没有错的。使用数据分析更快捷方便,可以大大节省我们的时间。在接下来的参数估计中,我们就要记很多函数表达式,抽样是由下至右,由左至右而且只能对一个变量进行抽样,并可重复抽样的简单随机抽样。对于这些过程都要用到“工具—数据分析”这项工具。这十四位同学的月生活费已经是抽样出来的,所以我们没有必要还从这十四位同学中再次去抽样,那样是没有意义的。 而区间估计的实验就是要通过软件,实现一定置信度水平下的置信区间反映结果。Excel没有提供专门的分析工具库扩展函数来分析各种情况下的参数区间估计结果,所以我们只能使用函数或者函数表单来实现实验目标。从我所收集到的样本数据来看,这十四位同学的月生活费是属于小样本数据,这样,我们就可以用小样本抽样以样本均值推断总体均值。从而我们就要进行构建函数表单。函数表单是一种利用函数和命名组合形成的可以反复使用的电子表格,也是进行参数区间估计的主要方法。 前面的“样本个数”这些名称是要自己输入的,这就是所谓的构建函数表单的方法。构建函数表单使我们更清晰的看到我们统计数据的结果是怎样,也很容易地根据函数表单下结论。从使用“工具-数据分析”我们可以清晰的看出这十四个数据所代表的含义,从而推断出大学生每月生活费到底是一种什么趋势,他们读完大学所用的生活费总共是多少呢等等一系列的问题。当然,小样本是不能很正确的说明这些情况,那就需要大样本来说明,由于我的数据只有14个,大样本要求的是30个以上,所以在这里就用不上大样本来分析数据了。 那么函数表单构建的基本思路是首先确定需要进行假设检验的总体参数,其次确定抽样样本统计量及其服从的分布,然后进行假设设计。在运行扩展函数的时候会计算到P值,P值通常被认为是观察到的显著性水平,是在给定的原假设正确的情况下,统计量等于或超过有样本计算出来的统计量的值的概率。它是原假设能被接受的最小概率水平。如果P值大于等于α,接受原假设;如果P值小于α,则拒绝原假设。这里我们假设这十四位同学的月生活费平均为900,则原假设就是总体均值等于900,备择假设就是总体均值不等于900。通过构建函数表单,然后运用公式来计算出结果,使我们省去了自己动手去计算的过程从而节约了我们的时间,提高了统计效率,而得到的分析结果也是准确的,除非是自己输入公式输错了。 两个方差的检验条件是要有两组数据,而这里我们只有一组数据,所以不能进行两个方差的检验。应用假设检验的方法,我们可以得出关于两个总体差异的相关结论。但有的时候我们要分析的是多个总体(三个以上的总体)之间的差异,就需要使用方差分析。同样的,我这里的数据也是只有一组数据,所以在方差分析中,我的数据毫无意义。但是在Excel使用“方差分析:单因素方差分析”分析工具扩展函数来完成单因素方差分析工作。最后也要使用“数据分析”来得出结果。当我们方差分析后进行相关与回归分析,相关分析是分析两个数值型变量联系的方法之一,它通过计算相关系数测定两个数值变量之间的线性相关强度。在这里,我们同样也要用到“数据分析”此外,我们还要构建线性回归模型,指数回归模型返回结果第一行代表斜率,第二行代表标准误差,第三行代表判决系数,第四行代表检验统计量值,第五行代表回归平方和。根据求出来的结果我们就能得到想要的答案。而时间序列分析主要是动态的分析,即GDP、产值等等的分析。当然我们也可以用时间序列来分析这十四位同学的月生活费情况,但是我们没有统计出他们每学期的生活费,所以在这里也就不能进行时间序列分析。通过上统计学实验我了解到统计没有像想象中那么困难,当我们把概念弄清楚后再来做这些统计工作后,就会发现不是那么枯燥无味,甚至还很有趣。所以,我们要不断练习,加强对excel的运用,做到孰能生巧,这样在以后做统计工作就会很有趣了。 (二)意见和建议1、2、大屏幕如果坐在后面基本上是看不清楚,有点影响听课的效率,希望老师能把字体放大些; 有些步骤老师做得太快,没有反映过来就进行下一个了,希望老师能让我们跟上节奏。 统计学实验报告 一、实验步骤总结 (一)数据的搜集与整理 1.实验一:数据的收集与整理 实验步骤: 一、统计数据的整理 (一)数据的预处理 1、数据的编码及录入(1)数据的编码(2)数据的录入 2、数据的审核与筛选 3、数据的排序 (二)数据的整理 对数据进行整理的主要方式是统计分组,并形成频数分布。既可以使用函数FREQUENCE进行统计分组,也可以借助直方图工具进行统计分组。 二、统计数据的描述 (一)运用函数法进行统计描述 常用的统计函数 函数名称 函数功能 Average 计算指定序列算数平均数 Geomean 计算数据区域的几何平均数 Harmean 计算数据区域的调和平均数 Median 计算给定数据集合的中位数 Mode 计算给定数据集合的众数 Max 计算最大值 Min 计算最小值 Quartile 计算四分位点 Stdev 计算样本的标准差 Stdevp 计算总体的标准差 Var 计算样本的方差 Varp 计算总体的方差 在Excel中有一组求标准差的函数,一个是求样本标准差的函数Stdev,另一个是求总体标准差的函数Stdevp。Stdev与Stdevp的不同是:其根号下的分式的分母不是N,而是N-1。此外,还有两个对包含逻辑值和字符串的数列样本标准差和总体标准差的函数,分别是Stdeva和Stdevpa。 (二)运用“描述统计”工具进行数据描述 “描述统计”工具可以生成以下统计指标,按从上到下的顺序为:平均值、标准误差、中位数、众数、样本标准差、样本方差、峰度值、偏度值、级差、最小值、最大值、样本总和、样本个数和一定显著水平下总体均值的置信区间。 三、长期趋势和季节变动测定 (一)直线趋势的测定 1、移动平均法测定直线趋势 2、最小二乘法测定直线趋势 (二)曲线趋势的测定 (三)季节变动测定 1、月(季)平均法 2、移动平均趋势剔除法测地归纳季节变动 实验数据: 2.实验二: 实验步骤:描述数据的图表方法 (1)熟练掌握Excel 2003的统计制表功能(2)熟练掌握Excel 2003的统计制图功能 (3)掌握各种统计图、表的功能,并能准确的根据不同对象的特点加以应用 实验数据: 二、实验心得报告 成绩: (一)心得体会 16个课时的课以来,在老师的帮助下,我进行了系统的统计学操作实验,加深了对统计学各方面只是以及对EXCEL操作软件的应用了解,同时能更好的把实践与理论相结合。 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。另外,观察者以数据的形态简历一个用以解释器随即行和不确定性的数学模型,一只来推论研究中的步骤及字母。 统计学一腿短为特征的方法论科学,由部分推及整体的思想贯穿于统计学的始终。具体的说,他是研究如何搜集、整理、分析反应事物总体信息的数字资料,并以此为数据,对总体特征进行推断的原理和方法。用统计来认识事物的步骤是:研究设计到抽样调查 到统计推断到结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查时搜集资料的过程,统计推断哈斯分析资料的过程。显然统计的主要功能是推断,二推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。增加定义:是关于收集,整理。分析和解释统计数据的科学,是一门认识方法论性质的科学,起目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。统计学是收集分析表述和解释数据的科学。 实验过程中,遭确认excel安装设置成功的前提下,首先进行的就是对统计数据的输入与分析。这个输入过程并不轻松,既要细心有药用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配输入数据。因袭,输入正确的数据也就成了整个统计学实验的基础。 数据输入就是统计数据的描述与分析,这是整个统计实验关键中的关键,对统计数据的众数,中位数,均值的描述可以让我们队其有一个初步的印象和大体的了解,在此基础上的概率分析,抽样分析,方差分析,回归问题以及时间序列分析等则更具体和深刻的向我们解释了统计数据的内在规律性。在对数据进行描述和分析过程中,excel软件的数据处理功能得到了极大地发挥,工具栏中的工具和数据功能对数据的处理时问题解决起来时事半功倍。 这次为期不长的统计学实验课是我大学生活中不可或缺的重要经历,它对我的学习以及就爱你刚来工作生活中都有很大的帮助。其一,我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中理论知识得到了巩固与加强,解决问题的能力也受到了锻炼得以提升;其次,本次试验开阔了我的视野,是我对统计在现实中的运作有所了解每页对统计有了进一步的掌握。 统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了,统计学广发吸收而活融合相关学科的新理论,不断考法应用新技术和新方法门神画和丰富了统计学传统领域的理论和方法,并拓展了新的领域。今天的统计学一展现出强有力的生命力。人嫩的日常生活和一切社会生活都离不开统计。英国统计学科学家哈斯利特说:“统计方法的应用时这样普遍,在我们的饿是哪个或和习惯中,统计的影响是这样巨大,一直拥挤的重要性无论怎么强调都不过分。”甚至有的科学还把我们的时代叫做统计时代,先问意见,可以说统计学已经融入了我们的是哪个或中,因此,学号统计学及能流应用excel进行实际统计操作对我们来说至关重要。 通过实验二的实验操作与学习,我本着较熟练地掌握EXCEL在描述统计中的基本操作内容,利用EXCEL软件计算描述统计特征值以及绘制统计图形的目的进行学习和操作。这一次实验操作让我熟练掌握EXCEL软件的基本操作方法;学会利用EXCEL的统计函数与宏程序求解统计分布特征值;掌握利用直方图工具绘制频数分布直方图的方法。实验操作过程中,我进行了如下操作内容: 1、EXCEL软件的基本操作; 2、利用EXCEL函数进行描述统计特征值的计算; 3、利用宏程序进行描述统计特征值的计算; 4、利用FREQUENCY函数进行频数统计; 5、利用直方图工具绘制频数分布直方图。 【实验目的】 较熟练地掌握EXCEL在统计整理和统计描述中的基本操作内容,利用EXCEL软件计算描述统计特征值以及绘制统计图形。 【实验软件】 EXCEL 【实验要求】 要求熟练掌握EXCEL软件的基本操作方法;学会利用EXCEL的统计函数与宏程序求解统计分布特征值;掌握利用直方图工具绘制频数分布直方图的方法。 【实验内容】 1、EXCEL软件的基本操作; 2、利用EXCEL函数进行描述统计特征值的计算; 3、利用宏程序进行描述统计特征值的计算; 4、利用FREQUENCY函数进行频数统计; 5、利用直方图工具绘制频数分布直方图。【实验过程】 1.输入实验数据: 某企业50名工人日加工零件数 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 2.计算:(1) 组距分组 Excel的FREQUENCY函数进行频数统计时采用的是“上限在内”原则,为符合统计分组的“上限不在内”的原则,分组时相邻组的组限不应重合。为此,我们进行了以下分组:105-114.9,115-124.9,125-134.9,135-144.9。 (2) 频数 使用FREQUENCY函数,进行计算。FREQUENCY(B4:B53,D4:D7)频数分别是:8、22、16、4(3) 频数分布直方图 点击“工具”菜单,然后点击“数据分析”,在“数据分析”中选择“直方图”。在“直方图”中的“输入区域”输入“B4:B53”,“接收区域”输入“D4:D7”,结果如下: (4)特征值计算 在相应方格中输入命令,得到各特征值。 COUNT(B4:B53)并回车,得到50个数据中的单位总量50。SUM(B4:B53)并回车,得到50个数据中的标志总量6149。MAX(B4:B53)并回车,得到50个数据中的最大值139。MIN(B4:B53)并回车,得到50个数据中的最小值107。 AVERAGE(B4:B53)并回车,得到50个数据中的平均值122.98。MEDIAN(B4:B53)并回车,得到50个数据中的中位数123。 GEOMEAN(B4:B53)并回车,得到50个数据中的几何平均数122.7222。HARMEAN(B4:B53)并回车,得到50个数据中的调和平均数122.4633。AVEDEV(B4:B53)并回车,得到50个数据中的变异统计的平均差6.2616。STDEV(B4:B53)并回车,得到50个数据中的变异统计的标准差8.026716。VAR(B4:B53)并回车,得到50个数据中的变异统计中的方差64.42816。KURT(B4:B53)并回车,得到50个数据中的变异统计中的峰度-0.40871。SKEW(B4:B53)并回车,得到50个数据中的变异统计中的偏度9.94E-05。当然,如果在计算特征值的时候使用宏程序,则可以使过程简便很多。步骤如下: 点击工具栏“数据分析”,再点击“描述统计”,在对话框的输入区域和输出区域分别输入相应区域,并选择输出“汇总统计”和“平均数置信度”,在“K个最大值”和“K个最小值”选择中,选择系统默认值“1”,表示选择输出第1个最大值和第1个最小值。然后按确定,可得到如下结果; 3.至此,整个实验就结束了。 本次实验操作,我能在规定的实验时间内完成习题作业,并且完成的质量较高,使自己平时所学的理论知识能与实践相结合。在此次实验操作,我还是太过于依赖教材,没能在掌握教材要点之后再进行操作,这是我在今后的实验操作过程中应该提高和改进的地方。我相信在今后的实验操作课中,我将如此次操作一样认真,并且逐步改正自己的不足,争取越做越好。 (二)意见和建议 总的来说,在短短16节课中,老师就将统计学原理实验课程中所有要求掌握的八个实验为我们细心讲解了,但是,由于课时短,课程容量大,我们消化吸收的比较缓慢。希望以后的学习中能有充足的学习了解时间。 对哟我们自身来说,在学习当中,总是容易分神,对枯燥的数字总是缺乏兴趣。希望老师能达利调动我们对统计实验操作的兴趣,是授课方式多元化。 最后,十分感谢老师的辛勤付出,您辛苦了。第三篇:统计学实验报告
第四篇:统计学实验报告
第五篇:统计学实验报告