第一篇:spss数据分析报告
关于某班级2012年度考试成绩、获奖情况统计分析
报告
一、数据介绍:
本次分析的数据为某班级学号排列最前的15个人在2012年度学习、获奖统计表,其中共包含七个变量,分别是:专业、学号、姓名、性别、第一学期的成绩、第二学期的成绩、考级考证数量,通过运用spss统计软件,对变量进行频数分析、描述分析、探索分析、交叉列联表分析,以了解该班级部分同学的综合状况,并分析各变量的分布特点及相互间的关系。
二、原始数据:
三、数据分析
1、频数分析
(1)第一学期考试成绩的频数分析
进行频数分析后将输出两个主要的表格,分别为样本的基本统计量与频数分析的结果
1)样本的基本统计量,如图1所示。样本中共有样本数15个,第一学期的考试成绩平均分为627.00,中位数为628.00,众数为630,标准差为32.859,最小值为568,最大值为675。“第一学期的考试成绩”的第一四分位数是602,第二四分位数为628,第三四分位数为657。
2)“第一学期考试成绩”频数统计表如图2所示。
3)“第一学期考试成绩”Histogram图统计如图3所示。
(2)、第二个学期考试成绩的频数分析
1)样本的基本统计量,如图4所示。第二学期的考试成绩平均分为463.47,中位数为452.00,众数为419,标准差为33.588,最小值为419,最大值为522。“第二学期的考试成绩”的第一四分位数是435,第二四分位数为452,第三四分位数为496。
3)“第二学期考试成绩”频数统计表如图5所示。3)“第二学期考试成绩”饼图统计如图6所
2、描述分析
描述分析与频数分析在相当一部分中是相重的,这里采用描述分析对15位同学的考级考证情况进行分析。
输出的统计结果如图7所示。从图中我们可以看到样本数15,最小值1,最大值4,标准差0.941等统计信息。
3.探索分析。
探索分析能够对变量进行更为深入、详尽的描述性统计分析。下面就利用探索式分析对不同性别的同学获奖情况进行探索分析。
1)在结果输出窗口中将看到如下统计数据。如图8所示,给出了输出的观察量。
2)图9所示给出了根据性别分组的各组描述统计量。根据表中的数据,2012年度,女生比男生获奖的次数多。
3)图10以茎叶图的形式也直观的呈现了女生获奖数量远远比男生多的现象。,4)图为稳健估计量表,给出了4种不同权重下因变量均值的稳健估计。
5)图11中给出了分组后的百分位数,分别输出男生和女生获奖数量的5%、10%、25%、75%、90%、及95%的百分位数。
4、交叉列联表分析
分析多个变量在不同取值情况下的数据分布情况,从而进一步的分析变量关系。下面就利用交叉列联表分析不同性别学生对目前所学专业的态度。在结果输出窗口中将显示如下统计数据。1)观察量处理摘要表,如图12所示,2)“性别”和“所学专业兴趣”的交叉列联表如图13所示,从图中我们可以看出,男生中对所学专业感兴趣的只有2个,(占22.2%),一般感兴趣的有4人,(占44.4%),不感兴趣的有3人,(占33.3%),理论值为3.6人感兴趣,3.0人一般感兴趣,2.4人不感兴趣,残差分别为-1.6,1.0,0.6。女生中对专业感兴趣的有4人,(占66.7%),一般感兴趣的有1人,(占16.7%),不感兴趣的也有1人,(占16.7%),理论值为2.44人感兴趣,2.0人一般感兴趣,1.6人不感兴趣,残差分别为1.6,-1.0,-0.6.可见,男生对目前所学专业的兴趣与女生有很大差别。
3)图14是交叉分组下的频数分布图,从该图中我们可以很直观的看到数据分布情况。
第二篇:spss数据分析报告怎么写
spss数据分析报告怎么写
今天乔布简历小编就和大家一起来看看spss数据分析报告怎么写。
关键词:spss数据分析报告怎么写
我们用一个例子来分析spss数据分析报告的写法——以某公司474名职工的综合状况为例进行分析。
一、数据介绍
本次分析的数据是某公司474名职工的状况统计表,其中有11个变量,分别是:职工编号、性别、出生日期、受教育水平程度、职务等级、起始工资、现工资、本单位工作经历、以前工作经历、民族类型、年龄。我们通过使用spss统计软件,对变量分别进行频数分析、描述性统计、方差分析,还有相关分析,来了解该公司职工上述方面的综合状况,并分析个别变量的分布特点和相互之间的关系。
二、数据分析
1、频数分析。我们通过频数分析可以了解变量的取值情况,对把握数据的分布特征非常重要。此次分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。
首先,对该公司的男女性别分布进行频数分析,其次对原有数据中的受教育程度进行频数分析,并分别以表格的形式呈现出来。
2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。
3、Exploratory data analysis。
(1)交叉分析。
在实际分析中,除了了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。
(2)单因素方差分析。
我们把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。
4、相关分析。事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具。
5、参数检验。对现工资的分布做正态性检验。
6、非参数检验。对本数据中的年龄做正态分布检验。
spss数据分析报告怎么写
http://cv.qiaobutang.com/knowledge/articles/56a9d1cb0cf2b3a2599171a1
第三篇:关于员工工资水平影响因素的spss数据分析报告
关于员工工资水平影响因素的数据分析报告
个体收入的影响因素分析是社会学研究的经典课题,个体收入不仅是经济含义的变量,同时也是决定个体经济社会地位的重要指标之一,所以分析个体收入的影响因素具有重要的社会意义。
本报告基于某企业收集的关于474个样本的问卷调查数据,就问卷涉及的主要变量:性别、民族、受教育年限、职业类型、目前工资、最初工资、工作时间和之前的工作经历(月数)分析了该企业员工工资总体情况和影响工资收入的因素。
一 关于个体收入影响因素的假设
社会学文献对影响个体收入的因素做过很多论述,其中与本数据提供的变量相关的假设如下:
a 不同性别的员工工资收入存在差异
b 不同民族的员工工资收入存在差异(在美国显著)
c 不同职业类型的员工工资收入存在差异
d 受教育年限与员工现在工资收入呈正相关关系
e 初始工资与员工现在工资收入呈正相关关系
f 工作时间和之前的工作经历与现在工资收入呈相关关系
二 基于SPSS的企业员工工资总体水平和影响因素的描述与统计分析
1.样本的总体特征和企业员工工资的总体情况
1.1 样本的总体特征
根据SPSS对性别、受教育年限和民族的频次分析,可知该公司员工女性占45.6%,男性占54.4%,男女员工比例大体相当。公司51.3%的员工为高中及以下学历(受教育年限8-12年),38.2%的员工为本科学历(受教育年限13-16年),10.5%的员工为研究生学历(受教育年限为17年及以上);公司有21.9%的员工为少数民族。
1.2 企业员工工资的总体情况
根据SPSS对当前工资、性别与当前工资、民族、职业类型与当前工资的描述分析,可得到表1。
表1 企业员工当前工资的总体情况
当前工资
女性员工当前工资
男性员工当前工资
少数民族员工当前工资
非少数民族员工当前工资
办事员当前工资
保管员当前工资
经理当前工资 均值 $34,419.57 $26,031.92 $41,441.78 $36,023.31 $28,713.94 $27,838.54 $30,938.89 $63,977.80 标准差 $17,075.661 $7,558.021 $19,499.214 $18,044.096 $11,421.638 $7,567.995 $2,114.616 $18,244.776
从表1可知,公司员工的平均工资是$34,420,标准差为$17,075.7。女性员工的平均工资 1
为$26,032,男性员工为$41,442,是女性员工平均工资的1.59倍;少数民族员工的平均工资为$28,714,非少数民族员工为$36,023,是少数民族员工的1.25倍;从民族来看,少数民族员工的平均工资是$36,023,非少数民族员工为$28,714,是少数民族员工1.25倍。从职业类型来看,办事员的平均工资为$27,838,保管员的平均工资为$30,939,这两种职业的少数民族员工与非少数民族员工的平均工资没有明显差异,经理层的平均工资为$63,977,是非管理层员工平均工资的2倍以上。
2.员工工资收入的影响因素分析 影响公司员工工资收入的因素,根据变量测量层次的不同和散点图样本分布的线性与非线性区别,可以通过两种方法来考察:一是性别、民族、职业类型和工作经历对当前工资的影响,可以用方差分析法和相关比率Eta来考察;另一是受教育年限、初始工资和工作时间对当前工资的影响,可以通过相关测量法和F检验来考察。
2.1性别、民族、职业类型和工作经历对当前工资的影响分析
从散点图的样本分布可知,工作经历与当前工资呈非线性,所以通过相关比率Eta来考察二者关系。根据SPSS分别对性别、民族、职业类型、工作经历与当前工资的单因方差分析和列联表的相关比率(E)结果,得到表2。
表2 当前工资的影响因素分析
性别与当前工资 民族与当前工资 职业类型与当前工资 工作经历与当前工资
F 119.798 15.326 40.521 1.040
p <0.01 <0.01 <0.01 >0.05
E 0.450 0.177 0.805 0.669
由表2可以得出,性别与当前工资的F值为119.798,其显著性概率p<0.01,Eta值为0.450,说明不同性别的员工平均工资具有显著差异,性别影响企业员工收入;同样,民族、职业类型与当前工资的F值分别为15.326和40.521,二者的显著性概率p均小于0.01,所以,少数民族与非少数民族员工工资具有差异,但民族与员工当前工资的Eta值仅为0.177,说明二者相关性极其微弱;职业类型与当前工资高度相关,其Eta值为0.805。工作经历与当前工资的显著性概率p>0.05,说明员工之前的工作经历对员工的当前工资没有影响。
2.2 受教育年限、初始工资和工作时间对当前工资的影响分析 根据SPSS对受教育年限、初始工资和工作时间与当前工资的相关分析和F检验,可得到表3。
表3 当前工资的影响因素分析
受教育年限与当前工资 初始工资与当前工资 工作时间与当前工资
F 92.779 33.040 1.503
r 0.661 0.880 0.084
p <0.01 <0.01 >0.05
表3的结果显示:受教育年限与当前工资在0.01的显著性水平下显著,相关系数r为0.661,F值为92.779,即受教育年限影响企业员工的当前工资收入;初始工资与当前工资的F值为33.040,其显著性概率p<0.01,相关系数r为0.880,说明初始工资与当前工资高度相关;工作时间与员工当前工资的显著性概率p>0.05,即二者相互独立,不具有相关关系。
2.3 回归分析:受教育年限、初始工资与当前工资之间相关关系的模型
为了更好的说明教育年限、初始工资与当前工资之间的关系结构,可以建立三者的线性回归模型。根据SPSS对三个变量的二元线性回归分析,得到表4。
表4教育年限(X1)、初始工资(X2)与当前工资(Y)的二元线性回归Constants 教育年限 初始工资
B ﹣7809 1020.4 1.673
b0.172 0.771
t ﹣4.452 6.356 28.42
p <0.01 <0.01 <0.01
R2=0.792F=898.947p<0.0
1从表4可以看出,拟合优度R=0.792,较高,说明该线性方程拟合优度较好,F值为898.947,显著度p<0.01,即该回归方程线性关系显著。自变量“受教育年限”X1和“初始工资”X2的回归系数的估计分别为1020.4和1.673,标准化系数分别为0.172和0.771,t检验值分别为6.356和28.42,其显著性水平p均小于0.01,所以认为X1、X2的回归系数高度显著。该二元线性回归方程可以表示为:
Y =-7809+1020.4X1+1.673X2
三 结论
从以上的分析可以得出:
1.性别影响该企业员工的当前工资收入,男性与女性的工资具有显著差异,男性的平均工资是女性的1.59倍,性别与当前工资的相关比率为0.450。
2.少数民族员工与非少数民族员工的工资具有差异,非少数民族的平均工资是少数民族的1.25倍。但民族与当前工资的相关强度很微弱。
3.职业类型影响企业员工的工资收入,其相关强度为0.805,其显著差异体现在管理层和非管理层的工资收入差距上,管理层的平均工资是非管理层的2倍以上。
4.受教育年限与当前工资具有较强的正相关关系,其相关系数为0.661。受教育年限越高,其工资收入越高;反之,则越低。
5.初始工资与当前工资具有很强的正相关关系,相关系数为0.880,即初始工资越高,其工资收入越高,反之,则越低。
6.雇佣后的工作时间和该工作之前的工作经历对企业员工的当前工资没有影响。
7.受教育年限(X1)和初始工资(X2)与当前工资(Y)可以建立二元线性回归方程模型。线性关系与回归系数均显著。该二元线性回归方程可以表示为:
Y =-7809+1020.4X1+1.673X2
(其中Y代表当前工资,X1代表受教育年限,X2代表初始工资。)
第四篇:SPSS实验分析报告四
SPSS实验分析报告四
一、地区*日期*销售量
(一)、提出假设
原假设H0=“不同地区对销售量的平均值没有产生显著影响。” H2=“不同日期对销售量的平均值没有产生显著影响。” H3=“不同的地区和日期对销售量没有产生了显著的交互作用。”
(二)、两独立样本t检验结果及分析
表
(一)主旨間係數
地区 2 3 日期 2 3
數值標籤
地区一 地区二 地区三 周一至周三 周四至周五
周末
N 9 9 9 9 9 9
表
(一)表示各个控制变量的分组情况,包括三个不同的地区以及三个不同日期的数据。
表
(二)销售额多因素方差分析结果
主体间效应的检验
因變數: 销售量
來源 第 III 類平方和 修正的模型 61851851.852
a
df 8
平均值平方 7731481.481
F 8.350
顯著性.000 截距 地区 日期 地区 * 日期 錯誤 總計 844481481.481 2296296.296 2740740.741 56814814.8***.667 923000000.000 2 2 4 18 27 26
844481481.481 1148148.148 1370370.370 14203703.704 925925.926
912.040 1.240 1.480 15.340
.000.313.254.000
校正後總數 78518518.519 a.R平方 =.788(調整的 R平方 =.693)
由表
(二)可知,第一列是对观测变量总变差分解的说明;第二列是对观测变量总变差分解的结果;第三列是自由度;第四列是方差;第五列是F检验统计量的观测值;第六列是检验统计量的概率P值。可以看到:观测变量的总变差SST为78518518.519,它被分解为四个部分,分别是:由 地区(x2)不同引起的变差(2296296.296),由日期(x3)不同引起的变差(2740740.741),由地区和日期交互作用(x2*x3)引起的变差(5.681E7),由随机因素引起的变差(Error 1.667E7)。FX1、FX2、FX1*X2的概率P值分别为0.313、0.254、0.000。如果显著性水平α为0.05,由于FX1、FX2的概率P值大于显著性水平α,因此不应该拒绝原假设,可以认为不同的地区、日期下的销售量总体均值不存在显著差异,对销售量的效应同时为0,各自不同水平没有给销售量带来显著影响。同时,由于FX1*X2的概率P值小于显著性水平α,所以应该拒绝原假设,可以认为不同的地区和日期对销售量产生了显著的交互作用,在不同的地区,不同的日期会对销售额产生显著影响。
表
(三)自訂假設檢定索引 對照係數(L' 矩陣)轉換係數(M 矩陣)對照結果(K 矩陣)對照係數(L' 矩陣)轉換係數(M 矩陣)
地区 的偏差對照(省略種類 = 3)
恆等式矩陣 零矩陣
日期 的偏差對照(省略種類 = 3)
恆等式矩陣 對照結果(K 矩陣)零矩陣
表
(四)不同地区下销售量的均值对比检验结果(K 矩陣)
地区 偏差對照
層次 1 對平均值
對比估計 假設值
差異(評估值假設值)
標準錯誤 顯著性
95% 差異的信賴區間
a.省略的種類 = 3
下限 上限 下限 上限
a因變數 销售量-259.259
0-259.259 261.891.335-809.473 290.954 407.407 0 407.407 261.891.137-142.806 957.621
表
(四)分别显示了三个不同地区销售量总体的均值检验结果,省略了地区三的检验结果,检验值是各水平下的总体均值。可以看出:地区一的销售量均值与检验值的差为259.259,标准误差为261.891,T检验统计量的概率P值为0.335,差值的95%置信区间的下限和上限分别为-809.473,290.954。分析结论为:地区一销售量的均值与检验值之间不存在显著差异。同理,地区二销售量的均值与检验值之间不存在显著差异。三个地区产生的影响没有显著差异。
表
(五)地区对销售量影响的单因素方差分析结果
因變數: 销售量
來源 比對平方和 2296296.296
df 2 18
平均值平方 1148148.148 925925.926
F 1.240
顯著性.313 錯誤 16666666.667
表
(五)是地区对销售量影响的单因素方差分析结果。可以看到:不同地区可解释的变差为2296296.296,不可解释的变差为16666666.667,它们的方差分别为1148148.148、925925.926,F统计量的观测值为1.240,对应的概率P值为0.313。如果显著性水平α为0.05,由于概率P值大于显著性水平α,所以原假设成立,认为不同地区对销售量的平均值没有产生显著影响。
表
(六)不同日期下销售量的均值对比检验结果(K 矩陣)
日期 偏差對照
層次 1 對平均值
對比估計 假設值
差異(評估值假設值)
標準錯誤 顯著性
95% 差異的信賴區間
下限
a
因變數 销售量-370.370
0-370.370 261.891.174-920.584 179.843 407.407 0 407.407 261.891.137-142.806
上限
a.省略的種類 = 3
957.621
表
(六)分别显示了三个不同日期下销售量总体的均值检验结果,省略了日期三的检验结果,检验值是各水平下的总体均值。可以看出:日期一的销售量均值与检验值的差为370.370,标准误差为370.370,T检验统计量的概率P值为0.174,差值的95%置信区间的下限和上限分别为-920.584、179.843。分析结论为:日期一销售量的均值与检验值之间不存在显著差异。同理,日期二销售量的均值与检验值之间不存在显著差异。三个不同日期产生的影响没有显著差异。
表
(七)日期对销售量影响的单因素方差分析结果
因變數: 销售量
來源 比對 錯誤
平方和 2740740.741 16666666.667
df 2 18
平均值平方 1370370.370 925925.926
F 1.480
顯著性.254
表
(七)是日期对销售量影响的单因素方差分析结果。可以看到:不同日期可解释的变差为2740740.741,不可解释的变差为16666666.667,它们的方差分别为1370370.370、925925.926,F统计量的观测值为1.480,对应的概率P值为0.254。如果显著性水平α为0.05,由于概率P值大于显著性水平α,所以原假设成立,认为不同日期对销售量的平均值没有产生显著影响。
图
(一)地区与销售量的交互作用图
图
(一)中,从地区一至地区三,不同的日期销售额的变化波动很大且规律不一,直接结论是:不同的日期和地区间存在明显的交互作用。
图
(二)日期与销售量的交互作用图
图
(二)中,在不同的日期,不同地区的销售额的变化规律都不一样,直接结论是:不同的地区和日期间存在明显的交互作用。
二、香烟消耗量*肺癌死亡率
(一)、提出假设
原假设H0=“香烟消耗量对肺癌死亡率没有产生显著影响。”
(二)、两独立样本t检验结果及分析
图
(三)香烟消耗量与肺癌死亡率的简单散点图
由图
(三)可知,香烟消耗量与肺癌死亡率存在一定的正相关关系。
表
(八)香烟消耗量*肺癌死亡率相关关系分析
1930年人均香每百万男子中死
1930年人均香烟消耗量 皮爾森(Pearson)相關
烟消耗量
于肺癌的人数
.737
**
顯著性(雙尾)
N 每百万男子中死于肺癌的皮爾森(Pearson)相關
人数
顯著性(雙尾)
N **.相關性在 0.01 層上顯著(雙尾)。
11.737.010 11
**
.010 11 1 11 由表
(八)可知,香烟消耗量和肺癌死亡率的简单相关系数为0.737,说明两者之间存在正的强相关性,其相关系数检验的概率P值为0.010。因此,当显著性水平α为0.01时,P值小于显著性水平应拒绝相关系数检验的原假设。中相关系数上角的两个星号(**)表示显著性水平α位0.01时拒绝原假设。
三、销售额*销售价格*家庭收入
(一)、提出假设
原假设H0=“销售额对销售价格没有产生显著影响。” H2=“家庭收入对销售价格没有产生显著影响。”
(二)、两独立样本t检验结果及分析
图
(四)销售额与销售价格的简单散点图
由图
(四)可知,销售额与销售价格之间存在负相关关系。
图
(五)销售额与家庭收入的简单散点图
由图
(五)可知,销售额与家庭收入之间存在较强的正相关关系。
图
(六)销售价格和家庭收入的简单散点图
由图
(六)可知,销售价格与家庭收入之间存在弱的负相关关系。
表
(九)销售额*销售价格相关系数计算结果
销售额 皮爾森(Pearson)相關 顯著性(雙尾)
N 销售价格 皮爾森(Pearson)相關 顯著性(雙尾)
N
销售额 1 10-.933**.000 10
销售价格-.933**.000 10 1 10 **.相關性在 0.01 層上顯著(雙尾)。
由表
(九)可知,销售额和销售价格的简单相关系数为-0.933,说明两者之间存在负的强相关性,其相关系数检验的概率P值为0。因此,当显著性水平α为0.01时,应拒绝相关系数检验的原假设,认为两总体不是零相关。
另外,表
(九)中相关系数上角的两个星号(**)表示显著性水平α为0.01时拒绝原假设。
表
(十)销售价格和销售额的偏相关分析结果
控制變數
家庭收入 销售价格
相關 顯著性(雙尾)
df
销售额
相關 顯著性(雙尾)
df
销售价格 1.000.0-.728.026 7
销售额-.728.026 7 1.000.0
由表
(十)可知,在家庭收入作为控制变量的条件下,销售价格和销售额的偏相关系数为-0.728,呈较强的负相关,高于简单相关系数。
第五篇:人力资源管理数据SPSS处理
一、对某些变量进行频数分析,并对分析结果给出恰当的文字性描述,并输出恰当的图形。选取了恰当变量得2分,结果输出正确、文字性描述准确得6分,输出恰当图形得2分。
二、对某些变量进行描述性统计(峰度和偏度),并对分析结果给出恰当的文字性描述。此项评分点满分为10分。选取了恰当变量得2分,结果输出正确、文字性描述准确得8分。
三、利用文件中的数据进行交叉分组下的频数分析,并对分析结果给出恰当的文字性描述。此项评分点满分为15分。选取了恰当变量得3分,结果输出正确、文字性描述准确得12分。
四、对某些变量进行多选项分析(二分法,分类法),并对分析结果给出恰当的文字性描述。此项评分点满分为15分。选取了恰当变量得3分,结果输出正确、文字性描述准确得12分。
五、根据文件中数据的特征,利用一种或多种参数检验方法,对文件中某些变量进行分析,并对分析结果给出恰当的文字性描述。此项评分点满分为20分。选取了恰当变量得3分,结果输出正确、文字性描述准确得15分,使用两种方法得2分。
六、对文件中某些变量进行相关分析(第八章。双变量相关),并对分析结果给出恰当的文字性描述。此项评分点满分为15分。选取了恰当变量得3分,结果输出正确、文字性描述准确得12分。
七、利用文件中的数据进行方差分析,选择恰当的分析方法(单因素方差分析,多因素方差分析),并对分析结果给出恰当的文字性描述。此项评分点满分为15分。选取了恰当变量得3分,结果输出正确、文字性描述准确得12分。