数据选择器实验报告5则范文

时间:2020-11-08 12:20:27下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《数据选择器实验报告》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《数据选择器实验报告》。

第一篇:数据选择器实验报告

实验三 数据选择器 实验人员:

班号:

学号:

一、实验目得 (1)熟悉并掌握数据选择器得功能.(2)

用双 4 选 1 数据选择器 74LS153 设计出一个 16 选 1 得数据选择器。

(3)用双 4 选 1 数据选择器 74LS153 设计出一个全加法器。

二、实验设备 数字电路实验箱,74LS00,74LS153.三、实验内容(1)

测试双 4 选 1 数据选择器74LS153 得逻辑功能。

74LS153 含有两个 4 选 1 数据选择器,其中 与 为芯片得公共地址输入端,与 分别为芯片得公共电源端与接地端.Figure1 为其管脚图:

Figure 错误 错误!未定义书签。

未定义书签。

:路电接连图下按ﻩ Figure 错误 错误!未定义书签。

(2)设某一导弹发射控制机构有两名司令员 A、B 与两名操作员C、D,只有当两名司令员均同意发射导弹攻击目标且有操作员操作,则发射导弹 F.利用所给得实验仪器设计出一个符合上述要求得16选1数据选择器,并用数字电路实验箱上得小灯与开关组合表达实验结果。

思路 :

由于本实验需要有四个地址输入端来选中 16 个数据输入端得地址之中得一个,进而实现选择该数据输入端中得数据得功能,即 16选1。而公共得、两

个地址输入端与 使能端(用于片选,已达到分片工作得目得,进而扩展了一位输入)一共可以提供三个地址输入端,故需要采用降维得方法,将一个地址输入隐藏到一个数据输入端 中。本实验可以降一维,也可以降两位。由于两位比较复杂,本实验选择使用降一维得方式。

做法 :

:图诺卡得能功需所现实中题用应如出画ﻩ

00

01

11

10 00 01 0 0 0 0 0 0 1 0 11 0 0 1 0 10 0 0 1 0 将 D 降到数据输入端中。对应得卡诺图如下:

00

01

1 0 0 D 0 0 0 1 0 按上述卡诺图连接电路,用开关控制送给各输入高低电平。其中,“1”表示高电平,“0”表低电平,均由开关上下拨动来控制;A、B、C、D分别为题中得两个司令员得同意情况与两个操作员得操作情况;F 为导弹发射情况,将F接到小灯上即可。电路如 Figure 1 所示(图中 即,后面得图均为如此):

Figure 3

AB CD C AB

(3)用 74LS00与 74LS153 设计一位全加器,并用数字电路实验箱上得小灯与开关组合表达实验结果。

一位全加器得功能如下面两个卡诺图所示。其中 A、B 分别表示被加数与加数,CI 表示低位向本位得进位,S 表示运算结果,CO 表示向高位得进位。

CO: S:

00

经分析,此全加器有三个输入,而公共得、两个地址输入端与 使能端(用于片选,已达到分片工作得目得,进而扩展了一位输入)刚好一共可以提供三个地址输入端。故按上面得卡诺图,分析后应采用下面得端口解法:

按上面得接法连接电路。用开关控制送给各输入高低电平,“1“表示高电平,“0”表低电平,均由开关上下拨动来控制; 表示低位送进来得进位信号,A、B分别表示被加数与加数;S 与 分别表示加法结果与向高位得进位信号。电路如Figure 4 所示:

Figure 4 四、实验结果(1)

测试双 4 选 1 数据选择器74LS153 得逻辑功能:

:下如录记果结将,)亮灯小或(平电高示表”1“,)灭灯小或(平电低示表”0“用ﻩ

0

0 1 0

1 B A A B

1Q 0 0 0

0 0 1

0 1 0

0 1 10 0 0 1 0 1 0 1 1 0 0 1 1 1 0

2Q 0 0 0

0 0 1

0 1 0

0 1 1

1 0 0 0 1 0 1 0 1 1 0 0 1 1 1 0(2)

设计出一个符合题目要求得 16 选 1 数据选择器

:下如录记果结将,)亮灯小或(平电高示表”1“,)灭灯小或(平电低示表”0“用ﻩA B C D F 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 0 1 1 0 1 0 1 1 1 1 1 0 0 0 0 1 0 0 1 1

1 0 1 0 1 1 0 1 1 1 1 1 0 0 0 1 1 0 1 1 1 1 1 0 1 1 1 1 1 1

。能功辑逻得出计设求要所足满以可路电此,得可表值真得面上由ﻩ(3)

设计一位全加器

:下如录记果结将,)亮灯小或(平电高示表“1“,)灭灯小或(平电低示表"0“用ﻩA B CI S CO 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 1 1 0 1 1 0 0 1 0 1 0 1 0 1 1 1 0 0 1 1 1 1 1 1

由上面得真值表可得,此电路可以满足所要求设计出得逻辑功能。

五、故障排除

在实验(1)中,发现所连接电路与预期得逻辑功能不一致.在检验了导线与小灯都正常后,发现将芯片得管脚接错了,误将 Q 与 接错地方。分析原因,就是由于芯片管脚设置得位置与管脚图上面不一致,两侧均有两个管脚接口.六、心得体会

连了道知中除排得障故在且并,计设得路电辑逻了握掌地好更我,验实次这过通ﻩ接时要瞧引脚上面得标号而不能一味地只认准位置。

我还学会了降维得方法.本来以为只能用使能端扩展出一位输入,结果却可以通过降维扩展出更多。我感觉非常做电路实验。

第二篇:数据结构图的遍历实验报告

实验报告

课程名:数据结构(实验名:图的遍历姓

名:班

级:学

号:时

间:

C语言版)

2014.11.15

一 实验目的与要求

1.掌握图的遍历的方法

2.利用 C 语言实现图的遍历

二 实验内容

• 将一个图存储起来

• 对该图分别进行先深和先广遍历

三 实验结果与分析

程序:

#include #include #define INFINITY 32767 #define MAX_VEX 20 //最大顶点个数

#define QUEUE_SIZE(MAX_VEX+1)//队列长度 //using namespace std;bool *visited;//访问标志数组,避免同一顶点多次访问 /****图的邻接矩阵存储结构******/ typedef struct{ char *vexs;//顶点向量

int arcs[MAX_VEX][MAX_VEX];//邻接矩阵

int vexnum,arcnum;//图的当前顶点数和弧数 }Graph;/*********队列类************/ class Queue{ public: void InitQueue(){ base=(int *)malloc(QUEUE_SIZE*sizeof(int));front=rear=0;} void EnQueue(int e){ base[rear]=e;rear=(rear+1)%QUEUE_SIZE;} void DeQueue(int &e){ e=base[front];front=(front+1)%QUEUE_SIZE;} public: int *base;int front;int rear;};/*图G中查找元素c的位置*/ int Locate(Graph G,char c){ for(int i=0;i

G.vexs=(char *)malloc(G.vexnum*sizeof(char));//分配顶点数目

printf(“输入%d个顶点.n”,G.vexnum);for(i=0;i

printf(“输入顶点%d:”,i);scanf(“%c”,&G.vexs[i]);temp=getchar();//接收回车

} for(i=0;i

for(j=0;j

printf(“输入弧%d:”,i);scanf(“%c %c %d”,&a,&b,&w);//输入一条边依附的顶点和权值

temp=getchar();//接收回车

s1=Locate(G,a);s2=Locate(G,b);G.arcs[s1][s2]=G.arcs[s2][s1]=w;} } /*****图G中顶点k的第一个邻接顶点***********/ int FirstVex(Graph G,int k){ if(k>=0 && k

for(int i=0;i=0 && i=0 && j

for(int k=j+1;k

visited[k]=true;printf(“%c ”,G.vexs[k]);//访问第k个顶点

for(i=FirstVex(G,k);i>=0;i=NextVex(G,k,i))if(!visited[i])DFS(G,i);//对k的尚未访问的邻接顶点i递归调用DFS } } /****************广度优先遍历***************/ void BFS(Graph G){ int k;Queue Q;//辅助队列Q Q.InitQueue();for(int i=0;i

visited[i]=true;printf(“%c ”,G.vexs[i]);Q.EnQueue(i);//i入列

while(Q.front!=Q.rear){ Q.DeQueue(k);//队头元素出列并置为k for(int w=FirstVex(G,k);w>=0;w=NextVex(G,k,w))if(!visited[w]){ //w为k的尚未访问的邻接顶点

visited[w]=true;printf(“%c ”,G.vexs[w]);Q.EnQueue(w);} } } }

/***********主函数***************/ void main(){ int i;Graph G;CreateUDN(G);visited=(bool *)malloc(G.vexnum*sizeof(bool));

printf(“n广度优先遍历: ”);for(i=0;i

图1.图的遍历程序运行结果

第三篇:无线数据采集模块实验报告

无线数据采集模块

实验报告

姓名:张兆伟

班级:13 班

学号:2015042130 日期:2016年8月25日

无线数据采集模块实验报告

一、实验背景

数据是指用来描述客观事物的数字、字母和符号等等。数据传输在人类活动中的重要性是不言而喻的。它是计算机与外部物理世界连接的桥梁。数据采集,或称数据获取,既利用一种装置,从系统外部采集数据输入到系统内部。

随着计算机、通信和网络技术的飞速发展,无线传感器网络应运而生。传感测试技术正朝着多功能化、微型化、智能化、网络化、无线化的方向发展。工业无线网络是从新兴的无线传感器网络发展而来的,具有低成本、低能耗、高度灵活性、扩展性强等特点,已经成为继现场总线技术后的又一个研究热点。无线数据采集既要在复杂,恶劣的现场环境下将物理量完整的进行采集,更要将采集到的数据传给远端的主控室。其主要应用领域包括:工业遥控、遥测;石油钻井张力无线监测;短距离无线数据传输;安防设备无线监控;无线RS485、无线PLC;城市管网压力、温度监测;电力线无线报警等。

二、实验过程

无线数据采集既要在复杂,恶劣的现场环境下将物理量完整的进行采集,更要讲采集到的数据传给远端的主控室。DTD110系列无线数传模组广泛应用于无线数传领域,典型应用包括遥控、遥感、遥测系统中的数据采集、检测、报警、过程控制等环节。

DTD110系列无线PLC有4路开关量的传输,4路模拟量的传输,距离100米~3000米均可。即可以实现点对点通信,也可以实现点对多点通信,不需要编写程序,不需要布线,一般电工就可以调试使用。对于工业现场的遥测遥控实施简单、方便、便宜。

1、适用范围

无线数据采集模块具有数据采集、控制、GPRS无线远程通信等功能。采用低功耗设计。该产品可接入各种串口仪表、各种模拟信号输出的变送器、各种脉冲信号输出的雨量计、水表等。广泛用于水务、环保、气象、市政、环境、地质、农业、公安等行业远程监控系统。特别适用于太阳能供电方式的现场应用,可大大降低太阳能供电成本。

2、无线数据采集的特征:

多种配置应用方案,可以满足用户不同的需要;4个开关输入通道,4个开关OC门输出通道;4个模拟量输入通道,4个模拟量输出通道;可以直接代替有线的PLC设备;一体化设计,结构紧凑;多种产品规格适应于不同的传输距离;射频输出功率10mW、500mW、1000mW;GFSK调制,高效前向纠错信道编码技术;软件无线电技术保证高抗干扰能力和低误码率;ISM 频段433MHz,无需申请频点;工业标准设计,能工作于各种恶劣环境;直流9~24V供电,电流小于800mA。

3、主要功能

1)远程通信:GPRS网络和短消息双通道传输数据,支持专线、VPN专网多种组网方式。

2)通讯协议:支持UDP、TCP 协议,支持多中心数据通信。

3)模拟量输入:可采集4-20mA、0-5V等多种电流、电压信号输出模拟量。

4)开关量输入:可采集干接点、有源接点开关量输出信号,可定时采集以降低能耗。

5)脉冲量输入:可采集干接点脉冲信号,用于采集脉冲发讯水表。6)智能仪表接入:提供2路RS232/485串口,可以采集各种智能仪表,如流量计、照相机等。

7)开关量输出:提供三极管集电极信号输出。

8)电源输出:可定时为变送器供电,输出电压:同输入电源电压。9)远程控制:接受远程指令,实现控制。

10)数据显示:可支持2×8中文汉字液晶显示,配有4个数字键盘。

11)数据查询:可本机按键查询,同时支持就地串口查询,远程查询。

12)远程通信:支持RS232/485总线、GPRS、SMS等多种通信。

13)配套软件:配套提供参数设置软件。

4、主要特点

1)工作电流低:GPRS实时在线,平均工作电流<10mA。

2)数据存储容量大:本机循环存储监测数据,掉电不丢失,存储容量:4M。

3)维护方便:支持远程参数设置,远程软件升级。

4)体积小:外型尺寸145×100×65mm

5、技术指标

1)硬件配置:GPRS/GSM无线通信接口、4路AI、4路DI、6路PI、3路DO、2路串口、中文液晶显示和无显示可选、1个4按键键盘可选。

2)采集精度:模拟量采集精度:0.5%,脉冲计数误差:0.01%

3)通信协议:支持标准MODBUS协议,可嵌入其它通信协议。

4)通信接口:GPRS/GSM无线通信接口,1路串口用于维护,2路串口采集仪表,232/485可选。

5)通信速率:300~19200 bit/s

6)工作环境:温度:-25~+70℃、湿度:≤95%、无腐蚀气体、无导电尘埃、无爆炸环境。

7)安装方式:一般采用导轨式安装,特殊场合,可将控制器固定在安装底板上。

8)供电电源:10~28VDC

6、系统功能

系统主要分三层,第一层为服务器,第二层为过渡层,由 Zigbee 协调器和 Zigbee节点构成,第三层为任务层,由 54 个监测单元和 1 个显示单元构成。系统的主要功能为:服务器有选择地查询 54 个监测单元的数据,然后根据需要将某个监测单元的数据发送到显示单元上,让其显示,中间的传输全部由 Zigbee 组网无线通讯。

其服务器主要功能:

1)开辟多个线程,每个线程主动轮询各个节点;与每个节点的通讯必须“有问 必答”,具有超时控制机制; 2)具有广播,组播配置参数功能;

3)对每个节点可以实时监测重量,温度,湿度参数。并且以曲线形式显示; 4)实时采集每个节点的参数并显示;

5)服务器采用 Windows 7 操作系统,开发工具为 C#和 SQL 数据库,最终生成安装文件。

三、实验结果

直观看到显示单元上面显示的值,什么都不选时,数码管上显示 0000,当输入节点编号,并双击鼠标选中温度、湿度或者重量时,点击确定后,数码管

会立即显示具体数值,并且给显示单元发送显示命令。

四、认识与体会

数据采集是整个工厂自动化的最前端,测试精度、速度与实现该功能的成本是几个重要因素,数据采集也正朝着这几个方向发展。高速、实时数据采集在运动控制、医疗设备、快速生产过程和变电站自动化等领域都有非常重要的应用。这些行业中,对高速数据采集的需求远远超过目前实际可以实现的程度。用户的需求促进了技术的发展和新产品的出现,随着工业发达国家和新兴崛起国家为提高其产品在全球市场的竞争力,他们更进一步希望降低包括能源消耗、原材料消耗和劳务成本。对于发达国家来讲,其劳务成本远远高于新兴崛起国家,因此特别重视促进创新和技术进步,采用新的技术手段。正是在这样竞争日益激烈的大背景下,无线数据采集技术在工业中的推广应用则受到了特殊的重视。

第四篇:SPSS数据统计软件实验报告

SPSS数据统计软件实验报告

专业

信息与计算科学

班级

级班

组别

指导教师

姓名

同组人

实验时间

2018

****年**月**日

实验地点

实验名称

方差分析

实验目的通过对数据的分析,使其掌握用方差分析的方法来比较数据。

实验仪器:

1、支持Intel

Pentium

Ⅲ及其以上CPU,内存256MB以上、硬盘1GB以上容量的微机;

软件配有Windows98/2000/XP操作系统及SPSS软件。

2、了解SPSS软件的特点及系统组成,在电脑上操作SPSS软件。

实验内容、步骤及程序:

一、1.实例内容:

下表给出销售方式对销售量的对比试验数据,利用单因素方差分析来分析不同的销售方式对销售量的影响。

2.实例操作:

Step

01

打开对话框。

打开数据文件,选择菜单栏中的【分析】|【比较均值】|【单因素 ANOVA】命令,弹出【单因素ANOVA检验】对话框。

Step

02

选择因变量。

在候选变量列表框中选择【销售量】变量作为因变量,将其添加至【因变量列表】列表框中。

Step

03

选择因变量。

在候选变量列表框中选择【销售方式】变量,将其添加至【因子】文本框中。

Step

04

定义相关统计选项以及缺失值处理方法。

单击【单因素ANOVA检验】对话框【选项】,在弹出的对话框选中【方差同质性检验】、【平均值图】复选框,然后单击【继续】。

Step

05

事后多重比较。

单击【单因素ANOVA检验】对话框【事后比较】,在弹出图中选中Bonferroni复选框,然后单击【继续】。

Step

06

对组间平方和进行线性分解并检验。

单击【单因素ANOVA检验】对话框【对比】,弹出图的对话框选中【多项式】,将【等级】设为【线性】,单击【继续】返回【单因素ANOVA检验】的对话框。

Step

07

单击【确定】,输出分析结果。

3.实例结果及分析

變異數同質性測試

销售量

Levene

統計資料

df1

df2

顯著性

.346

.793

给出了方差齐性检验的结果。从该表可以得到

Levene方差齐性检验的P值为0.793,与显著性水平0.05相差大,因此基本可以认为样本数据之间的方差是非齐次的。

變異數分析

销售量

平方和

df

平均值平方

F

顯著性

群組之間

(合併)

685.000

228.333

7.336

.003

線性項

比對

196.000

196.000

6.297

.023

偏差

489.000

244.500

7.855

.004

在群組內

498.000

31.125

總計

1183.000

给出了单因素方差分析的结果。从表中可以看出,组间平方和是685、组内平方

和是196,其中组间平方和的的F值为7.336,相应的概率值是0.003,小于显著性水平0.05,因此认为不同的销售方式对销售量有显著的影响。另外,这个表中也给出了线性形式的趋势检验结果,组间变异被销售方式所能解释的部分是196,被其他因素解释的有244.5,并且组间变异被销售方式所能解释的部分是非常显著的4.事后检验

多重比較

因變數:

销售量

Bonferroni

(I)

销售方式

(J)

销售方式

平均差異

(I-J)

標準錯誤

顯著性

95%

信賴區間

下限

上限

1.0

2.0

-7.0000

3.5285

.388

-17.615

3.615

3.0

9.0000

3.5285

.128

-1.615

19.615

4.0

4.0000

3.5285

1.000

-6.615

14.615

2.0

1.0

7.0000

3.5285

.388

-3.615

17.615

3.0

16.0000*

3.5285

.002

5.385

26.615

4.0

11.0000*

3.5285

.040

.385

21.615

3.0

1.0

-9.0000

3.5285

.128

-19.615

1.615

2.0

-16.0000*

3.5285

.002

-26.615

-5.385

4.0

-5.0000

3.5285

1.000

-15.615

5.615

4.0

1.0

-4.0000

3.5285

1.000

-14.615

6.615

2.0

-11.0000*

3.5285

.040

-21.615

-.385

3.0

5.0000

3.5285

1.000

-5.615

15.615

*.平均值差異在0.05

層級顯著。

给出了多重比较的结果,*表示该组均值差是是显著的。因此,从表中可以看出,第二组和第三组、第四组的销售量均值差是非常明显的,但是第三组与第四组的销售量均值差话相却不是很明显。另外,还可以得到每组之间均值差的标准误差、置信区间等信息。

平均值圖形

给出了各组的均值图。从图可以清楚地看到不同的施肥类型对应不同的销售量均

值。可见,第三组的销售量最低,且与其他两组的销售量均值相差较大,而第二组和和第三组之间的销售量均值差异不大,这个结果和多重比较的结果非常一致

二、1.实例内容:

某研究机构研究了3种动物饲料对4种品系小鼠体重增加的影响,数据如图下所示,变量a为饲料种类,变量b为鼠的品系,变量x为增重克数。

2.实例操作:

Step

01

打开对话框。

打开数据文件,选择菜单栏中的【分析】|【一般线性模型】|【单变量】命令,弹出【单变量】对话框,如图所示。

Step

02

选择观测变量。

在候选变量列表框中选择【体重】变量作为因变量,将其添加至【因变量】列表框中。

Step

03

选择因素变量。

选择【饲料类型】和和【小鼠品系】变量作为因素变量,将它们添加至【固固定因子】列表框中,如图所示。

Step

04选择多重比较。

单击【模型】按按钮,弹弹出【单变量:模型】对话框,如图5.23所示。选中【定制】单选按钮,在左侧列表框中选择“因因素a”和“因因素b”变量并移至【模型】列表框中。选择【构建项】选项组中【类型】下拉列表框中的【主效应】选项,再单击【继继续】按钮,返回主对话框。

Step

05其他选项选择。

单击【图】按钮,弹出图5.24所示【单变量:轮廓图】对话框。将因素b放入【单独的线条】框,将因素a放入【水平轴)】文本框,单击【添加】按钮,再单击【继续续】按钮,返回主对话框。

单击【事后比较】按钮,弹出图所示对话框。将因素a和因素b放入【下列各项的事后检验】列表框,比较方法选择LSD法。

单击【选项】按钮,弹出图5.26所示【单变量:选项】对话框。将因素a和因素b放入【显示下列各项的平均值】列表框,选中【比较主效应】复选框。选中【描述统计】复选框表示输出描述性统计量;选中【齐性检验】复选框表示输出方差齐性检验表。再单击【继续】按钮,返回主对话框。

Step

06

完成操作。

最后,单击【确确定】按钮,操作作完成。

3.实例结果及分析

(1)主体间效应检验表

表所示为主效应模型检验,结果可见校正模型统计量F=6.772、P=0.000,说明模型有统计学意义。因素a和因素b均有统计学意义,P=0.000、P=0.037,均小于0.05。

主旨間效果檢定

因變數:

体重

來源

第III

類平方和

df

平均值平方

F

顯著性

修正的模型

8929.625a

1785.925

6.772

.000

截距

167796.750

167796.750

636.304

.000

a

6487.875

3243.938

12.301

.000

b

2441.750

813.917

3.086

.037

錯誤

11075.625

263.705

總計

187802.000

校正後總數

20005.250

a.R

平方

=

.446(調整的R

平方

=

.380)

(2)成对比较表。

表所示为不同饲料类型两两比较结果,从Sig值(即P值)可见,饲料B与饲料C没有差异(p=0.117),其余均有差异,p<0.05。

成對比較

因變數:

体重

(I)

饲料类型

(J)

饲料类型

平均差異

(I-J)

標準錯誤

顯著性b

95%

差異的信賴區間b

下限

上限

A饲料

B饲料

18.750*

5.741

.002

7.163

30.337

C饲料

27.938*

5.741

.000

16.351

39.524

B饲料

A饲料

-18.750*

5.741

.002

-30.337

-7.163

C饲料

9.188

5.741

.117

-2.399

20.774

C饲料

A饲料

-27.938*

5.741

.000

-39.524

-16.351

B饲料

-9.188

5.741

.117

-20.774

2.399

根據估計的邊際平均值

*.平均值差異在.05

層級顯著。

b.調整多重比較:最小顯著差異(等同於未調整)。

(3)均值图

图所示为不同品系小鼠喂养不同饲料的体重增重的均值图。可见A饲料较好,B饲料和C饲料差异不大。

实验小结:

通过该实验,让我懂得了利用数学思想解决实际问题,很好的把数学运用到实际生活中,在今后的学习中我会再接再厉的。

教师评语:

1.实验结果及解释:(准确合理、较准确、不合理);占30%

2.实验步骤的完整度:(完整、中等、不完整);占30%

3.实验程序的正确性:(很好、较好、中等、较差、很差);占30%

4.卷面整洁度:(很好、较好、中等、较差、很差);占10%

评定等级:()

教师签名:

日期:

第五篇:数据分析实验报告册

《数据分析》

实验报告册

15-20 16 学年

目录

实验一 网上书店的数据库创建及其查询

实验 1-1 “响当当”网上书店的数据库创建

实验1-2 “响当当”网上书店库存、图书和会员信息查询

实验1-3 “响当当”网上书店会员分布和图书销售查询

实验二 企业销售数据的分类汇总分析

实验2-1 Northwind公司客户特征分析

实验2-2 “北风”贸易公司销售业绩观测板

实验三 餐饮公司经营数据时间序列预测

实验3-1 “美食佳”公司半成品年销售量预测

实验3-2 “美食佳”公司月管理费预测

实验3-3 “美食佳”华东分公司销售额趋势预测

实验3-4 “美食佳”公司会员卡发行量趋势预测

实验3-5 “美食佳”火锅连锁店原料采购成本预测

实验四 住房建筑许可证数量的回归分析

实验4-1 “家家有房”公司建筑许可证一元线性回归分析

实验4-2 “家家有房”公司建筑许可证一元非线性回归分析

实验4-3 “家家有房”公司建筑许可证多元线性回归分析

实验4-4 “家家有房”公司建筑许可证多元非线性回归分析

实验五 手机用户消费习惯聚类分析

实验六 新产品价格敏感度测试模型分析

实验一 网上书店的数据库创建及其查询

实验 1-1 “响当当”网上书店的数据库创建

实验类型:验证性

实验学时:2 实验目的:

• 理解数据库的概念;

• 理解关系(二维表)的概念以及关系数据库中数据的组织方式; • 了解数据库创建方法。

实验步骤:

这个实验我们没有直接做,只是了解了一下数据库的概念。

实验1-2 “响当当”网上书店库存、图书和会员信息查询

实验目的

• 理解odbc的概念;

• 掌握利用microsoft query进行数据查询的方法。

实验步骤:

1..建立odbc数据源:启动microsoft office query应用程序,在microsoft office query应用程序窗口中,执行“文件/新建”命令,出现 “选择数据源”对话框,单击“确定”按钮,出现“创建新数据源”对话框,按照要求做相应的操作。

选择数据源对话框

创建新数据源窗口

做图上所示的选择

odbc microsoft access安装对话框

选择数据库对话框

选择数据源对话框

2.查询设计1—低库存量图书信息查询:选择“bookstore”数据源,点击“确定”,进入“添加表”窗口,添加书表后,在“查询设计”窗口的“表”窗格中,分别双击“书”表中需要查询的“书名”、“isbn”、“库存量”等字段,执行“视图/条件”命令,在“条件”窗格的“条件字段”行的 实验小结:

因为我们没有尝试建立数据库,直接开始数据查询,所以实验时遇到了很多问题。比如我们在选择数据源时就遇到了麻烦,弄了半天才开始查询设计,而且不是很熟练,一直做了四五个查询设计才慢慢熟练起来。

实验思考:

1、在数据查询过程中,如果所选的某个表与其他表之间没有联系的话,会 产生什么问题?

答:所选的查询数据将会全部显示在查询窗口,与其它表的数据没有直接联系。这样就不能表现出表与表数据之间的关联性,数据也就失去赋予的意义。

2、若“响当当个”网上书店的某个会员了解自己最近2年的图书订购情况,请为他设计一个查询。

答:分别添加“书”、“会员”、“订单明细”和“订单”表,双击“书”表的“书名”、“会员”表的“姓名”和“订单明细”表的“订购数量”以及“订单”表的“订购日期”字段,在向查询条件窗口中输入某一会员姓名以及相应的订购日期.实验1-3 “响当当”网上书店会员分布和图书销售查询

实验目的

•掌握复杂的数据查询方法:多表查询、计算字段和汇总查询

实验步骤: 1.查询设计1—会员分布信息查询:添加“会员”表到查询设计窗口,在“查询设计”窗口的“表”窗格中,双击“会员”表的“城市”和“会员号”字段。然后双击“会员号”字段的列标,在“编辑列”对话框中输入列标“会员人数”,并选择汇总方式:“计数”,单击“确定”按钮后即可看到查询结果,其中显示了各城市的会员人数,再设置相应的条件,进行相应的查询。

选择汇总方式

查询结果

2.查询设计2—图书总订购量和总销售金额查询:添加“订单”、“订单明细”和“书”表。在“查询设计”窗口的“表”窗格中,双击“订单”表的“订购日期”、“订单明细”表的“订购数量”字段。另外还要构造一个计算字段“销售金额”,方法是直接在某空白列的列标中输入公式;在上面的字段中,“订购数量”和“销售金额”是汇总字段,分类字段是“订购年份”,双击“订购日期”列的列标,在编辑列对话框的字段项中输入公式“year(订购日期)”,在其中的列标项中输入“订购年份”然后分别双击“订购数量”和“订购数量*单价”字段的列标,在编辑列对话框的列标项中分别输入“总订购数量”和“总销售金额”字样,并在总计项中选择“求和”。

在“条件”窗格的“条件字段”行的

5.查询设计5—被订购图书的作者和出版社信息查询:添加“会员”、“订单”、“订单明细”、“书”、“作者”和“出版社”表。在表之间建立合适的联系。在“查询设计”窗口的“表”窗格中,双击“书”表的“书名”、“作者”表的“姓名”和“出版社”表的“出版社名称”字段。在条件窗格中添加关于订购日期和会员姓名的条件。可以查看到结果为会员“刘丹”在2007年共订购了7本图书。

实验小结:

实验1-3的实验比较难,但是经过前面的练习还是比之前快一点,不过还是遇到一些困难,比如查看到结果为会员“刘丹”在2007年共订购了几本书的查询设计就在输入指令时卡住了,经过几个同学讨论还是做出来了。一直到晚上天黑了才把一共十个实验做完。

实验思考:

1、在进行汇总查询的过程中,如果被选择的字段除了分类字段以外还包含了其他字段。

查询结果是否正确?为什么?请举例说明。

答:不正确,如果被选择的字段除了分类字段以外还包含了其他字段,那么query将把多余的字段自动作为分类字段。

2、“响当当”网上书店的管理人员想了解最近2年中那位作者的书是最畅销,请你设计一个查询找到相关作者。

答:查询近两年的总订购量。

实验二 企业销售数据的分类汇总分析

实验2-1 North wind公司客户特征分析

实验类型:验证性

实验学时:2 实验目的:

• 理解数据分类汇总在企业中的作用与意义; • 掌握数据透视表工具的基本分类汇总功能;

• 掌握建立分类汇总数据排行榜、生成时间序列、绘制praetor曲线图、计算各地区客户分布、统计各地区客户的平均销售额和大宗销售时间序列的方法和步骤。

实验步骤:

一、汇总客户销售额排行榜 为了汇总客户销售额的排行榜,首先要获得客户每笔销售的销售额、所购买产品的类别以及销售发生的时间,然后再利用数据透视表工具将销售额按照客户名称、产品类别和销售时间加以汇总。

步骤1:获取各客户每笔销售的销售额、销售产品的类别和时间。

在一张空白的工作表中,选择菜单“数据”→“数据透视表和数据透视图” →“外部数据源”,单击“获取数据按钮”,随后启动了Microsoft Query,选择所建立的连接到Northwind.mdb数据库的ODBC数据源——“NW”,并选择“确定”,选择“客户”表中的的“公司名称”、“订单”表中的“订购日期”、以及“类别”表中“类别名称”,随后Query弹出窗口“„查询向导‟无法继续,因为该表格无法链接到您的查询中。您必须在Microsoft Query 中的表格之间拖动字段,人工链接。”这是因为类别表无法同订单表建立联系。单击“确定”。

要查询销售额,需要在Query中首先增加“订单明细”表,利用其中的“单价”、“数量”与“折扣”字段中的数据,才能计算销售额。在数据窗格中,在一个空白字段的名称处输入公式:“订单明细.单价*数量*(1-折扣)”。键入回车后就可以计算出销售额。见图2-7。

随后,将“产品”表也添加到查询中,虽然查询结果中并不包括任何“产品”表中的字段,但是该表的能够建立“类别”表与“订单明细”表之间的联系(“订单明细”表指明所订购产品的ID,“产品”表指明该产品属于哪一个类别)。此时,查询中的表都建立了正确的联系,并在查询结果中包括了汇总所需要的数据。如图2-7。

图2-7 查询各客户每笔销售的销售额、销售产品的类别和时间

将计算销售额的字段的列标命名为“销售额”。选择Query菜单中的“文件”→“将数据返回Microsoft Office Excel”,此时Query已经关闭,我们的操作对象回到了Excel,单击“下一步”,指定位置在“现有工作表”,单元格A3,单击完成。

步骤2:汇总客户销售额排行榜,并排序。

此时,在工作表的区域A1:G16的位置,出现了数据透视表的框架,数据透视表的浮动工具栏和数据透视表的字段列表。

为了能对销售的时间——“订购日期”进行组合以获得各年的销售额,首先将“订购日期”拖至行域,将“销售额”拖至数据域,“类别名称”拖至列域,得到如图2-8所示的数据透视表。

图2-8 按订购日期与类别汇总销售额

为了能将销售额按照汇总,将光标停留在“订购日期”下方的任何单元格,右击鼠标,选择“组合及显示明细数据”→“组合”,选择组合的步长为年。

然后将单元格A4当中的字段名称“订购日期”改为“订购年”,将它推至页域,将字段列表中的“公司名称”拖到行域,让透视表按照列总计,从大到小排列,就得到了如图2-9所示的数据透视表。它能够反映了三年或者各,各个客户的销售额的大小,以及排列名词的先后,还能够观察到各客户订购的产品类别和该类别的销售额。

图2-9 按照订购年、客户公司名称、类别名称汇总的销售额排行榜

二、汇总前三大客户各月销售额,并绘制图形

在前一部分实验的基础上,选择前三个最重要的客户,进一步观察购买情况,他们购买情况的变化将对公司整体销售业绩产生很大影响。所以,将前三大客户的销售数据加以展开,按月显示其销售的变化。

步骤1:将实验要求1所汇总的数据透视表复制到新的工作表。步骤2:利用数据透视表,汇总前三大客户的销售额时间序列。

按照实验要求1汇总的数据透视表,反映出“高上补习班、正人资源、大钰贸易”是公司的前三大客户。点开“公司名称”字段,选中这三个公司名称,并拖到列域。

将列域的字段“类别名称”拖出数据透视表。将页域的字段“订购年”旋转到行域,将其重新组合。选择组合的步长为“月”和“年”,把字段名称修改为“订购年”与“订购月”。光标停留在数据表中任何单元格,右击鼠标,选择“表格选项”,将“对于空数据项显示”设置为“0”,即当该单元格汇总出的数据值为空时,在数据透视表中将其显示为0。此时得到的前三大客户销售额时间序列见图2-10。

图2-10 Northwind公司前三大客户销售额时间序列

步骤3:绘制前三大客户销售额时间序列图。

光标停留在数据透视表中,选择菜单“插入”→“图表”,在当前工作簿自动插入一张图表。选择菜单“图表”→“位置”,将该图表调整到与数据透视表位于同一张工作表。选择菜单“图表”→“图表类型”,选择“折线图”→“数据点折线图”。随后,再对该图的大小、外观以及数据系列的格式加以调整,就能得到Northwind公司前三大客户销售额时间序列图,如图2-1所示。

三、绘制按照客户汇总的客户数与销售额帕累托曲线

步骤1:查询“订购日期”、客户的“公司名称”与“销售额”等数据。

在Excel的空白工作表中,选择菜单“数据”→“数据透视表与数据透视图” →“外部数据源”→“获取数据”,利用Microsoft Query,从“订单”表、“订单明细”表与“客户”表中查询 “订购日期”、客户的“公司名称”与“销售额”(销售额=订单明细.单价*数量*(1-折扣))等字段,将所查询数据返回Excel。

步骤2:利用查询的数据,制作数据透视表。

从数据透视表的字段列表中,选择“订购日期”,拖至行域,将“销售额”拖至数据域。将“订购日期”字段按年组合,然后拖至页域,将“公司名称”拖至行域,按照销售额从大到小的顺序排列,得到按照和客户公司名称汇总的数据透视表,如图2-11。

图2-11 Northwind公司按照汇总的各客户销售额

步骤3:利用数据透视表的数据,计算客户数累计百分比与客户销售额累计百分比,绘制帕累托曲线。

在区域D4:G4依次输入说明文字,“公司名称”、“ 客户百分比”、“ 客户数累计百分比 ”、“销售额累积百分比”。按照图2-12输入公式,得到如图2-13所示的汇总数据。

图2-12 Northwind公司按照汇总客户数累计百分比和销售额累计百分比公式

图2-13 Northwind公司按照汇总客户数累计百分比和销售额累计百分比

区域F5:F93汇总累计的客户数,即到该客户为止,已有客户数占到总客户数的百分比。区域G5:G93汇总了到该客户为止,已有客户实现的销售额占总销售额的百分比。

选中区域F4:G93的数据,绘制无数据点散点图,得到如图2-14所示图形。

图2-14 客户数与销售额的帕累托初步曲线

步骤4:在曲线上添加代表20%客户数的垂直参考线。在I5:I7单元格输入“20%”,在J5与J7单元格输入“0”和“120%”,在J6单元格输入公式:“=INDEX(G5:G93,MATCH(I5,F5:F93,1),1)”,即从客户数累计百分比中,查找到20%的客户数在

图2-15 Northwind公司客户数与销售额帕累托曲线垂直参考线数据

最后公司客户销售额与客户数parato曲线呈现如图所示:

图2-2 公司客户销售额与客户数parato曲线

四、绘制按照订单汇总的销售额与销售次数帕累托曲线 步骤1:查询“订购日期”、“订单ID”与“销售额”等数据。

在Excel的空白工作表中,选择菜单“数据”→“数据透视表与数据透视图” →“外部数据源”→“获取数据”,利用Microsoft Query,从“订单”表和“订单明细”表中查询 “订购日期”、“订单ID”与“销售额”(销售额=订单明细.单价*数量*(1-折扣))等字段,将查询数据返回Excel。

步骤2:利用查询的数据,制作数据透视表。

从数据透视表的字段列表中,选择“订购日期”,拖至行域,将“销售额”拖至数据域。将“订购日期”字段按年组合,拖至页域,将“订单ID”拖至行域,按照销售额从大到小的顺序排列,得到按照和订单ID汇总的数据透视表,如图2-16。

图2-16 Northwind公司按照汇总各订单销售额

步骤3:利用数据透视表的数据,计算客户数累计百分比与销售额累计百分比,绘制帕累托曲线。

在区域D4:G4依次输入说明文字,“销售次数百分比”、“ 销售次数累计百分比”、“ 销售额累计百分比 ”。按照图2-17输入公式,得到如图2-18所示的汇总数据。

图2-17 Northwind公司按照汇总客户数累计百分比和销售额累计百分比公式

图2-18 Northwind公司按照汇总客户数累计百分比和销售额累计百分比

区域E5:E834计算单次销售占总销售次数(即订单数)的百分比,区域F5:F834汇总累计销售次数占总销售次数的百分比,即到该订单为止,已有订单数占到总订单数的百分比。区域G5:G834汇总到该订单为止,已有订单实现的销售额占总销售额的百分比。

选中区域F4:G834的数据,绘制无数据点散点图,得到如图2-19图形。

图2-19 销售次数与销售额的帕累托初步曲线

步骤4:在曲线上添加代表20%客户数的垂直参考线。

在I5:I7单元格输入“20%”,在J5与J7单元格输入“0”和“120%”,在J6单元格输入公式:“=INDEX(G5:G834,MATCH(I5,F5:F G834,1),1)”,即从销售次数累计百分比中,查找20%的销售次数在

图2-3 norwthwind公司销售次数与销售额parato曲线

五、汇总各地区客户分布

步骤1:查询“公司名称”与“地区”字段等数据。

将Excel一张空白工作表命名为“5.各地区客户分布”。选择菜单“数据”→“数据透视表与数据透视图” →“外部数据源”→“获取数据”,利用Microsoft Query,从“客户”表中查询 “公司名称”与“地区”字段,然后将所查询的数据返回Excel。

步骤2:利用查询的数据,制作数据透视表。

从数据透视表的字段列表中,选择“地区”,拖至行域,选择“公司名称”,拖至数据域,得到按照地区汇总的客户数的数据透视表,如图2-20。

图2-20 按照地区汇总客户数的数据透视表

步骤3:利用数据透视表的数据,制作数据透视图。光标停留在数据透视表中,选择菜单“插入”→“图表”,在新建工作表中建立数据透视图,改变该图表位置,将其调整到“5.各地区客户分布”工作表中,得到了如图2-4所示的图形。

图2-4 公司各地区客户的分布

六、绘制各地区平均销售额及销售额占总销售额百分比 步骤1:查询“地区”与“销售额”等数据。

在Excel的空白工作表中,选择菜单“数据”→“数据透视表与数据透视图” →“外部数据源”→“获取数据”,利用Microsoft Query,选择数据源,从“客户”、和“订单明细”表中,查询客户的“地区”与“销售额”(销售额=订单明细.单价*数量*(1-折扣))等字段,将查询数据返回Excel。查询时应包括“订单”表,该表能建立 “客户”表和“订单明细”表之间的联系。

步骤2:利用查询的数据,制作数据透视表。

从数据透视表的字段列表中,选择“地区”,拖至行域,将“销售额”拖至数据域,得到按照地区汇总的销售额的数据透视表,如图2-21。

图2-21 Northwind公司按照地区汇总的销售额

步骤3:利用数据透视表的数据,计算各地区平均销售额与销售额占总销售额的百分比。在区域D4:G4依次输入说明文字:“地区”、“ 客户数 ”、“平均销售额”与“ 销售额占总额百分比”。按照图2-22输入公式,得到如图2-23所示的汇总数据。

图2-22 Northwind公司按照地区汇总平均销售额、销售额占总销售额百分比公式

图2-23 Northwind公司按照地区汇总平均销售额、销售额占总销售额百分比

区域E5:E10存放各地区的客户数,区域F5:F10计算各地区平均销售额,区域G5:G10计算各地区销售额占总销售额的百分比。利用区域D5:D10与区域F5:G10中的数据,绘制柱型图。由于一个数据系列是平均销售额,一个数据系列是百分比,两个系列数值相差悬殊,所以在图2-24中,只能观察到一个数据系列的柱型,另一个系列的柱型贴近“0”,无法观察到。选中代表百分比的系列(选中平均销售额的系列,移动上下箭头,直到选中代表百分比的系列),选择菜单“格式”→“数据系列格式” →“坐标轴”→“次坐标轴”,将代表百分比的系列对应到次坐标轴。

图2-24 Northwind公司按照地区汇总平均销售额、销售额占总销售额百分比图

观察该图形,可以发现 “华东”与“西南”地区,客户的平均销售额比其他地区高,说明这两个地区大客户的销售情况比较好。华北地区虽然销售额占总销售额的百分比最高,是Northwind公司最重要的市场,但该地区大客户的销售情况并不理想,平均销售额并不高。今后该地区应更注重改善大客户销售情况。

七、绘制大宗销售的销售额时间序列。

步骤1:查询“公司名称 ”、“订单ID”、“ 订购日期”与“ 销售额”等数据。

将Excel的空白工作表命名为“7.大宗销售数据”,选择菜单“数据”→“获取外部数据” →“外部数据源”→“获取数据”,利用Microsoft Query,从“客户”表、“订单”表和“订单明细”表中,查询“公司名称 ”、“订单ID”、“ 订购日期”与“ 销售额”(销售额=订单明细.单价*数量*(1-折扣))等字段,将查询数据返回Excel,存放在区域A1:D831。

步骤2:挑选出销售额超过2000元的订单。

在区域F1:F2,按照图2-25,输入筛选的条件。利用Excel高级筛选功能,挑选出满足条件的记录,存放在区域H1:K186中。

图2-25 Northwind公司2000元以上销售额的订单的销售情况

步骤3:利用挑选出的订单,制作数据透视表。利用区域H1:K186中的数据,制作数据透视表。从数据透视表的字段列表中,选择“订购日期”,拖至行域,将“销售额”拖至数据域,将“订购日期”字段按年组合,然后拖至页域,将“公司名称”拖至页域,规定行域字段必须“显示空数据项”,得到如图2-26所示的数据透视表。

图2-26 Northwind公司大宗销售的时间序列数据透视表

步骤4:绘制大宗销售的时间序列图形。

为了让图形能够正确反映销售情况,去掉没有发生销售的时间点,如96年1月到96年6月,我们在数据透视表外面,另准备作图数据。按照图2-27,在区域E12:E33输入从96年7月到98年4月的时间(98年5月数据不完整,故不包括在时间序列内),在单元格F12输入公式:“=C12”,并复制到区域F13:F33。

图2-27 Northwind公司大宗销售的时间序列作图数据

利用区域E11:F33中的数据,制作折线图,将图表X轴的类型改为分类轴。“公司名称”选择“全部”,在图形上尝试添加恰当的趋势线,显示趋势线的方程与R2,并前推两个周期,得到的时间序列图形如图2-28。从该图形上,可以大致了解大宗销售的变化趋势,对未来的情况做初步估计。

图2-28 Northwind公司大宗销售的时间序列图

实验小结:

数据透视表分类汇总的两种方法:

1、先将数据导入Excel成为数据清单,利用数据透视表汇总对数据清单进行汇总

2、利用数据透视表直接从数据库中查询、并汇总数据。数据透视表功能,使用最方便,可以把汇总表“旋转”,从不同的“角度”查看数据,还可以筛选数据、合并数据、展开详细数据、或者选择部分数据加以查看。

实验思考:

1、你还能从哪些方面对客户的销售数据进行分析,帮助该公司促进销售或者为客户提供更好的服务?

答:使用Northwind公司的销售数据,生成净销售额时间序列,创建可以调节的产品列表框,并绘制特定产品销售金额时间序列的图形。观测每种产品在不同年份不同月份的销售情况,对下阶段的销售做出预测。

2、帕累托曲线可以帮助分析投入与产出之间的关系,它还能帮助该公司进哪些方面的分析?

答:①带来80%利润的20%的顾客在哪里,并且留住他们。②销售量达80%的20%产品是哪些,找出来好好包装开发。③销售量达80%的20%城市在哪里,并且维护好。

实验三 餐饮公司经营数据时间序列预测

实验3-1 “美食佳”公司半成品年销售量预测

实验类型:验证性

实验学时:2 实验目的: • 理解数平滑预测法的概念;

• 掌握在excel中建立指数平滑预测模型的方法; • 掌握寻找最优平滑常数的各种方法。

实验步骤:

一、运用“数据分析”工具进行指数平滑预测 步骤1:确定时间序列的类型。

如图3-1所示在单元格a1:b21中布置好公司从1987-2006年的销售量数据。然后,绘制公司从1987年至2006年共20年的销售量折线图,结果如图3-2所示,既没有趋势成分也没有季节成分,呈现出的是围绕一个水平上下波动的时间序列,说明适合用指数平滑法或移动平均法进行预测。本实验的数据是数据,建议采用指数平滑预测法。

图3-1 公司从1987-2006年的销售量数据

图3-2 公司从1987-2006年的销售量折线图

步骤2:利用“数据分析”工具中的指数平滑功能进行预测。

在“工具”菜单中选择“加载宏”,在随后弹出的“加载宏”对话框中选择“分析工具库”,然后单击“确定”按钮,将会在“工具”菜单下出现“数据分析”选项。在“工具”菜单中选择“数据分析”,在出现的“数据分析”对话框中选择“指数平滑”,出现如图3-3所示的对话框。

图3-3 指数平滑分析的参数设置

在“指数平滑”对话框中,在“输入区域”输入“b2:b21”单元格,“阻尼系数”输入“0.75”(注:阻尼系数=1-平滑常数),在“输出区域”输入“c2”单元格,单击“确定”按钮,将会看到如图3-4中单元格c2:c21的输出结果。

将单元格c21往下复制,便得到2007年的指数平滑预测值7.96。

图3-4 指数平滑预测结果

二、运用指数平滑公式进行预测 步骤1:利用公式

计算指数平滑预测值。

如图3-5,在单元格f1中输入平滑常数0.25,在单元格c2中输入公式:“=b2”,作为

三、寻找最优的平滑常数 步骤1:计算均方误差。

如图3-5在单元格f2中输入公式:“=average((b2:b21-c2:c21)^2)”,作为数组运算,需要同时按Ctrl+Shift+Enter三个键作为输入结束,计算均方误差MSE。步骤2:利用模拟运算表及查找引用函数功能,寻找最优平滑常数。

如图3-7在单元格e7:e24中给出不同的平滑常数(大于0小于1),在单元格f6中输入公式:“=f2”,选定单元格e6:f24,在“数据”菜单中选择“模拟运算表”,在弹出的对话框中做如图3-8所示的参数设置,利用一维模拟运算表功能计算不同平滑常数下的mse值,见图3-7结果。

图3-7 模拟运算表辅助查找最优平滑常数

图3-8 模拟运算表对话框参数设置

在单元格f4中输入公式:“=index(e7:e24,match(min(f7:f24),f7:f24,0))”,找到最优平滑常数为0.35。然后,根据最优平滑常数0.35(将此值代入单元格f1中),2007年的预测值为7.94。

步骤3:利用规划求解功能,寻找最优平滑常数。规划求解工具是一个从函数值所要达到的目标出发,反过来确定为达到这个目标,各自变量应取什么值的工具。

在“工具”菜单中选择“规划求解”,在弹出的对话框中做如图3-9所示的参数设置,然后单击“求解”按钮,得到如图3-10所示的规划求解结果,其中可变单元格f2中显示最优平滑常数为0.37。根据最优平滑常数0.37,2007年的预测值为7.93。

图3-9 规划求解参数设置

图3-10 规划求解的结果

以上两种方法所寻找到的平滑常数都是基于实际销售量与预测销售量的均方误差极小,从理论上证明了所获得的平滑常数是最优的。

实验思考:

1.为什么用模拟运算表加查找引用函数功能,得到的最优平滑常数(0.35),与用规划求解功能得到的结果(0.37)不一样?

答:用模拟运算表加查找引用函数功能得到的最优平滑常数(0.35)是根据设定的间隔求解,结果不是很准确。而规划求解功能得到的结果(0.37)是精确结果。

2.可否调整模拟运算表的输入数据间隔,再试一试,结果会如何?

答:在实验3-1中,调整模拟运算表的输入数据间隔,其结果不变。因为模拟运算表只是将数据代入变量中来求得对应的值,所得到的值与数据的间隔无关。

实验3-2 “美食佳”公司月管理费预测

实验目的:

• 理解移动平均预测法的概念;

• 掌握在excel中建立移动平均模型的方法; • 掌握寻找最优移动平均跨度的各种方法。

实验步骤:

一、运用“数据分析”工具进行移动平均预测 步骤1:确定时间序列的类型。

如图3-11所示在单元格a1:c19中布置好公司从2006年1月至2007年6月的数据。

绘制公司从2006年1月至2007年6月共18个月的管理费用折线图,结果如图3-12所示,既没有趋势成分也没有季节成分,呈现出的是围绕一个水平上下波动的时间序列,说明适合用指数平滑法或移动平均法进行预测。本实验的数据是月度数据,建议采用移动平均预测法。

图3-11 公司从2006年1月至2007年6月的管理费数据

图3-12 公司从2006年1月至2007年6月的管理费用折线图

步骤2:利用“数据分析”工具的移动平均功能进行预测。在“工具”菜单中选择“数据分析”,在出现的“数据分析”对话框中选择“移动平均”,出现如图3-13所示的对话框。

在“移动平均”对话框中,在“输入区域”输入“c2:c19”单元格,“间隔”输入“3”(注:移动平均跨度为3),在“输出区域”输入“d3”单元格,单击“确定”按钮,将会看到如图3-14中单元格d5:d20的输出结果。

如单元格d20所示,2007年7月公司管理费用的移动平均预测值为20.3万元。

图3-13 移动平均对话框参数设置

图3-14 移动平均预测结果

二、运用移动平均公式进行预测

步骤1:利用average()函数计算移动平均预测值。

如图3-15,在单元格g1中输入移动平均跨度3,在单元格d5中输入移动平均模型预测公式:“=average(c2:c4)”。

将单元格d5往下复制,便得到2007年7月的移动平均预测值20.3。

图3-15平均值函数的计算结果

步骤2:绘制移动平均预测图。

利用单元格c2:d20中的数据绘制如图3-16所示的公司18个月的管理费用及移动平均预测图。

图3-16 公司18个月的管理费用及移动平均预测图

通过以上实验能够检验,运用“数据分析”工具和移动平均公式进行移动平均预测的预测结果是一致的。“美食佳”公司2007年7月的管理费移动平均预测值为20.3,此预测结果是基于移动平均跨度为3个月所获得的。对没有先期经验的人来说,怎样选择移动平均跨度呢?又怎么判断所选的移动平均跨度是最优的呢?下面的实验步骤将指导我们掌握寻找最优移动平均跨度的不同方法。

三、寻找最优的移动平均跨度 步骤1:计算均方误差。

此处用到两个函数:sumxmy2()函数和count()函数。sumxmy2()函数的功能是返回两数组中对应数值之差的平方和,它需要两个参数,一个参数是 图3-18结果。

图3-18模拟运算表辅助查找最优移动平均跨度

图3-19 模拟运算表参数设置

在单元格g4中输入公式:“=index(f7:f15,match(min(g7:g15),g7:g15,0))”,找到最优移动平均跨度为5。根据最优移动平均跨度5(将此值代入单元格g1中),2007年7月的预测值为20.2。

实验思考

1.可否利用规划求解功能,寻找最优的移动平均跨度?

答:在实验3-2中,无法利用规划求解功能寻找最优的移动平均刻度。因为求MSE所用的公式为“=SUMXMY2(C2:C19,D2:D19)/COUNT(D2:D19)”与移动平均刻度值所在的G1单元格无直接联系。

2.excel提供的移动平均趋势线功能也可进行移动平均预测,但趋势线方法与本实验所介绍的方法有何不同?

答:Excel提供的移动平均趋势线方法与本实验所介绍的方法与本实验所介绍方法的区别在于趋势线的作用是对已知的一堆数据作回归分析,以找到一个可以直接计算的方程式并对其他任意未经测量的数值进行计算。趋势线方法考虑了大量可能的结果。

实验3-3 “美食佳”华东分公司销售额趋势预测 实验类型:验证性

实验学时:2 实验目的:

• 理解趋势预测法的概念;

• 掌握在excel中建立线性趋势预测模型的方法; • 掌握寻找线性趋势模型参数的各种方法; • 掌握线性趋势值预测的不同方法。

实验步骤:

步骤1:确定时间序列的类型。

如图3-20所示在单元格a1:c12中布置好华东分公司从1996年至2006年的销售额数据。绘制华东分公司从1996年至2006年共11年的销售额折线图,结果如图3-21所示,具有较明显的线性趋势成分,呈上升趋势,说明适合用线性趋势法进行预测。

图3-20 华东分公司从1996年至2006年的销售额数据

图3-21 华东分公司从1996年至2006年的销售额折线图

步骤2:添加线性趋势线。

如图3-22所示,在图中选中数据系列,右键菜单中选择“添加趋势线”,出现“添加趋势线”对话框。

如图3-23所示,在“添加趋势线”对话框的“类型”中选择“线性”。

如图3-24所示,在“添加趋势线”对话框的“选项”中选择“显示公式”和“显示r平方值”,得到如图3-25的结果。

图3-22 选用添加趋势线功能

图3-23 添加趋势线对话框

图3-24 添加趋势线的选项对话框

图3-25 华东分公司销售额与和线性趋势线

步骤3:用趋势线前推法大致预测线性趋势值。

选定线性趋势线,右键菜单中选择“趋势线格式”,出现如图3-26的“趋势线格式”对话框。

如图3-26所示,在“趋势线格式”对话框中选定“选项”,将趋势预测前推1周期,得到如图3-27所示的大致预测结果。

由图3-27中的趋势线可见,公司2007年的销售额预测值约为1000万元。

图3-26 趋势预测前推1周期设置

图3-27 趋势预测前推1周期的大致预测结果

步骤4:用方程或函数准确预测线性趋势值。

根据得到的线性趋势方程公式y=11.473x+861.98,如图3-28所示,在单元格c13中输入公式:“=11.473*a13+861.98”,即将x=12(2007年为

图3-29 带预测点的销售额线性趋势预测图

实验思考

1.本实验的几张图中,x轴是“分类”还是“自动”? 答:本实验(实验3-3)中,X轴是自动。

2.预测点数据如果作为新数据系列添加到图形中,结果与图3-29有何不同?

答:实验3-3中,预测点数据如果作为新数据系列添加到图形中,结果与图3-29相比,预测部分的值将是一条直线。

3.为什么预测值一定在趋势线的延伸线上?

答:预测值一定在趋势线上的原因是预测值是依据趋势线作出来的。4.若要预测公司2008年的全国销售额,可以怎么做?若要预测公司2009年、2010年、甚至更远年份的销售额,会有什么问题?

答:若要预测2008年的全国销售额,可依据2007年的预测值来作。但若要预测更远年份的销售额,则不能以之为基础由趋势线函数进行预测,因为彼时销售额呈线性增长,与客观事实不符。

5.除了本实验中介绍的添加趋势线方法可以找到线性趋势预测模型的参数外,还可以用哪些方法找到线性趋势预测模型y=a+bx中的参数 a和b。

答:还可用回归方法找到Y=a+bX中参数a,b的值。

实验3-4 “美食佳”公司会员卡发行量趋势预测

实验类型:验证性

实验学时:2 实验目的:

• 理解非线性趋势预测法的概念;

• 掌握在excel中建立非线性趋势预测模型的方法; • 掌握非线性趋势值预测的方法。

预测公司2007年7月会员卡的发行量。

实验步骤:

步骤1:确定时间序列的类型。

如图3-30所示在单元格a1:c15中布置好公司从2006年5月至2007年6月的会员卡发行数据。

绘制公司从2006年5月至2007年6月共14个月的会员卡发行量的折线图,结果如图3-31所示,具有较明显的非线性趋势成分,说明适合用非线性趋势法进行预测。从曲线的形状看,它先上升较快后上升较慢,符合对数曲线的特征,因此我们可以选用对数趋势模型进行预测。

图3-30 2006年5月至2007年6月会员卡发行量数据

图3-31 2006年5月至2007年6月会员卡发行量的折线图

步骤2:添加非线性趋势线。

如图3-32所示,在图中选中数据系列,右键菜单中选择“添加趋势线”,出现“添加趋势线”对话框。

如图3-33所示,在“添加趋势线”对话框的“类型”中选择“对数”。

如图3-34所示,在“添加趋势线”对话框的“选项”中选中“显示公式”和“显示r平方值”,得到如图3-35的结果。

图3-32 选择添加趋势线功能

图3-33 添加趋势线对话框

图3-34 添加趋势线选项对话框

图3-35 2006年5月至2007年6月会员卡发行量和对数趋势线

步骤3:趋势线前推法大致预测非线性趋势值。

选定对数趋势线,右键菜单中选择“趋势线格式”,出现如图3-36的“趋势线格式”对话框。

如图3-36所示,在“趋势线格式”对话框中选定“选项”,将趋势预测前推1周期,得到如图3-37所示的大致预测结果。

由图3-37中的趋势线可见,公司2007年7月的会员卡发行量预测值约为25万张。

图3-36 趋势预测前推1周期设置

图3-37 趋势预测前推1周期的大致预测结果

步骤4:用方程或函数准确预测非线性趋势值。根据得到的方程公式y=7.7785ln(x)+3.7651,如图3-38所示,在单元格c16中输入公式:“=7.7785*ln(a16)+3.7651”,即将x=15(2007年7月为 规划求解法找到对数趋势预测模型y=a+bln(x)中的参数a和b?

答:还可用回归方法找到Y=a+bX中参数a,b的值。

实验3-5 “美食佳”火锅连锁店原料采购成本预测 实验目的:

• 理解季节指数的概念; • 掌握季节指数预测方法。

实验步骤:

步骤1:确定时间序列的类型。

如图3-40所示在单元格a1:c17中布置好公司从2003年

图3-42 4年同期的原材料采购成本折线图

步骤2:计算季节指数。

一年有4个季度,所以以4为移动平均跨度,计算移动平均数,其结果应该对应放在每4个季度的中间位置。但当移动平均跨度为4时,没有中间季度位置可放,因此只能放在

图3-44 中心化后的原材料采购成本移动平均数

平均季节指数应等于1,因此4个季度的季节指数总和必须等于4。如果不满足这一点,则应对季节指数进行调整。方法是用每一个季节指数除以未调整的季节指数之

和再乘以季度指数总和4。如图3-43中单元格i6所示,未调整前的季节指数之和为3.9852,所以需要调整。在单元格j2中输入公式:“=i2/$i$6*4”,往下复制到j3:j5,得到调整后的季节指数。

步骤3: 消除季节影响。

如图3-45所示,将调整后的季节指数复制到E列,分别对应2003-2007年的4个季度。

图3-45 消除季节影响后的原材料采购成本

在单元格F2中输入公式:“=D2/E2”,将公式复制到单元格F3:F17中,得到消除季节影响后的结果。

利用单元格F2:F17中的数据绘制公司从2003年 图3-46 消除季节影响后的原材料采购成本及趋势线

步骤4:计算预测值。

如图3-47中G列所示,利用FORECAST()函数计算线性趋势预测值。

图3-47 趋势预测值和季节预测值的计算

在单元格H2中输入公式:“=G2*E2”,将公式复制到单元格H3:H21中,即在线性趋势预测值的基础上乘以调整后的季节指数得到最终的季节预测值。公司2007年1至4季度的采购成本预测值分别为73.0、20.9、13.8、154.9。

根据D列的原始采购成本数据和H列的季度预测值数据,作折线图,结果如图3-48所示。

图3-48 2003-2004年原材料采购成本及2007年4个季度的原材料采购成本预测值

实验思考

1.图3-47中的“序号”一列有什么用?

答:图3-47中“序号”一列的作用是为趋势线公式的获得提供依据(作为自变量X)。2.计算趋势预测值时,若不用forcast()函数,还可以有什么方法?请至少用两种方法试试看。

答:计算趋势预测值还可用移动平均预测法、指数平滑预测法、一元线性回归分析模型等。

3.季节指数模型是否只能用于季节数据的预测?若是、月度、甚至周数据,可以用季节指数模型吗?

答:季节指数模型不是只能用于季节数据的预测,、月度、周数据等在某些情况下均能用季节指数模型。

实验总结: 此次实验中学习了指数平滑预测法、移动平均预测法、趋势预测法、非线性趋势预测法、季节指数的概念,计算趋势预测值还可用移动平均预测法、指数平滑预测法、一元线性回归分析模型等。实验不难,关键要会分析和辨别使用何种分析方法。

实验四 住房建筑许可证数量的回归分析

实验4-1 “家家有房”公司建筑许可证一元线性回归分析

实验目的

• 理解一元线性回归分析的概念;

• 针对不同的问题,能够建立适当的一元线性回归模型; • 掌握内建函数slope()、intercept()与linest()的用法;

• 掌握用规划求解法、添加线性趋势线法、回归分析报告法确定线性回归方程的系数; • 给定自变量的情况下,根据线性回归模型预测因变量的值。

实验步骤:

步骤1:确定因变量与自变量并输入观测值。

根据实验要求,我们确定因变量为建筑许可证的颁发数量,自变量为人口密度,并将数据合理的布置在excel工作表的单元格a1:b19中,以备建模使用。

步骤2:绘制因变量与自变量关系散点图。

利用工作表的数据,以每平方公里的人口密度为x值,建筑许可证的颁发数量为y值,绘制xy散点图,如图4-1所示。从这个散点图可以看出每平方公里的人口密度与建筑许可证的颁发数量之间存在着大体上的线性依赖关系。

图4-1建筑许可证的颁发数量与每平方公里的人口密度散点图

步骤3:求出回归系数a、b的取值,计算判定系数R2,并进行预测。

excel提供了几种不同的工具,包括规划求解工具,intercept()、slope()与linest()等内建函数,在散点图中添加趋势线和趋势线方程以及生成回归分析报告等方法来确定回归系数a和b。我们这里介绍利用规划求解的方法来求解回归系数。

步骤4:假定回归系数的值,建立线性回归模型。

假定回归系数的值为a=1,b=1并将之放在单元格f2:f3中。用回归直线方程y=a+bx以及每平方公里的人口密度来计算建筑许可证的颁发数量预测值,放在单元格c2中,即在单元c2中输入公式“=$f$2+$f$3*a2”,并将此公式复制到c3:c19中,得到建筑许可证的颁发

数量预测值。在单元格f5中计算建筑许可证的颁发数量观测值与预测值的均方误差mse,即在单元格f5中输入公式“{=average((c2:c19-b2:b19)^2)}”(注:其中的花括号不是直接输入,是将所有内容输入完后按住ctrl+shift键后再按回车键生成的)。如图4-2所示:

图4-2 回归参数求解前的模型

步骤5:启动规划求解工具,确定模型最优参数。

在如图4-3的“规划求解参数”对话框中将目标单元格设为$f$5,使其等于最小值,将可变单元格设为$f$2:$f$3,无须设置任何约束条件即可直接求解,保存规划求解结果。注意规划求解受到迭代次数和精度的限制,本例需启用8次规划求解工具进行重复运算才能得到满意的精度,即

图4-4 回归参数求解后的模型

根据上述回归方程,如果任意给定人口密度(7000),即可预测出建筑许可证的颁发数量(14655.287),如图4-5所示。

实验思考

1.除了用规划求解的方法外,还可以哪些其它方法求出建筑许可证数量与每平方里人口密度之间关系的回归方程y=a+bx的系数,请用其它方法求得系数,并检验与实验4-1所获得的系数是否一致。

答:除用规划求解额方法外,还可以利用添加趋势线的方法获得回归方程Y=a+bX的系数。用规划求解方法获得的回归方程Y=a+bX的系数中a的值为-23900.10788,b的值为5.500026742;而用添加趋势线的方法获得的a的值为-23901,,b的值为5.5001,在误差允许的范围内,可认为他们的系数一致。

2.如果每平方公里的人口密度与建筑许可证数量之间是非线性关系,该如何选择非线性模型,并针对任意给定每平方公里的人口密度,预测建筑许可证的颁发数量。

答:若每平方公里的人口密度与建筑许可证数量之间是非线性关系,可利用添加趋势线的方法来进行检验,找出每一种可能的非线性模型的均方误差MSE,选择其中最小的一项作为最佳的非线性模型。然后根据非线性模型的公式,带入相应参数后即可预测建筑许可证的颁发数量。

3.根据拟合优度,进一步分析是否有其他非线性回归模型,更适合人口密度与建筑许可证数量的相关关系。

答:根据拟合优度对其他非线性回归模型进行分析,暂未找到更适合人口密度与建筑许可证数量的相关关系。

实验4-2 “家家有房”公司建筑许可证一元非线性回归分析

实验目的

• 理解一元非线性回归分析的概念;

• 针对不同的问题,能够建立适当的一元非线性回归模型;

• 掌握用规划求解法、添加非线性趋势线法、变换法确定非线性回归方程的系数; • 在给定自变量的情况下,根据非线性回归模型预测因变量的值。

实验步骤:

步骤1:确定因变量与自变量。

根据实验要求,我们确定因变量为建筑许可证的颁发数量,自变量为自由房屋的均值。并将数据合理的布置在excel工作表的单元格a1:b19中,以备建模使用。

步骤2:选择合适的回归方程。

利用步骤1中准备的数据画出散点图,如图4-5所示,通过散点图选择合适的拟合函数,建立含未知参数的方程。

图4-5 建筑许可证的颁发数量与自由房屋的均值散点图

仔细观察散点图,发现建筑许可证的颁发数量随着自由房屋的均值增大而增大,且随着自由房屋均值的增加建筑许可证的颁发数量增加的速度而放缓,这是对数曲线的特征,因此可以采用对数函数来进行拟合。即将建筑许可证的颁发数量(y)与自由房屋的均值(x)之间的关系表述为:

y= a + blnx 其中的参数a与b的值待定。

步骤3:假定回归系数的值,建立非线性回归模型。

假定回归系数的值为a=1,b=1并将之放在单元格f2:f3中。用回归对数方程y=a+blnx以及自由房屋均值来计算建筑许可证的颁发数量预测值,放在单元格c2中,即在单元c2中输入公式“=$f$2+$f$3*ln(a2)”,并将此公式复制到c3:c19中,得到建筑许可证的颁发数量预测值。在单元格f5中计算建筑许可证的颁发数量观测值与预测值的均方误差mse,即在单元格f5中输入公式“{=average((c2:c19-b2:b19)^2)}”(用ctrl+shift+enter组合键添加花括号)。如图4-6所示:

图4-6 回归参数求解前的模型 步骤4:确定参数a与b的值。

对于本例的问题,我们采用规划求解的方法来确定参数a与b的值,利用规划求解工具计算出使mse极小的参数a与b,规划求解对话框的设置如图4-7所示。

图4-7 规划求解对话框

然后点击“求解”按钮,可得如图4-8所示的结果。

图4-8 规划求解后的模型结果

步骤5:添加趋势线,显示R2值。

在图4-7的散点图中通过添加对数趋势线,并在添加趋势线对话框中的“选项”中选择“显示R2”与“显示公式”,如图4-9所示。我们发现R2达到0.9441,表明选择对数回归模型预测是可行的。同时我们也检验了趋势线方法与规划求解法所得到的回归方程系数是一样的。

图4-9 添加了对数趋势线

步骤6:进行预测。

根据对数回归方程,如果任意给定 自由房屋的均值,即可预测出建筑许可证的颁发数量。将x=300,预测出颁发的建筑许可证数量为-78874.08+16877.319*ln(300)=17390.4708,如图 4-8所示。

实验思考:

1、请将此问题转换为线性回归模型,求解模型的参数和R2值,并与规划求解法的结果进行比较。

答:若将此模型转换为线性回归模型,得到的模型为y=16877.34701Ln(X)-

79003.9859, MSE=2023817.464,与原模型中y=16878Ln(X)-78877,R²=0.9441,MSE=2006982.816相比,基本无差别。

实验4-3 “家家有房”公司建筑许可证多元线性回归分析 实验目的

• 理解多元线性回归分析的概念;

• 针对不同的问题,能够建立适当的多元线性回归模型; • 掌握运用向前增选法确定回归自变量;

• 在给定自变量的情况下,根据多元线性回归模型预测因变量的值。

实验步骤:

步骤1:输入原始数据。

首先分析案例中的自变量和因变量,并将数据合理的布置在excel工作表的a1:d19中,如图4-10所示,以备建模使用。

根据实验要求,我们确定因变量为建筑许可证的颁发数量(y),自变量为每平方公里的人口密度(x1)、自由房屋的均值(x2)与平均家庭收入(x3),假设多元线性模型为:y=a+b1*x1+b2*x2+b3*x3。

图4-10 人口密度、自由房屋均值、平均家庭收入与建筑许可证数量数据 步骤2:分别绘制三个候选自变量与因变量之间的关系图。

图4-11 建筑许可证数量与每平方公里人口密度的散点图

这个问题涉及到三个候选自变量,每平方公里的人口密度(x1)、自由房屋的均值(x2)与平均家庭收入(x3)。首先分别对每个候选自变量绘制与因变量建筑许可证的颁发数量关系的散点图,见图4-11—图4-13。

图4-12 建筑许可证数量与自由房屋的均值的散点图

图4-13建筑许可证数量与平均家庭收入的散点图

步骤3:针对每一个候选变量生成回归分析报告。

分别对这三个候选变量做回归分析报告,根据值,找出最优的变量。这里我们采用向前增选法,先给出建筑许可证的颁发数量与三个候选变量之间的回归分析报告,分别见图4-14和4-16。

图4-14 许可证数量与人口密度的回归分析报告

图4-15 许可证数量与自由房屋均值的回归分析报告

图4-16 许可证数量与平均家庭收入的回归分析报告

图4-17 建筑许可证数量与人口密度及平均家庭收入的回归分析报告

图4-18 建筑许可证数量与自由房屋均值及平均家庭收入回归分析报告

实验思考

1.在用回归分析报告求解参数时,自变量与因变量之间应该满足什么关系? 答:在用回归分析报告求解参数时,自变量与因变量之间应满足一个或多个自变量值对应一个应变量。

2.为什么实验结果只选用两元线性回归模型而不用三元线性回归模型进行建筑许可证数量的预测?

答:实验结果只选用两元线性回归模型二不用三元线性回归模型既高兴建筑许可证数量预测的原因是三元回归分析报告中自有房屋的均值X2的调整后的R²的值并未超过一元回归分析报告中对自有房屋的均值X2的调整后的R²的值,说明自有房屋的均值X2与建筑许可证数量的线性相关性不强,若它参与回归预测,将会影响预测结果。

3.在用多元线性回归时,如何确定候选变量,确定的依据是什么?

答:用多元线性回归时,可依据对某一自变量在组合前得到的调整后的R²的值与组合后得到的调整后的R²的值之间的大大小进行候选变量的确定。若组合后得到的调整后的R²的值超过组合前得到的调整后的R²的值,则确定其为候选变量

4.从实验4-2我们了解自有房屋的均值(x2)与建筑许可证数量是对数相关,如果我们用回归方程y=a+b1*x1+b2*lnx2+b3*x3来进行预测是否更精确?那么我们又怎样确定此方程的各项系数呢?

答:若用回归方程Y=a+b1*X1+b2*lnX2+b3*X3来进行预测,结果不一定会更精确。因为Y是受3个自变量的共同影响。可用多元非线性回归确定次方程的各项系数,因为线性回归是特殊的非线性回归。

实验4-4 “家家有房”公司建筑许可证多元非线性回归分析

实验目的

• 理解多元非线性回归分析的概念;

• 针对不同的问题,能够建立适当的多元非线性回归模型;

• 掌握用规划求解法、变换技术加回归分析报告法确定多元非线性回归方程的系数; • 在给定自变量的情况下,根据多元非线性回归模型预测因变量的值。

实验步骤:

步骤1:确定因变量与自变量。

根据实验要求,我们确定因变量为建筑许可证的颁发数量(y),因变量为平均家庭收入(x1)与人均交纳税收(x2),并将数据合理的布置在excel工作表中。

步骤2:确定模型并对模型初始化。

因为是非线性模型,而且是多元的,所以我们这里假设模型为y=a+b1*x1^2+b2*x2^2。在单元格h2:h4中分别放入参数a,b1,b2初值1,并在单元格d2中输入公式“=$h$2+ $h$3 *a2^2+$h$4*b2^2”,并将其复制到公式d3:d19中,在单元格h5中输入公式“=sumxmy2(d2:d19,c2:c19)/count(d2:d19)”。

步骤3:启用规划求解工具。

在“工具”菜单中选择“规划求解”,打开“规划求解”对话框,并在该对话框中做如

图4-19中设置,然后点击“求解”按钮,并将结果保存在图4-20中。

图4-19规划求解参数的设置

图4-20 规划求解后的模型结果

步骤4:根据获得的参数进行预测。

利用规划求解的结果,将参数a,b1,b2的值及平均家庭收入为80千元,人均交纳的税收为7千元代入模型y=a+b1*x1^2+b2*x2^2,可得建筑许可证的颁发数量预测值为11464.4。

步骤5:将非线性模型与线性模型结果比较。

将模型假设为线性模型y=a+b1*x1+b2*x2,并将参数放置在单元格h8:h11中,重复步骤2与步骤3,可以看到在线性模型求得的mse为1500179.183,比在非线性模型下求得的mse的值1158258.3大,因此在该实验中,用二元非线性模型要比用线性模型求解的结果要好些。

实验思考

1.如果要用回归分析报告求解多元非线性模型的参数,首先要做的工作是什么?怎么做?

答:若要用回归分析报告求解多元非线性模型的参数,首先要做的是确定因变量与自变量。并将数据合理地布置在Excel表中。

2.现王经理经过深入调查研究发现:建筑许可证的颁发数量既与每平方公里的人口密度有着密切的关系,也与自由房屋的均值有着密切的关系,此外还与平均家庭收入、人口增长百分比、失业率、人均交纳的税收等有着相关关系,并给出相关数据如表4-5,根据表4-5中所给的数据,想想用什么方法能够较快的找出合适的自变量建立多元回归分析模型,并以此预测建筑许可证的颁发数量。

答:可分别求出每一因素调整前的R²的值与调整后的R²作比较,再确定其是否影响显著,以此进行选择细分。

实验总结:

本次实验主要目的是理解数平滑预测法、移动平均预测法、趋势预测法、非线性趋势预测法、季节指数的概念;掌握在excel中建立指数平滑预测模型、移动平均模型、线性趋势预测模型、非线性趋势预测模型、季节指数预测的方法,掌握寻找最优平滑常数、最优移动平均跨度、线性趋势模型参数、线性趋势值预测的各种方法。

实验五 手机用户消费习惯聚类分析

实验目的

• 理解聚类分析的概念; • 理解聚类分析的原理;

• 掌握在SPSS中进行聚类分析的方法。

实验步骤: 为研究移动用户的手机消费习惯,现收集了反映移动用户手机使用情况的数据,该数据中包含7个变量:客户编号(Customer_ID)、工作日上班时期电话时长(Peak_mins)、工作日下班时期电话时长(OffPeak_mins)、周末电话时长(Weekend_mins)、国际电话时长(International_mins)、总通话时长(Total_mins)和平均每次通话时长(average_mins)。请用SPSS软件按除客户编号外的6个变量维度对移动用户进行细分。部分数据如图所示。

移动电话用户手机使用情况部分数据

本次实验采用迭代聚类方法进行数据分析。

1.数据的初步分析

选择菜单 打开SPSS文件 telco.sav→分析(Analyze)→描述统计(Descriptive Statistics)→描述(Descriptives…)选入变量 将除“Customer_ID”外的其余6个变量选入变量框(Variables)中

设置选项 打开Options按钮,勾选均值(Mean)、标准差(Std.deviation)、最小值(Minimum)、最大值(Maximum)四项

结果输出见下图。

上图显示6个变量数值差异较大,其中均值最大值为1064.3,最小值为4.1267,标准差的取值也从最小的3.804变化到最大的560.801。这种差异会影响聚类分析的结果。而要消除这种影响,需在聚类前对数据进行标准化处理。

2.标准化处理

在上一步弹出的“Descriptive”对话框中选择“Save standardized values as variables”,即将标准化值另存为变量,输出如下图。

标准化的目的是消除量纲和变异的影响。消除量纲影响,要扣减平均值;消除变异影响,要除以标准差。因此标准化数据等于某变量的观察值减去该变量的平均数,然后除以该变量的标准差。标准化后各变量的平均数为0,标准差为1,消除了量纲和变异的影响。如ID为K1000050的用户工作日上班时间通话时长(Peak_mins)标准化后的值,Peak_mins标准化=(观察值-均值)/标准差=(40.61-708.347)/515.258=-1.296。

3.聚类分析

选择菜单 打开SPSS文件 telco.sav→分析(Analyze)→分类(Classify)→K均值聚类(K-Means Cluster…)选择变量 选入上图中红框内的6个标准化数据变量

设置选项 主窗口设置选项如下图中的

下载数据选择器实验报告5则范文word格式文档
下载数据选择器实验报告5则范文.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    数据挖掘关联规则实验报告(共5篇)

    实验七关联规则 1. 实验目标 • 使用SSAS进行关联规则挖掘实验 2. 实验要求 (1)按“实验内容”完成操作,并记录实验步骤; (2)回答“问题讨论”中的思考题,并写出本次实验的心得体会......

    地震数据采集实验报告参考材料[精选]

    实验一 地震数据采集实验 红色字体部分根据具体实验参数自行修改 一 实验目的和要求 通过实验了解地震数据的采集方法和观测系统的设计方法。 二 实验内容 1、了解地震数据......

    实验七实验报告数据的填写要求(2学时)

    湖南师范大学职业技术学院(工学院)实验数据报告单 实验课程:数字电子技术基础实验题目:数字电路的综合运用 实验日期:2012年月日专业:1年级:班:姓名:学号:实验目的:实验内容:本实验用集......

    建立表和定义完整性约束、数据操作 实验报告[合集]

    经济管理学院 财务管理 专业协作者______________ 教师评定 _____________ 实验题目建立表和定义完整性约束、数据操作 一、 实验目的与实验方法 本实验课程的目的: 本实验......

    计算机组成原理实验报告3-数据输出实验 移位门实验

    2.3 数据输出实验/移位门实验 一.实验要求:利用CPTH 实验仪的开关做为控制信号,将指定寄存器的内容读到数据总线DBUS上。 二.实验目的:1、了解模型机中多寄存器接数据总线的实现......

    实验报告

    实验报告 固体碱催化剂KF/CaO-MgO-Fe3O4的制备与表征 摘要:采用在制备复合物CaO—MgO的过程中加入一定量磁性基质Fe3O4来制备磁性复合物CaO—MgO—Fe3O4,再以等体积浸渍法负载......

    实验报告

    技 能 训 练 实习报 告 学院:经济与管理 班级:09人力2班 学号:0868100136 姓名:苏日古嘎 一、 实验名称:奥派人力资源实践平台 二、 实验目的: 奥派人力资源实践平台系统按......

    实验报告

    一、实验目的和要求 1、通过实验使学生掌握拟进行的会计模拟实验的基本情况,在接下来的会计模拟实验中,有明确的前提条件。知道所应遵循的规则和方法以及在会计模拟操作过程中......