实验一：数据的预处理及探索

第一篇：实验一：数据的预处理及探索

实验一：数据的预处理及探索实验目的：

1、数据的基本描述统计

2、找出变量中的离群值及极端值并修正（参考

5.1.2）

3、找出对输出变量影响最重要的一些输入变

量。（参考5.6.2）

第二篇：实验一数据恢复实验教案

实验一 windows平台逻辑层

数据恢复实验1（误删除的数据恢复）教案

一、实验目的

通过运用软件对误删除的硬盘或者其他设备的数据进行恢复，使学生了解windows平台逻辑层数据恢复原理。通过这个实验，使学生能够深入理解并掌握数据恢复软件的使用方法，并能熟练运用这些软件对存储设备设备进行数据恢复。

二、实验意义

通过上机实验，巩固理论课所学的基本知识，进一步熟悉存储介质数据修复和恢复方法及过程，提高自身的对存储介质逻辑层恢复技能。

三、实验内容

（一）熟悉EasyRecovery Pro的操作界面和该软件的使用，掌握该软件对误删除数据的恢复方法，并运用该软件对硬盘进行逻辑层误删除数据恢复。

（二）熟悉R-Studio的操作界面和该软件的使用，掌握该软件对误删除数据的恢复方法，并运用该软件对硬盘进行逻辑层误删除数据恢复。

四、实验环境

（一）硬件

1．CPU：Intel P4系列以上 2．内存：512M以上 3．硬盘可用空间：1G以上 4．其他辅助输入、输出设备

（二）操作系统：Win9x/WinNT/Win2000/WinXP/Win7

（三）实验软件：EasyRecovery Pro6.21、R-Studio5.0

五、实验原理

现实中很多人不知道删除、格式化等硬盘操作丢失的数据可以恢复，以为删除、格式化以后数据就不存在了。事实上，上述简单操作后数据仍然存在于硬盘中，懂得数据恢复原理知识的人只需几下便可将消失的数据找回来，不要觉得不可思议，在了解数据在硬盘、优盘、软盘等介质上的存储原理后，你也可以亲自做一回魔术师。

我们向硬盘里存放文件时,系统首先会在文件分配表内写上文件名称、大小，并根据数据区的空闲空间在文件分配表上继续写上文件内容在数据区的起始位置。然后开始向数据区写上文件的真实内容，一个文件存放操作才算完毕。

删除操作却简单的很,当我们需要删除一个文件时,系统只是在文件分配表内在该文件前面写一个删除标志,表示该文件已被删除,他所占用的空间已被“释放”, 其他文件可以使用他占用的空间。所以，当我们删除文件又想找回他（数据恢复）时，只需用工具将删除标志去掉，数据被恢复回来了。当然，前提是没有新的文件写入，该文件所占用的空间没有被新内容覆盖。

什么样的数据可以恢复?简单一句话，只要硬盘的物理形态没有改变，数据就可以恢复。我们普通在电脑上对磁盘上的操作(删除或者格式化)并没有改变磁盘的本体物理性质，所以原则上是都可以恢复。一般的做法是在电脑上使用文件恢复软件，比如德国Kroll Ontrack公司的Easy Recovery，美国的R-Studio，俄罗斯的PC3000，或者美国诺顿的NDD以及中国的DiskGenius都可以轻松的进行磁盘的初级恢复操作，使用软件基本上可以完成针对一般的数据删除的恢复(包括Shift + Del或低格的删除)。

EasyRecovery 是数据恢复公司 Ontrack 的产品，它是一个硬盘数据恢复工具，能够帮你恢复丢失的数据以及重建文件系统。它不会向你的原始驱动器写入任何东西，它主要是在内存中重建文件分区表使数据能够安全地传输到其他驱动器中。你可以从被病毒破坏或是已经格式化的硬盘中恢复数据。

Easy Recovery首先的功能就是磁盘诊断。功能包括Drive tests、Smart tests、Size Manager、Jumper Viewer、Partition tests和Data Advisor。

Drive tests用来检测潜在的硬件问题；

Smart tests用来检测、监视并且报告磁盘数据方面的问题；

Size Manager可以看见一个树型目录，可以看出每个目录的使用空间； Jumper Viewer是Ontrack的另外一个工具，单独安装EasyRecovery是不被包含的；

Partition tests类似于windows 2000/xp里的chkdsk.exe，不过是图形化的界面，更强大，更直观；

Data Advisor是用向导的方式来创建可以在16位下分析磁盘状况的启动软盘。

Easy Recovery最核心的功能就是Data Recovery(数据恢复)，对于恢复被删除的文件，在EasyRecovery主界面中选择“数据修复”，然后选择DeletedRecovery”进入修复删除文件向导，在第一步首先选择被删除文件所在分区，单击“下一步”按钮，软件会对该分区进行扫描，完成后会在窗口左边窗格中显示该分区的所有文件夹(包括已删除的文件夹)，右边窗格显示已经删除了的文件，可先浏览到被删除文件所在文件夹，然后就可以在右边的文件栏中看到该文件夹下已经删除的文件列表，选定要恢复的文件。单击“下一步”按钮，先在“恢复到本地驱动器”处指定恢复的文件所保存的位置，这个位置必须是在另外一个分区中。单击“下一步”按钮即开始恢复文件，最后会显示文件恢复的相关信息，单击“完成”按钮后，就可以在设置的恢复的文件所保存的位置找到被恢复的文件。

文件夹的恢复也和文件恢复类似，只需选定已被删除的文件夹，其下的文件也会被一并选定，其后的步骤与文件恢复完全相同。另外，文件恢复功能也可由“数据修复”中的“AdanceRecovery”来实现。

R-Studio 是功能超强的数据恢复、反删除工具，采用全新恢复技术，为使用 FAT12/16/

32、NTFS、NTFS5(Windows 2000系统)和 Ext2FS(Linux系统)分区的磁盘提供完整数据维护解决方案！同时提供对本地和网络磁盘的支持，此外大量参数设置让高级用户获得最佳恢复效果。R-Studio新增加的版本增加了RAID重组功能，可以虚拟重组的RAID类型包括，RAID0，RAID5，其中重组RAID5可以支持缺少一块硬盘。

具体功能有：采用 Windows资源管理器操作界面；

通过网络恢复远程数据(远程计算机可运行Win95/98/ME/NT/2000/XP、Linux、UNIX 系统)；

支持 FAT12/16/

32、NTFS、NTFS5 和 Ext2FS文件系统；能够重建损毁的RAID阵列；

为磁盘、分区、目录生成镜像文件；恢复删除分区上的文件、加密文件(NTFS 5)、数据流(NTFS、NTFS 5)；

恢复FDISK或其它磁盘工具删除过得数据、病毒破坏的数据、MBR 破坏后的数据；

识别特定文件名；把数据保存到任何磁盘;浏览、编辑文件或磁盘内容等等。

六、实验步骤

（一）r-studio操作步骤 1．数据恢复。

将你要恢复文件的硬盘连在计算机上，点击桌面“r-studio图标”，打开r-studio软件（见图1）。

图1 2．打开任意磁盘或者分区，右边显现文件有红色叉的表示删除的文件（见图2）。

图2 3．勾选该文件，“右击”选择“恢复标记文件”，设置文件输出路径，便可以恢复文件了（见图3）。

图3 打开文件恢复的存放路径，看看有没有成功的恢复文件！

4．点击某分区，右击选择“扫描”，进行“文件系统设置”选项设置后，点击“扫描”开始扫描磁盘（见图4）。

图4 5．扫描磁盘（见图5）。

图5 6．完成磁盘扫描（见图6）。

图6 7．双击“红色盘符”，然后双击“额外找到的文件”，就可看到此文件系统下的恢复文件（见图7）。

图7 8．按你想要的方式给你恢复的文件分类，勾选你要恢复的一类文件或者某一文件（见图8）。

图8 9．右击选择“恢复标记的内容”，设置恢复的路径，此路径不能在此次扫描的磁盘中（见图9）。

图9 10．打开文件路径检查是否成功恢复文件。

（二）EasyRecovery Pro操作步骤

1．双击EasyRecovery Pro图标，打开EasyRecovery Pro主界面（见图10）。

图10 2．主界面的左上角，分别列出了该软件主要的四大块功能，分别是：磁盘诊断、数据恢复、文件修复和邮件修复（见图11）。

图11 3．点击“数据恢复”，进入数据恢复界面，里面有数据恢复的相关模块（见图12）。

图12 4．对于被误删除的文件（本实验以误删除文件为例，误格式化文件同理），点击“删除恢复”，进入删除恢复界面（见图13）。

图13 5．选择误删除文件的分区，点击“下一步”可以看到该优盘中被删除的一些文件（见图14）。

图14 6．点击右下角的“过滤器选项”可以设定过滤规则（见图15）。

图15 7．若文件较多，可以使用“查找”功能（见图16）。

图16 8．也可以选取某个文件，点击“查看文件”按钮，进行查看。9．选取要恢复的文件，按“下一步”继续（见图17）。

图17 10．选取恢复数据以及报告的目的地，按“下一步”继续（见图18）。

图18 11．数据恢复完成，可以将此报告打印或保存（见图19）。

图19 12．按“完成”保存恢复状态，退出程序（见图20）。

图20 13．查看已恢复出来的文件（见图21）。

图21

七、实验结果

第三篇：反求工程中几何数据测量及数据预处理

反求工程中几何数据测量及数据预处理

11成型二班王宇豪 11010627 摘要：本文对反求工程技术中的两大重要部分：几何数据测量、数据预处理进行了研究。首先，综合介绍实物三维几何数据测量方法的分类、结构原理及各自优缺点进行了介绍。几何数据测量方法分为接触式测量方法和非接触式测量方法两类，精确的测量结果是后续数据处理及加工的重要基础。其次本文对数据的预处理过程进行了探讨，数据的预处理过程包括“点云”去噪、简化采样、“点云”的分割与缝合、构建曲面,该过程是曲面重构中的重要环节。

关键词：反求工程测量方法数据的预处理点云

Geometry Data Measurement And Data Preprocessing in

Reverse Engineering

Abstract The reverse engineering are two important parts of this article: geometry data measurement and data preprocessing.It introduces the measuring techniques for three-dimensional sorts as well as structure, principle of measurement and their advantages and disadvantages first.Geometric data measurement method can be divided into two types, contact measurement and non-contact measurement method, accurate measurement is an important foundation for subsequent data processing and machining.Secondly, the process of data preprocessing is discussed, data preprocessing includes reducing noise error of “point cloud” , simplify sampling,“point cloud” de-noising, simplify sampling, “point cloud” division and suture construct surfaces, data preprocessing is an important part.Key words Reverse Engineering Measurement methods Data preprocessing Points cloud 引言

反求工程（Reverse Engineering）是实现快速成型制造的核心技术之一，反求工程技术与传统的设计方法不同，它是指在没有具体工程图纸的情况下，通过分析、研究和再创造原始物理模型，掌握其关键技术，利用CAD/CAE/CAM技术对原始物理模型进行再创新。反求工程广泛应用于飞机、汽车、模具等行业之中，因此反求技术的研究具有广阔的前景。

同时，反求技术已经逐渐成为了学习国外先进技术成果的重要方法，甚至是我国追赶西方国家的重要手段之一。反求工程技术不是简单的复制和模仿，它不仅仅要CAD/CAM/CAE等计算机辅助模块能较好的独立完成各项工作，而且关键在于各子模块之间的信息集成，将已存在的实物零件转化为数字模型，从而运用CAD/CAM/CAE等计算机辅助模块对该零件进行工程分析、再设计、制造等进行集成化的并行处理。从而保证新产品在新环境下表现出更加优良的性能，并使设计效率大大提高，从而缩短了产品开发周期[1]。反求工程中，准确、快速地获取实物的三维几何数据。是实现反求工程的重要步骤之一。而数据预处理的效果直接影响曲面重建的质量，将直接影响最终CAD模型的优劣。反求工程中常用的测量方法

实物的数字化是反求工程实现的第一步，只有快速准确完整地获取三维物体的数字化几何信息，才能为后续的数据处理以及加工打下坚实的基础。因此，测量是整个原型反求的基础。反求工程中的测量方法可分为三大类：接触式、非接触式和逐层扫描测量法。

2.1 接触式测量方法 2.1.1优点：

（1）精确度高;（2）适合测量简单几何形状。其于简单几何形状的测量速度比较快，如面、圆孔、圆柱、圆锥等。

（3）可测量光学仪器死角的区域，例如深沟、间隙小的凹槽等区域。2.1.2缺点

（1）测量速度较慢;（2）测量时需要制订测量基准点，需使用特殊的夹具，测量成本高;（3）测头需接触工件而造成磨损，为保证一定的精度，需要经常校正测头;（4）容易损坏某些软质物体（橡胶品、粘土模型）等;（5）在对具有内孔的零件进行测量时，探头的直径必定要小于被测内孔直径;2.1.3分类

(1)三坐标测量机

三坐标测量机（coordinate measuring machine）是广泛采用的接触式测量设备。它的机械主体由三个相互垂直的测量轴(X轴、Y轴和Z轴)以及各自的长度测量系统组成。对应三个测量轴，它还具有三个方向的标尺，通过比较被测量与标准量来完成测量。作为一种大型精密的测量仪器，三坐标测量机开始是用于制造产品的检测，可以对具有复杂形状的工件的空间尺寸进行测量在反求工程应用的初期，三坐标测量机是数据采集的主要手段，三坐标测量机最大的优势就是测量精度高，而且具有适应性强的优点，但一般接触式测头测量效率低，而且对一些软质表面无法进行测量，数据需进行测头半径补偿。

（2）层切法

层切法可用于测量物体截面轮廓的几何尺寸，其工作过程为:将待测零件用专用树脂材料（填充石墨粉或颜料）完全封装，待树脂固化后，把它装夹到铣床上，进行微吃刀量平面铣削，结果得到包含有零件与树脂材料的截面，然后由数控铣床控制工作台移动到CCD摄像机下，位置传感器向计算机发出信号，计算机收到信号后，触发图像采集系统驱动CCD摄像机对当前截面进行采样、量化，从而得到三维离散数字图像。2.2 非接触式测量方法

非接触式测量根据测量原理的不同，有光学测量超声波测量、电磁测量等方式较为成熟的是光学测量方法，有激光扫描、莫尔条纹结构光、数字图像处理等方法[2]。2.2.1优点

（1）可实现复杂轮廓的高速测量;（2）不需逐点方式测量;（3）侧的物体上大部分特征，资料取得较完全;（4）不需做测头的补正;2.2.2缺点

（1）只适于外轮廓表面。

（2）测量精度较差，易受工件表面反射性及环境光源影响，造成测量干扰[3]。2.2.3分类

（1）激光线结构光扫描

激光线结构光扫描测量法是利用三角测量原理，又可称为光切法（Light Sectioning），是通过将一激光线结构光投射到三维物体上，利用CCD摄取物面上的二维变形线图象，即可解算出相应的三维坐标。每个测量周期可获取一条扫描线，物体的全轮廓测量是通过多轴可控机械运动辅助实现的。相对于激光点扫描法和投影光栅法，光切法在测量精度和测量速

度两方面都较理想。

（2）莫尔条纹法

莫尔条纹法是将光栅条纹投射到被测物体表面，光栅条纹受到物体表面形状的调制，其条纹间的相位关系会发生变化，再用数字图像处理的方法解析出光栅条纹图像的相位变化量来获取被测物体的表面三维信息。2.3逐层扫描测量

逐层扫描测量是一种新兴的测量技术，可以同时对零件的表面和内部结构进行精确测量，而不受测量体复杂程度的现在，比其他方法获得的数据更加密集完整。常用的方法有工业CT法、核磁共振法等。着重介绍一下工业CT技术（ICT），适合于测量形状复杂的的内部几何形状，可以直接获得截面数据，它根据CT图像来重构三维模型，然后转化为可以为激光快速成形设备所采用的STL或CI文件格式。但是，工业CT在Z轴方向测量精度不好，可测量的最小层厚为1mm。它是目前唯一一种测量形状复杂的内部几何形状而又不破坏零件的技术。数据的预处理

测量系统获得的点云数据必须经过处理才能够使用。测量数据的预处理，是曲面重构中的重要环节。将直接影响后续曲面的拟合精度和速度。数据测量得到的往往是以散乱点形式无序排列的大量“点云”。数据预处理是对测量的数据进行相应的处理，以满足不同的要求。这里将通过“点云”去噪、简化采样、“点云”的分割与缝合、构建曲面等方面进行探讨。3.1 “点云”去噪

由于被测曲面的表面粗糙度、波纹等一系列表面缺陷，测量中出现噪声点是不可避免的，噪声点影响着实体造型，若不进行噪声点的消除，将严重影响重建曲面的质量，故一般在数据“点云”操作之前进行“点云”去噪。

通常需要采用数据平滑技术，高斯滤波法可以很好的保持数据原貌，中值滤波消除数据毛刺的效果较好，应用时可根据数据质量和建模方法灵活选择滤波算法。三种滤波方法如图1所示：

图1 三种不同的滤波方法[4]

3.2 简化采样

由于测量所得的数据量通常很大，比如三维激光扫描仪一次扫描就可以产生几百万甚至上千万个字节。而且这些数据之间没有显式的拓扑关系，还产生了大量的冗余，这曲面重建工作难以保证速度，因此需要对它们做一些适度的简化，最常用的是采样法，根据一定的算法规则，从原始“点云”中抽取部分数据点，未抽取到的数据将被忽略[5]。典型的算法规则有均匀采样法、弦偏差取样法、倍率缩减法、栅格法还有基于点采样曲面的采样规则。本文选择其中最常用的均匀采样法和弦偏差取样法进行介绍。

（1）均匀采样法：

是根据数据点的存储顺序，每隔m-1个数据点采集一个数据点，其他的数据点都被忽略，这里的m称为采样间隔（或采样率)。当均匀采样法应用于有序数据(如扫描线数据)时，便成为等间距采样法;而应用于非有序数据时，由于数据排列的无规律性模拟了均匀采样的随机性，因而成为随机采样法。对于稠密的数字化样件，均匀采样法是一种常用的快速简化方法。（2）弦偏差取样法

采用弦偏差方法消减冗余数据时，使用最大偏差值及最大跨距两个参数进行优化处理。3.3 数据修补

经过各种扫描设备获得点云数据后，将其在反求工程软件中打开时，我们经常会发现，点云表面会存在一些孔、洞等数据缺失现象。这些孔、洞的存在会使曲面建模工作变得异常困难，因此，在曲面建模之前需要对它们进行必要的处理，将这些缺失的数据信息补充完整。这就是所谓的缺损数据修复工作，也可称为数据修补[6]。3.4 “点云”的分割与缝合

一般的CAD/CAM软件应对形状复杂的“点云”处理起来还很困难，我们可以通过数据处理，分割成一块块单一的小块“点云”数据进行处理。按测量数据的几何属性对其进行分割，采用几何特征匹配与识别的方法来获取零件原形所具有的设计与加工特征，然后再进行整体匹配恢复原始实体形状。进行“点云”分割时，应尽量使分割线界于曲率平滑处，在曲率变化大的地方避免分割线的介入，否则匹配时容易引起整体实体局部细节的变形。而在一些小的CAD环境里，读入的都是较小的“点云”，我们还需要对各个小的“点云”进行缝合。

3.5 构建曲面

曲线是构建曲面的重要基础，曲面造型中常用的基本曲线类型有Bezier曲线，B样条曲线，有理的Bezier曲线和NURBS曲线。

目前我们所常用的CAD造型软件，如UG、Pro/E等，其模型的表达方式一般都是采用矩形域的四边曲面，而反求工程的难点在于这种四边曲面无法建立需要的曲面模型。考虑到各方面因素，可以直接用“点云”创建面，即通过“点云”三角化的途径或用构造好的特征线来生成实体的曲面模型。以特征线为基础构造曲面时，需注意特征线的方向问题。特征线的方向代表着曲面矢量方向，如果特征线方向不正确，往往会得到不正确的曲面形式，甚至完全失去实体原来的形状特征。我们往往需要通过多次平滑处理使其尽可能达到完全平滑。一般在通过曲线构建和曲面构建构建好曲面后，都要反复通过使用平顺曲面来平顺。

曲面的光滑处理主要有以下几种方法：能量法、回弹法、最小二乘法、磨光法、基养条法、圆率法等。应用实例[7]

目前,采用通用型应用软件(如Pro/Engineer,UGII,STRIM100等)和专用扫描数据处理软件结合,解决反求工程CAD建模问题的应用实例非常多.尽管这种解决问题的效率和质量都比较低,但在先进的反求工程CAD系统出现以前,这种技术和思路还会继续被工程界普遍采用.近年来,随着高速扫描设备和计算机技术的飞速发展,特别是反求工程CAD软件的研究和应用水平的不断提高,能够体现反求工程CAD建模问题特点的软件也在不断推出,比较有实力的系统包括:Surfacer,ICEM/Surf和RE-SOFT.这些系统除了能够直接处理“点云”数据外,也具备了一定的完成曲面造型和计算的功能,是目前反求工程CAD领域中最有前途的软件系统。

本文给出了按照这种技术和思路完成的反求工程CAD的应用实例。由ICEM/Surf和RE-SOFT合作解决,处理比较典型的扫描测量“点云”数据的曲面造型问题,图2(a)—图2(d)

示意了复杂曲面零件反求工程CAD建模的一般过程。

图二

反求工程应用实例结论

反求工程技术是测量技术、数据处理技术、图形处理技术和加工技术相结合的一门结合性技术，随着各项技术的成熟和计算机技术的高速发展，反求技术会在未来的新产品设计中得到越来越多的应用，本文所着重表述的几何数据测量及数据预处理作为反求技术中的核心技术，正是先进制造技术的前进方向，在这次课程设计论文中，本人通过资料的查阅，深化了自己对反求工程技术的理解，初步了解了反求工程中的部分过程，国产化是创新，反求的本质就是再创造。我也深信我国会通过对这项技术的运用提高国产化零件质量的核心问题。

参考文献：

[1]李岳凡,陈锋.反求工程技术在新产品开发中的应用[J].机械设计与制造,2006,03:129-130.[2]柯映林,肖尧先,李江雄.反求工程CAD建模技术研究[J].计算机辅助设计与图形学学报,2001,06:570-575.[3]金涛,单岩,胡明辅,童水光.反求工程中产品三维模型重建技术综述[J].机械科学与技术,2001,05:787-789.[4]朱玉红.基于快速原形制造的反求工程[J].机械设计与制造,2005,02:65-67.[5]贾双斌.逆向工程中曲面重构与实现技术的研究[D].导师：李言.西安理工大学,2007.[6]蔡勇.基于核机器学习方法的点云处理若干方法研究[D].导师：肖建.西南交通大学,2006.[7]曹晓兴.逆向工程模型重构关键技术及应用[D].导师：刘德平.郑州大学,2012.

第四篇：实验数据淀粉

一.相关分析

1.温室种植

表.生物产量、经济产量与淀粉含量的关系

生物产量

经济产量

淀粉含量

生物产量

0.941**

0.121

.0.000

0.541

经济产量

0.941**

0.139

0.000

.0.754

淀粉含量

0.121

0.139

0.541

0.754

.*0.05水平上具备显著性

**0.01水平上具备显著性

通过对在温室种植下的生物产量、经济产量与淀粉含量进行相关分析，得到以上结果。可以看到生物产量与淀粉含量的相关系数值为0.941，p<0.001，说明生物产量与淀粉含量具备显著的高程度的正向相关关系。生物产量与淀粉含量的相关系数值为0.121，p>0.05，说明生物产量与淀粉含量不具备显著的相关关系。经济产量与淀粉含量的相关系数值为0.139，p>0.05，说明经济产量与淀粉含量不具备显著的相关关系。

上述研究结果表明，在温室种植下，生物产量越高，经济产量越高；生物产量和经济产量均与淀粉含量并无太大关系。

2.网室种植

表.生物产量、经济产量与淀粉含量的关系

生物产量

经济产量

淀粉含量

生物产量

0.748**

-0.077

.0.000

0.754

经济产量

0.748**

0.040

0.000

.0.869

淀粉含量

-0.077

0.040

0.754

0.869

.*0.05水平上具备显著性

**0.01水平上具备显著性

通过对在网室种植下的生物产量、经济产量与淀粉含量进行相关分析，得到以上结果。可以看到生物产量与淀粉含量的相关系数值为0.748，p<0.001，说明生物产量与淀粉含量具备显著的高程度的正向相关关系。生物产量与淀粉含量的相关系数值为-0.077，p>0.05，说明生物产量与淀粉含量不具备显著的相关关系。经济产量与淀粉含量的相关系数值为0.040，p>0.05，说明经济产量与淀粉含量不具备显著的相关关系。

上述研究结果表明，在网室种植下，生物产量越高，经济产量越高；生物产量和经济产量均与淀粉含量并无太大关系。

二.差异性分析

表.温室种植和网室种植在各个变量上的比较情况

温室种植

网室种植

生物产量（g）

34.020±36.374

47.215±10.008

-1.821

0.078

经济产量（g）

9.844±12.194

23.996±7.099

-4.552**

0.000

淀粉含量（%）

3.069±0.883

3.530±1.169

-1.540

0.131

*0.05水平上具备显著性

**0.01水平上具备显著性

通过对温室种植与网室种植在生物产量、经济产量、淀粉含量进行比较，得到上表结果。可以看到网室种植在生物产量、经济产量、淀粉含量上均高于温室种植。

其次在t检验中，得到t值均为负值，说明温室种植在生物产量、经济产量、淀粉含量上均低于网室种植。另外p值情况中，仅两种方式在经济含量上具备显著的差异性（p<0.01），而在生物产量、淀粉含量上不具备显著的差异性（p>0.05）。说明网室种植在经济产量上显著高于温室种植方式。

结论:

①

温室种植方式中，在一定程度上，生物产量越高，经济产量越高；生物产量和经济产量均与淀粉含量并无太大关系。

②

网室种植方式中，一定程度上，生物产量越高，经济产量越高；生物产量和经济产量均与淀粉含量并无太大关系。

③

网室种植在经济产量上显著高于温室种植方式，两种方式在生物产量、淀粉含量上并无太大差异。

④

第五篇：数据分析与建模,实验报告,实验一,,简单数据建模

学生学号

实验课成绩

学学生实验报告书

实验课程名称数据分析与建模开开课学院管理学院指导教师姓名鄢丹学学生姓名

学生专业班级信管

班

2018 —2019 学年

第1

学期实验报告填写说明

1．综合性、设计性实验必须填写实验报告，验证、演示性实验可不写实验报告。

2．实验报告书必须按统一格式制作（实验中心网站有下载）。

3．老师在指导学生实验时，必须按实验大纲的要求，逐项完成各项实验；实验报告书中的实验课程名称和实验项目必须须与实验指导书一致。

4．每项实验依据其实验内容的多少，可安排在一个或多个时间段内完成，但每项实验只须填写一份实验报告。

5．每份实验报告教师都应该有签名、评分表及实验报告成绩。

6．教师应及时评阅学生的实验报告并给出各实验项目成绩，完整保存实验报告。在完成所有实验项目后，教师应按学生姓名将批改好的各实验项目实验报告装订成册，构成该实验课程总报告，按班级交到实验中心，每个班级实验报告袋中附带一份实验指导书及班级实验课程成绩表。

7．实验报告封面信息需填写完整，并给出实验环节的成绩，实验环节成绩按其类型采取百分制或优、良、中、及格和不及格五级评定（与课程总成绩一致），并记入课程总成绩中。

实验课程名称：_ 数据分析与建模__

实验项目名称实验一

简单的数据建模实验成绩

实实验者

专业班级

组组

别无无同同组者无无实验日期 2018 年年 9 月月 26 日第一部分：实验预习报告（包括实验目的、意义，实验基本原理与方法，主要仪器设备及耗材，实验方案与技术路线等）

一、实验目的、意义本实验旨在通过资料查阅和上机实验，使学生加深了解数据分析与建模的理论与方法，掌握典型的数据模型的建立与使用。

二、实验基本原理与方法数据分析的理论，最优化模型的建模方法。

应用 Excel 的方法。

三、实验内容及要求 1、应用 Excel 建模分析某学院有 3 个系，共有学生 200 人，A 系 103 人，B 系 63 人，C 系 34 人。现在成立一个由 21 名学生组成的学生会，该如何公平地分配席位？实验任务：用利用 Q 值法分配席位，并且在 Excel 中进行 Q 值计算。

（提示：参考讲义中的计算过程。）、单变量最优化一个汽车制造商售出一辆某品牌的汽车可获利 1500 美元，估计每 100 美元的折扣可以使销售额提高 15%。

（1）多大的折扣可以使利润最高？利用五步方法及单变量最优化模型。

（2）对你所得的结果，求关于所做的 15%假设的灵敏性。分别考虑折扣量和相应收益。

（3）假设实际每 100 美元的折扣仅可以使销售额提高 10%，对结果会有什么影响？如果每 100 美元折扣的提高量为 10%~15%之间的某个值，结果又如何？（4）什么情况下折扣会导致利润降低？

实验任务：请将上述求解过程，除了用导数求解外，再用用 Excel 建模求解之。

（提示：考虑 Excel 的数据，图形，公式三者的关系；Excel。的函数。参考教材第一章。））

四、实验方案或技术路线（只针对综合型和设计型实验）

按照实验任务要求，理论结合实际的实验方案，巩固课程内容，温故知新，查遗补漏，夯实理论基础，提升实验动手能力。

技术路线是，从整体规划，分步骤实施，实验全面总结。

第二部分：实验过程记录（可加页）（包括实验原始数据记录，实验现象记录，实验过程发现的问题等）、应用 Excel 建模分析 1.分配方案：

第一步：对每个单位各分配一席；第二步：当分配下一席位时，计算在当前席位份额下各单位的 Q 值，并比较相应 Q 值的大小，将下一席位分配给当前 Q 值最大的一方； Q 值计算公式为：

（其中，Qi 表示单位 i 的 Q 值，Pi 表示单位 i 的人数，Ni 表示单位 i 的当前席位数）

第三步：重复执行第二步，直至席位分配完为止。

2.实验步骤：本实验的实验工具为 Excel（1）首先，打开 Excel 新建一个表格，并做好前期的基本数据输入工作，表格内容包括三部分：

a.已知的每个系的人数和所求的每个系最终分得席位数； b.在不同的已分配席位数的情况下，三个系 Q 值的取值； c.席位分配过程：给席位编号，标注出每个席位的分配结果；完成后结果如下图所示：

（2）然后，对每个系均分一个席位后，开始对第 4 个席位进行分配。此时各系已分配席位数均为 1，计算此时各系的 Q 值并比较大小：

a.计算 A 系的 Q 值，公式如图所示：

b.计算 B 系的 Q 值，公式如图所示：

c.计算 C 系的 Q 值：

Q 值大者得席位，所以第 4 个席位分配给 A 系。

（3）然后对第 5 个席位进行分配，由于只有 A 系的已分配席位数变为 2，所以此时只需计算 A 系的 Q 值，再比较各系 Q 值大小即可。A 系 Q 值的计算公式只需将原来的 A6 都换成 A7即可，如下图所示：

Q 值大者得席位，所以第 5 个席位分配给 B 系。

（4）然后对第 6 个席位进行分配，由于只有 B 系的已分配席位数变为 2，所以此时只需计算 B 系的 Q 值，再比较各系 Q 值大小即可。B 系 Q 值的计算公式只需将原来的 A6 都换成 A7即可，如下图所示：

Q 值大者得席位，所以第 6 个席位分配给 A 系。

（5）采用类似上述的方法（当已分配席位数加 1 时，Q 值的计算公式中 A 后面的数字也加 1 即可）依次对后面的席位进行分配，直到第 21 个席位分配完毕。

最终 A 系分得席位 11 个，B 系分得席位 6 个，C 系分得席位 4 个。最终分配结果及分配具体分配过程如下图：

6、单变量最优化（（1）多大的折扣可以使利润最高？利用五步方法及单变量最优化模型。

1.提出问题【全部的变量包括】

一辆某品牌汽车的成本 C（美元）

一辆某品牌的汽车的折扣金额 100x（美元）

没有折扣时一辆某品牌汽车的售价 P（美元）

有折扣时一辆某品牌汽车的售价 p（美元）

没有折扣时的销量 Q（辆）

有折扣时的销量 q（辆）

没有折扣时的销售额 R（美元）

有折扣时的销售额 r（美元）

有折扣后的利润 L（美元）

【关于上述变量所做的假设】

P – C = 1500 p = P – 100x q = Q *(1 + 0.15x)L = q *(p – C)x >= 0 【目标】求 L 的最大值 2.选择建模方法本题为单变量优化问题，则建模方法为：设 y = f(x)在 x >= 0 的区间范围内是可微的，若 f(x)在 x 处达到极大或极小, 则 f ΄(x)= 0。

3.推导数学表达式 L = q *(p – C)= Q *(1 + 0.15x)*(p – C)= Q *(1 + 0.15x)*(1500-100x)

= Q *(-15 x^2 + 125x + 1500)记 y = L 作为求最大值的目标变量，x 作为自变量，原问题就化为在集合 S={ x : x ≥0}上求以下函数的最大值：

y = f(x)= Q *(-15 x^2 + 125x + 1500)（Q 为非负常量）

4.求解模型在本题中，即对 y = f(x)= Q *(-15 x^2 + 125x + 1500)在区间 x >= 0 上求最大值，Q 为非负常量。当 f ΄(x)= Q *(-30x + 125)= 0 时，解得 x ≈ 4.17 故 y = f(x)= Q *(-15 x^2 + 125x + 1500)在 x = 4.17 时取得最大值。

5.回答问题答：417 美元折扣可以使利润最高。

【【Excel 建模求解】

1.打开 Excel 新建一个表格，分别列出 X 栏和 Y 栏。X 栏依次写入 0，1，2，3 „„ 等等，Y 栏第一项，根据公式，将 x 以 A2 替代，写入公式“=-15*A2*A2+125*A2+1500”（此处假设 Q = 1），其余的 Y 栏数据，采用拖曳复制的方式复制粘贴公式。当 X 栏有值时，Y 栏就有对应的值。

2.选中 X 栏和 Y 栏的数据，点击菜单栏的【插入】然后插入【散点图】，得到如下图表：

由表和图可知，当 x 在 4 附近时，y 取得最大值。将 x 的取值区间缩小到[3.5 , 4.5] , 再绘出一次散点图，如下：

由上述表和图可知，当 x = 4.2 时，y 取得最大值。

回答问题：大约 420 美元折扣可以使利润最高。

（（2）对你所得的结果，求关于所做的 15% 假设的灵敏性。分别考虑折扣量和相应收益。

设销售额提高百分比为 r 1.折扣量 100x 关于销售额提高百分比 r 的灵敏性（故考虑 x 关于 r 的灵敏性即可）

a.粗分析前面已假定 r =15%，现在假设 r 的实际值是不同的，对几个不同的 r 值，重复前面的求解过程,可以得到对问题的解 x 关于 r 的敏感程度的一些数据。

即给定 r，对 y = f(x)=(1 + r x)*(1500-100x)（此处假设 Q = 1）求导，得到 f“(x)=-200rx + 1500r-100，令 f”(x)= 0,可得相应 x =(15r-1)/2r , 故折扣量 100x = 50(15r-1)/r ,采用

类似第（1）问的 Excel 建模方法，绘出折扣量 100x 关于销售额提高百分比 r 的散点图。

由上述图表可看到折扣量 100x 对参数 r 是很敏感的。即如果给定不同的销售额提高百分比r，则折扣量 100x 将会有明显变化。因此，r 的取值要合适、合理，所做的分析才有意义。

b.折扣量 100x 对销售额提高百分比 r 灵敏性的系统分析前面已计算出，使 f“(x)=0 的点为 x =(15r-1)/2r，若要 x≥0,只要 r >= 0.067 , 最佳折扣量100x可由x =(15r-1)/2r即100x = 50(15r-1)/r给出,对 r < 0.067 ,在[0,+∞)上都有f”(x)<0,最佳折扣量为 x=0。下图给出了 r =0.05 的情况（此处假设 Q = 1）：

c.折扣量 100x 对 r 的灵敏性的相对改变量：

由 x =(15r-1)/2r 可得在点 r=0.15 处，dx/dr = 1/(2 r^2)

S(100x , r)= S(x , r)=(dx/dr)*(r/x)= 1/(2rx)= 0.8

即若销售额提高百分比 r 增加 1%，则导致折扣量 100x 增加 0.8%

2.收益（即利润）L 关于销售额提高百分比 r 的灵敏性 a.粗分析 L = q *(p – C)= Q *(1 + rx)*(p – C)= Q *(1 + rx)*(1500-100x)

不妨设 Q = 1，由前面分析可得，折扣量 100x 对销售额提高百分比 r 是很敏感的，且此处分析的利润应该是给定 r 的情况下的最大利润，故将 x =(15r-1)/2r 代入式子 L =(1 + rx)*(1500-100x)得 L = 25(15r+1)^2 / r= 25(225r + 1/r + 30)。

采用类似前面的 Excel 建模方法，绘出利润 L 关于销售额提高百分比 r 的散点图。

由上述图表可看到利润 L 对参数 r 是很敏感的。即如果给定不同的销售额提高百分比 r，则利润 L 将会有明显变化。因此，r 的取值要合适、合理，所做的分析才有意义。

b.利润 L 对销售额提高百分比 r 灵敏性的系统分析对 L 求导可得 L“(r)= 25(225 – 1/r^2)，使 L”(r)=0 的点为 r = 1/15≈0.067，当 r < 0.067 时，L 随着 r 的增大而减小；当 r >= 0.067 时，L 随着 r 的增大而增大，r=0.067 是极小值点。

c.利润 L 对 r 的灵敏性的相对改变量：

由 L = 25(225r + 1/r + 30)可得在点 r=0.15 处，dL/dr = 25(225 – 1/r^2)≈ 4513.89 S(L , r)=(dL/dr)*(r/L)=(225r – 1/r)/(225r + 1/r + 30)≈ 0.385 即若销售额提高百分比 r 增加 1%，则导致利润 L 增加 0.385%

（（3）假设实际每 100 美元的折扣仅可以使销售额提高 10%，对结果会有什么影响？如果每 100为美元折扣的提高量为 10%~15% 之间的某个值，结果又如何？假设实际每 100 美元的折扣仅可以使销售额提高 10%，当 r = 0.1 时，折扣量 100x = 50(15r-1)/r = 250，利润 L= Q *(1 + 0.1x)*(1500-100x)= 1562.5Q(Q 为常量)答：会使折扣量变为 250 美元，利润变为 1562.5Q(Q 为没有折扣时的销量)如果每 100 美元折扣的提高量为 10%~15%之间的某个值，折扣量 100x 的变化曲线如下图所示：

100x = 50(15r-1)/r

利润 L（假设 Q = 1，仅考虑变化趋势）的变化曲线如下图所示：L = 25(225r + 1/r + 30)

（（4）什么情况下折扣会导致利润降低？利润 L = y = f(x)= Q *(-15 x^2 + 125x + 1500)利润 L（假设 Q = 1）随 x 变化的变化曲线如下图所示：

由第（1）问所求可得，极大值点为 x = 4.17（折扣量 100x = 417 美元），当折扣量 100x <= 417 美元时，随着折扣量的增加，利润增加；当折扣量 100x > 417 美元时，随着折扣量的增加，利润降低。

由上图还可知，当 x 取[8 , 8.5]区间上的某个值时，利润恰好等于 1500 美元。所以对 x 的取值再进行细分，绘出散点图如下：

由图可知，当 x > 8.33 时，即当折扣量> 833 美元时，此时利润小于没有折扣时的利润。

第三部分

结果与讨论（可加页）

一、

实验结果分析（包括数据处理、实验现象分析、影响因素讨论、综合分析和结论等）、应用 Excel 建模分析（1）问题 1：已分配席位数和席位号服从等差数列，重复输入浪费时间。

解决方法：使用 Excel 的自动填充功能以已分配席位数的输入为例，具体操作如下：

a.在准备填充的第一个单元格输入原本应输入的值，此处输入 1，然后保持鼠标停留在该单元格； b.然后在菜单栏找到【开始】，点开后找到【填充】并点击；

c.点击【填充】后选择【序列】，然后进行参数设置。此处应选择【列】和【等差数列】，【步长值】输入等差数列公差值，【终止值】为等差数列最后一个数的值。操作如下图：

d.使用自动填充之后可以得到结果如下：

（2）问题 2：本实验的实验任务是利用 Q 值法分配席位，并且在 Excel 中进行 Q 值计算。

我认为如果在 Excel 中仅仅只进行 Q 值计算，是无法准确地确定 Q 值计算次数的终止点，容易产生一些不必要的计算。

解决方法：

我将表格的内容分为三部分：

a.已知的每个系的人数和所求的每个系最终分得席位数；（有助于更直观地了解已知条件和最终结论；同时 Q 值计算公式中我使用了 B2、C2、D2 单元格，如果三个系的人数发生变化，则只需要修改此处的数据即可，不必修改公式）

b.在不同的已分配席位数的情况下，三个系 Q 值的取值； c.席位分配过程：给席位编号，标注出每个席位的分配结果；（有助于更直观地了解 Q 值法分配的原理；便于最后计算各系的最终分得席位数）

此种分法便于确定 Q 值计算次数的终止点。具体方法是：

每进行一次 Q 值计算，则分配一次席位，分配结果直接写在表格中相应位置，更加直观。当所有席位分配完毕，则是 Q 值计算的终止点，此时在表格中回顾席位分配过程并计数即可得到各系最终分得的席位数。

13、单变量最优化（1）问题 1：绘制散点图之前，要先在表格中输入自变量的值，该数据服从等差数列。

解决方法：使用 Excel 的自动填充功能具体操作：类似【用应用 Excel 建模分析】中的问题 1 的操作步骤。

（2）问题 2：绘制散点图之前因变量的计算公式处理方法解决方法：使用拖曳复制再粘贴的方法。

以第（1）问的第一个散点图为例，具体操作如下：

a.打开 Excel 新建一个表格，分别列出 X 栏和 Y 栏。

b.X 栏采用 Excel 的自动填充功能，依次写入 0，1，2，3 „„ 等等，Y 栏第一项，根据公式，将 x 以 A2 替代，手写输入公式“=-15*A2*A2+125*A2+1500”（此处假设 Q = 1），c.其余的 Y 栏数据，采用拖曳复制的方式复制粘贴公式。首先选中 Y 栏第一项，点击鼠标右键，点击【复制】；然后选中待填入数据的所有 Y 栏单元格，点击鼠标右键，点击【粘贴选项】中的【公式】；则当 X 栏有值时，Y 栏就有对应的值。

d.绘散点图：全部选中 X 栏和 Y 栏的数据，点击菜单栏的【插入】然后插入【散点图】，得到如下图表：

（3）问题 3：使用 Excel 求函数极值点的方法

解决方法：除了用公式法和导数求解之外，使用 Excel 采用多次绘散点图的方法也可求出函数极值点。

以第（1）问为例，具体操作如下：

采用前面的问题（2）中的方法，得到第一个散点图如下：

由表和图可知，当 x 在 4 附近时，y 取得最大值。

故将 x 的取值区间缩小到[3.5 , 4.5] , 再绘出一次散点图，如下：

由上述表和图可知，当 x ≈ 4.2 时，y 取得最大值。而导数计算结果为 x≈4.17，可知绘散点图求函数极值点是可行的。

如果想得到更精确的结果，可以将 x 的取值区间继续缩小，每个值之间的差也不断缩小，直至更加接近于真正的极值点。

二、

小结、建议及体会此次实验涉及到的知识点包括数据分析的理论、最优化模型的建模方法、应用 Excel 的方法等，我按照实验任务的要求，查阅相关资料，制定出理论结合实际的实验方案，采用“从整体规划，分步骤实施，实验全面总结”的技术路线完成了实验。

此次试验，巩固了我在课堂所学的内容，加深了我对数据分析与建模的理论与方法的了解，帮助我基本掌握了典型的数据模型的建立与使用，提升了我的实验动手能力。

此次实验我主要面临的问题是如何使用 Excel 建模。由于先前对 Excel 的了解甚少，所以此次实验的困难可能会稍大一点，不过，我也因此学到了 Excel 的许多使用技巧，包括自动填充、拖曳复制粘贴公式等，使我受益匪浅。

同时，我还学习了利用表格中的数据绘制散点图，以此类推，也掌握了其他图形的绘制方法。这使得我对于以后其他情况下的数据分析处理多了一种分析方法。我感觉数据分析与建模真的是一门很有用的课，建模帮助我们将现实问题转化为数学问题，再进而求解，更加方便。而模型的求解过程帮助我们掌握了一些建模分析的软件，这将会成为我们人生的一笔财富，成为我们日后需要进行数据分析时的助力。

建议：我觉得关于 Excel 建模方面的知识还是有点少，课件里的内容不是很便于学习。如果可以的话，希望老师可以提供一份较为系统的利用 Excel 建模的过程的资料（步骤叙述明确，带有截图和提示）。不过，该课程后期并不会继续使用 Excel 建模，所以此建议请老师斟酌时间和精力再考虑，或者选择熟悉 Excel 建模过程的同学帮助老师制作此资料，供其他不擅长的同学学习。

第四部分

评分标准（教师可自行设计）及成绩

观测点考核目标权重得分实验预习1．预习报告 2．提问 3．对于设计型实验，着重考查设计方案的科学性、可行性和创新性对实验目的和基本原理的认识程度，对实验方案的设计能力 20%

实验过程 1．是否按时参加实验 2．对实验过程的熟悉程度 3．对基本操作的规范程度 4．对突发事件的应急处理能力 5．实验原始记录的完整程度 6．同学之间的团结协作精神着重考查学生的实验态度、基本操作技能；严谨的治学态度、团结协作精神 30%

结果分析 1．所分析结果是否用原始记录数据 2．计算结果是否正确 3．实验结果分析是否合理 4．对于综合实验，各项内容之间是否有分析、比较与判断等考查学生对实验数据处理和现象分析的能力；对专业知识的综合应用能力；事实求实的精神 50%

该项实验报告最终得分

教师签名：。

实验一：数据的预处理及探索

第一篇：实验一：数据的预处理及探索

第二篇：实验一数据恢复实验教案

第三篇：反求工程中几何数据测量及数据预处理

第四篇：实验数据淀粉

第五篇：数据分析与建模,实验报告,实验一,,简单数据建模

相关范文推荐

数据挖掘实验三

实验一

实验一（范文大全）

实验一

实验一

基于GIS的海量气象数据预处理技术研究论文[优秀范文五篇]

实验一：地图数据的查询与显示（合集5篇）

物理化学实验教学改革探索