第一篇:分析报告、统计分析和数据挖掘的区别
分析报告、统计分析和数据挖掘的区别
“分析报告给你后见之明(hindsight);统计分析给你先机(foresight);数据挖掘给你洞察力(insight)”
举个例子说:
你看到孙悟空跟二郎神打仗,然后写了个分析报告,说孙悟空在柔韧性上优势明显,二郎神在力气上出类拔萃,所以刚开始不相上下;结果两个人跑到竹林里,在竹子上面打,孙悟空的优势发挥出来,所以孙悟空赢了。这叫分析报告。
孙悟空要跟二郎神打架了,有个赌徒找你预测。你做了个统计,发现两人斗争4567次,其中孙悟空赢3456次。另外,孙悟空斗牛魔王,胜率是89%,二郎神斗牛魔王胜率是71%。你得出趋势是孙悟空赢。因为你假设了这次胜利跟历史的关系,根据经验作了一个假设。这叫统计分析。
你什么都没做,让计算机自己做关联分析,自动找到了出身、教育、经验、单身四个因素。得出结论是孙悟空赢。计算机通过分析发现贫苦出身的孩子一般比皇亲国戚功夫练得刻苦;打架经验丰富的人因为擅长利用环境而机会更多;在都遇得到明师的情况下,贫苦出身的孩子功夫可能会高些;单身的人功夫总比同样环境非单身的高。孙悟空遇到的名师不亚于二郎神,而打架经验绝对丰富,并且单身,所以这次打头,孙悟空赢。这叫数据挖掘。
数据挖掘跟OLAP的区别在于它没有假设,让计算机找出这种背后的关系,而这种关系可能是你所想得到的,也可能是所想不到的。比如数据挖掘找出的结果发现在2亿条打斗记录中,姓孙的跟姓杨的打,总是姓孙的胜利,孙悟空姓孙,所以,悟空胜利。
用在现实中,我们举个例子来说,做OLAP分析,我们找找哪些人总是不及时向电信运营商缴钱,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时缴钱的穷人占71%。而数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。
第二篇:职业病数据统计分析报告
公乌素公司近年来职业病数据
统计分析报告
作者:白建兵 日期:2013年11月
用品管理制度、个人防护用品发放管理制度、职业危害事件应急救援预案、职业卫生健康监护制度、职工听力保护管理制度、职业卫生防治措施、职业卫生安全操作规程等相关制度。按照该企业制定的劳动防护用品管理办法,定期为作业人员发放防尘口罩、防噪耳塞等职业卫生防护用品。
2004年来,随着我公司企业改制和神华总部政策的实施,潜在职业危害越来越多,从业人员的健康面临更大的威胁。为了更好地保障工人职业健康,促进我公司工业持续健康发展,在我公司全面开展职业病防治工作愈显重要。
2008年,通过职业病危害专项整治调查,我公司存在职业病危害因素在煤炭生产的整个过程中都伴随着生产性粉尘(包括煤尘、混合性粉尘、岩尘)、生产性毒物(包括三硝基甲苯、铅、苯、砷化氢、汞及其化合物等)、有害物理因素(包括地温与高温、噪声与振动、放射线等)、有毒有害气体(包括沼气、一氧化碳、二氧化碳、氧化氨、二氧化硫、硫化氢、氨、磷化物)、不良气象条件(包括通风、采光、照明、气温、湿度、风速)、水质(包括矿区水源、工业用水)等职业危害因素,造成了部分作业人员患有不同程度的矽肺、煤工尘肺、职业中毒、中暑、放射性疾病、局部振动病、噪声聋等职业病。噪声、粉尘、甲醛、游离二氧化硅苯系物等。
在生产作业的整个过程中都伴随着生产性粉尘(包括煤尘、混合性粉尘、岩尘)、生产性毒物(包括三硝基甲苯、铅、苯、砷化氢、汞及其化合物等)、有害物理因素(包括地温与高温、噪声与振动、放射线
85%的老员工都是采掘一线人员,尘肺疑是人员非常多,2013年6月底我公司与能源公司职防所对在岗员工进行了岗中体检,新增的尘肺病人有10人,其中有8人是2004年破产重组以前就参加了煤矿井工工作的人员(重组改制人员),两人是山西大同2004年招聘人员,现在的职业健康监护是我们的重中之重。
(二)接触危害因素作业点监测情况
1989~2003年,我公司前身是海勃湾矿务局公乌素煤矿,因当时属国有统配煤矿,各种原因导致职业病监测工作未重点开展。2008年,我公司重点抽取7个采掘单位进行了职业卫生监测,监测结果显示:噪声强度超标率达20%,粉尘浓度超标率达80%,一氧化碳和二氧化碳浓度均符合国家职业卫生标准;同时根据乌海市安监局的要求,又对全公司采区场进行了作业场所环境卫生监测,合格率达80%以上。
2009年,根据乌海市安监局的要求,对全公司采区进行了作业场所环境卫生监测,合格率达90%以上。
2010年,在抽取的3个单位监测结果显示:地面作业场所绞车房、压风机房、变电所,噪声强度超标,井下粉尘浓度超标率达38%,一氧化碳和二氧化碳浓度均符合国家职业卫生标准;根据乌海市安监局和神华集团乌海能源公司的要求,我们能源公司职防所对全公司9个采掘单位进行了作业场所卫生监测,合格率90%。
2012年,我能源公司职防所对我公司所有单位进行了职业卫生监测,监测结果显示:噪声强度超标率达20%,粉尘浓度(1604工作面)超标率达80%,一氧化碳和二氧化碳浓度均符合国家职业卫生标准;同
仪共六台,同时限制或淘汰危害劳动者健康的落后技术、工艺、设备和材料,积极开发、推广和应用有利于职业病防治的新技术、新工艺、新材料、新设备,从根本上减少和消除职业病危害。
杜绝产生源头
我公司除严格劳保用品的使用,严格防护措施的执行外,有关部门还定期组织人员深入井下和作业现场督查,重点整治井下防尘设施,进一步完善通风系统,狠抓井下质量标准化建设,有效降低了人体摄入粉尘量和有毒有害气体量;定期组织职工体检,做到早发现、早治疗、早鉴定;严格落实有关津贴补助的发放,解决了职工的后顾之忧。
四、降低职业发病率的主要作法
1、对新矿工人和在岗的工人进行职业健康检查。这样,企业可以了解和掌握劳动者的健康状况,及早发现职业禁忌证的人员和及早发现化学毒物对健康的损害,通过调换患有职业禁忌证的人员的工作岗位和治理工作场所存在的职业危害,避免发生职业危害事故。降低职业病发病率。通过我公司与能源公司职防所对其进行健康监护体检,能提前查出职业禁异证由于措施得力,程序规范,有效的促进了队伍的壮大和建设。
2、做好个人卫生防护工作
我公司为落实好国家颁布《职业病防治法》第二十条规定用人单位“必须采用有效的职业病防护设施,并为劳动者提供个人使用的职业病防护用品。为劳动者我们的员工个人提供的职业病防护用品必须符合防治职业病的要求;不符合要求的,不得使用。我公司坚持按照规
劳动合同中未告知的存在职业病危害的作业时,我公司并如实告知劳动者从事职业存在职业安全健康危害及防护措施,真正体现了诚实信用、公平合理的基本原则。同时我们在入井井口做了四块职业健康宣传牌板包括(公告栏告知、警示告知、培训告知、职业病危害等)
公告栏告知
我公司在矿区内醒目位置设置公告栏,公布有关职业病防治的规章制度、操作规程、职业病危害事故应急救援措施和工作场所职业病危害因素检测结果。”实施公告栏告知,可让劳动者熟悉我公司制定的各项职业卫生管理制度、操作规程,了解工作场所职业病危害的真实情况,增加管理的透明度,调动起工人的积极性,配合企业做好职业病防治工作。这有利于避免因劳动者不了解职业病危害而盲目操作,导致受害。
警示告知
我公司并在井下对产生严重职业病危害的作业岗位(特别是井下岩巷喷浆、采煤工作面作业等地区)醒目位置,设置警示标识和中警示说明。并载明产生职业病危害的种类、后果、预防以及应急救治措施等内容。”、“对可能发生急性职业损伤的有毒、有害工作场所,设置报警装置,特别是瓦斯积聚地区和回风巷都悬挂风速传感器、瓦斯检测仪、一氧化碳检测仪等设备,并在职工不可进入的盲巷设置警示栏,防止职工误入,出现事故。
培训告知
通过职业卫生培训,告知劳动者有关的职业卫生知识,让劳动者
职业健康监护工作包括职业健康检查,健康状况分析和建立健康监护档案等工作。职业健康检查包括:上岗前、在岗期间、离岗时和应急健康检查。
5、加强职业危害宣传培训
防治职业病关键在于预防。为此,我公司加大宣传力度,深入开展《职业病防治法》宣传,2013年在能源公司职防所的组织下在工业广场做了大力宣传,特请3m职业健康系列产品对员工进行职业病防治知识、相关法律法规更加了解。同时,通过向全矿员工公开监督电话、设立举报箱等形式,接受员工的职业卫生咨询和举报监督。通过宣传教育,让员工了解煤矿生产的特点、职业病的危害和防治常识,增强了员工的基本防护技能和健康保护意识。
源头防范
我公司除严格劳保用品的使用,严格防护措施的执行外,有关部门还定期组织人员深入井下和作业现场督查,重点整治井下防尘设施,进一步完善通风系统,狠抓井下质量标准化建设,有效降低了人体摄入粉尘量和有毒有害气体量;定期组织职工体检,做到早发现、早治疗、早鉴定;严格落实有关津贴补助的发放,解决了职工的后顾之忧。
地面环境保护
公司严格遵守国家环境保护法律法规,持有合法有效的排污许可证。排出的矿井水经过处理后成为灌溉水源;矸石集中堆积,并投入巨资将矸石山绿化改造,防止因有风天气将粉尘到处飞扬,为解决该问题,给地面职工创造良好环境,减少每天吸入肺部粉尘量,我公司
康体检、监督监测工作难度大、阻力大。
3、对职业病防治工作重视不够大,经费投入相对不足,我公司在职业卫生工作方面的协调合作积极性不够,《职业病防治法》等法规执行不够到位,执罚疲软。
4、职业病防治工作人才队伍薄弱,经验相对不足,技术层次较低,应对繁重的职业病防治工作还有待提高技术和积累经验。
5、要切实有效贯彻《职业病防治法》。建设高素质的职业病防治工作队伍,加大力度,对我公司职业病危害严重的问题加强监督检查,促使我公司严格按照《职业病防治法》做好职业病防治工作。
6、针对我公司目前职业病防治工作的现状,要进行生产场所职业病危害因素监督自查,组织接触有毒有害工人进行定期身体健康检查,以确保职业病危害因素监测工作的进一步得到全面落实,工人身体健康进一步得到保障。
公乌素煤业公司职业健康监护办公室
二〇一三年八月八日
第三篇:数据挖掘与分析心得体会
正如柏拉图所说:需要是发明之母。随着信息时代的步伐不断迈进,大量数据日积月累。我们迫切需要一种工具来满足从数据中发现知识的需求!而数据挖掘便应运而生了。正如书中所说:数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献。
1、数据挖掘
数据挖掘应当更正确的命名为:“从数据中挖掘知识”,不过后者显得过长了些。而“挖掘”一词确是生动形象的!人们把数据挖掘视为“数据中的知识发现(KDD)”的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤!
由此而产生数据挖掘的定义:从大量数据中挖掘有趣模式和知识的过程!数据源包括数据库、数据仓库、Web、其他信息存储库或动态地流入系统的数据。作为知识发现过程,它通常包括数据清理、数据集成、数据变换、模式发现、模式评估和知识表示六个步骤。
数据挖掘处理数据之多,挖掘模式之有趣,使用技术之大量,应用范围之广泛都将会是前所未有的;而数据挖掘任务之重也一直并存。这些问题将继续激励数据挖掘的进一步研究与改进!
2、数据分析
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
数据分析有极广泛的应用范围。典型的数据分析可能包含以下三个步:
1、探索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。
2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。
3、推断分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。
数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。
由上可见,数据挖掘和数据分析虽然概念上层次清晰,作用上分工明确(数据分析主要以上数理统计为主,数据挖掘主要是挖掘算法为主)。但很明显的是,数据挖掘必须借助数据分析的有关方法来挖掘出有效的,对目标应用有意义的模式和知识。或者可以说:数据挖掘也可以是数据分析的一种!
在这样一个信息迅速膨胀的时代,数据挖掘和分析都与大量数据打交道。两者都离不开一种80年代后期兴起的一种高级数据分析技术:数据仓库和联机分析处理。
3、数据仓库
数据仓库是一个从多个数据源收集的信息存储库,存放在一致的的模式下,并且通常驻留在单个站点上。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。为便于决策,数据仓库中的数据围绕主题组织。数据存储从历史的角度提供信息,并且通常是汇总的。数据仓库提供一些数据分析能力,称作联机分析处理(OLAP)。
数据仓库有以下四种关键特征:
面向主题的:数据仓库围绕一些重要主题,如顾客、供应商、产品、和销售组织。数据仓库关注决策者的数据建模与分析,而不是单位的日常操作和事务处理。因此,数据仓库通常排除对于决策无用的数据,提供特定主题的简明视图。
集成的:通常,构造数据仓库是将多个异构数据源,使用数据清理和数据集成技术,确保命名约定,编码结构,属性度量等的一致性。
时变的:数据存储从历史的角度提供信息。数据仓库中的关键结构都隐式或显式地包含时间元素。
非易失的:数据仓库总是物理地分离存放数据,这些数据源于操作环境下的应用数据。由于这种分离,数据仓库不需要事务处理、恢复和并发控制机制。通常,它只需要两种数据访问操作:数据的初始化装入和数据访问。
4、分类及算法
分类是一种重要的数据分析形式,它提取刻画重要数据类的模型。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会。
分类算法主要有决策树归纳、贝叶斯分类、使用IF-THEN规则分类、神经网络、支持向量机等。
5、聚类分析
聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。
常用的算法有:
划分方法:k-均值算法,k-中心点算法。
层次方法:层次聚类算法、平衡迭代归约和算法、Chameleon(变色龙)、基于密度的方法:DBSCAN算法,OPTICS算法,DENCLUE算法。基于网格的方法:STING(统计信息网格),CLIQUE
6、广泛应用
作为一个应用驱动的领域,数据挖掘融汇来自其他一些领域的技术。这些领域包括统计学、机器学习、数据库和数据仓库系统,以及信息检索。数据挖掘研究与开发的多学科特点大大促进了数据挖掘的成功和广泛应用。
数据挖掘已经有许多成功的应用,如商务智能,Web搜索,生物信息学,卫生保健信息学,金融,数字图书馆和数字政府等。
7、学习总结
数据挖掘技术已经形成很广泛的应用空间,而目前JDMP的版本也在完善当中,大多数数据挖掘开发工具涌现出来。各种相关的框架如Hadoop也如雨后春笋纷纷出现。这些现象的出现,正是因为数据挖掘的发展会有越来越广泛的天空。然而数据挖掘还是有很多需要面临并且急需解决的问题„„而我们也希望其越来越深刻的研究和改进。
对于数据挖掘的学习,还是要注重算法的研究和开发。目前我还很欠缺这一块知识。包括统计学、概率论,机器学习等。数据挖掘是个繁复的过程,需要我们长此以往的研究!
第四篇:饭店月度经营数据统计分析报告
饭店月度经营数据统计分析报告
●月度评述
总体来看,5月份全国饭店市场经营情况略逊于4月份,五星级酒店、四星级酒店及三星级酒店共同呈现小幅度下滑趋势。饭店三项主要经营指标均有不同程度下降,客房收入比出现滑落,餐饮收入比上升;员工平均月薪有较明显上涨,员工流失率基本平稳。
具体来看,五月份饭店市场呈现如下特征:
客房平均出租率为64.49%,其中散客平均出租率为41.34%。平均出租率同比2011年5月的66.59%下降了2.1个百分点,环比2012年4月的68.62%下降了4.31个百分点。
平均房价为472元,其中散客平均房价为529.74元。平均房价同比2011年5月的468元上涨4元;环比2012年4月的479元下降5元。
5月份饭店单房平均收益为305元,同比2011年5月的309元下降4元,环比2012年4月的325元下降了20元。环比下降明显。
5月份客房收入比为42.16%,同比2011年5月的44.80%下降了2.64个百分点;环比2012年4月的47.36%下降了5.2个百分点。
5月份餐饮收入比为47.10%,同比2011年5月的43.34%上升了3.76个百分点;环比2012年4月的41.19%上升5.91个百分点,涨幅明显。
5月份饭店平均食品成本率为44.57%,平均酒水成本率为37.55%,平均人工成本率为24.06%,平均能耗成本率为
7.98%。
5月份饭店员工平均流失率为4.78%,同比去年5月份的4.62%略有上升,环比4月份的4.93%有所下降;员工平均月薪为2361.31元,环比4月继续提高。
5月份自行管理的饭店平均出租率为63.65%,环比、同比均小幅下降;平均房价为417元,同比降低51元,环比下降2元;单房收益为271元,同比、环比均出现下降;员工流失率为5.24%,同比、环比小幅上升;员工平均月薪为2300.47元,环比继续上涨。
国内公司管理的饭店平均出租率为64.61%、平均房价为513元、单房收益为315元,国内公司管理的饭店三项主要经营指标环比均有不同程度下降,员工流失率为3.75%,环比略有下降;员工月薪为2378.94元,环比有较明显上升。
国际公司管理的饭店三项主要经营指标环比均小幅度上升、员工流失率环比略有下降、员工平均月薪环比上月基本持平。
五星级饭店平均出租率为57.3%,同比下降、环比下降;平均房价为671元,同比上涨45元、环比上涨9元;单房收益为398元,同比上涨,环比下降。
员工流失率为4.32%,环比下降、员工平均月薪为2486.18元,环比上升。四星级饭店平均出租率为69.38%,同比下降,环比也小幅度下降;平均房价为418元,同比持平、环比下降;单房收益为295元,同比持平,环比小幅下降。
员工流失率为5.05%,同比、环比均有所上升、员工平均月薪为2379.38元,环比基本持平。
三星级饭店平均出租率为59.91%,同比、环比下降幅度明显;平均房价为270元,同比持平、环比小幅下降;单房收益为166元,同比、环比下降明显。
员工流失率为4.08%,同比、环比均有所下降、员工平均月薪为2048.87元,环比基本持平。
第五篇:数据统计分析方法
数据统计分析方法
排列图:
排列图是由两个纵坐标,一个横坐标,若干个按高低顺序依次排列的长方形和一条累计百分比折线所组 的,为寻找主要问题或主要原因所使用的图。
排列图有以下优点:直观,明了--全世界品质管理界通用用数据说明问题--说服力强用途广泛: 品质管理 / 人员管理 / 治安管理排列图的作图步骤收集数据(某时间)作缺陷项目统计表绘制排列图画横坐标(标出项目的等分刻度)画左纵坐标(表示频数)画直方图形(按每项的频数画)画右纵坐标(表示累计百分比)定点表数。
因果图何谓因果图:
对于结果(特性)与原因(要因)间或所期望之效果(特性)与对策的关系,以箭头连接,详细分析原因或对策的一种图形称为因果图。因果图为日本品管权威学者石川馨博士于1952年所发明,故又称为石川图,又因其形状似鱼骨,故也可称其为鱼骨图,或特性要因图作因果图的原则采取由原因到结果的格式通常从‘人,机,料,法,环’这五方面找原因‘4M1E’, Man, Machine, Material, Method, Environment通常分三个层次:主干线、支干线、分支线尽可能把所有的原因全部找出来列上对少数的主要原因标上特殊的标志写上绘制的日期、作者、有关说明等作因果图应注意的事项问题(结果)应单
一、具体,表述规范最后细分出来的因应是具体的,以便采取措施;在寻找和分析原因时,要集思广益,力求准确和无遗漏可召开诸葛亮会,采用头脑风暴法层次要清,因果关系不可颠倒原因归类正确作因果图应注意的事项画法按从左至右的贯例执行--规范化在作因果图前,可先从排列图中找出主要问题,然后针对主要问题,召集相关人员进行讨论,力求尽可能找出产生问题的原因,通过分析,确立主要原因。因果图在今后可不断进行修改,逐渐完善,反復使用。
直方图:
是通过对数据的加工整理,从而分析和掌握品质数据的分布状况和估算工序不合格率的一种方法。直方图的作法作直方图的三大步骤作频数表画直方图进行有关计算作直方图的步骤(例3)1.搜集数据作直方图的步骤计算极差(Range),上表中最大值Xmax=48;最小值Xmin=1;R=Xmax-Xmin=48-1=47适当分组(k)在本例中,取k=10确定组距(h)组距用字母 h 表示:h=R/k=47/10=4.7, Y约等于5。确定各组界限--组的边界值单位取最小测量单位的一半。作直方图的步骤本例第一组的下限为:第一组的上限值为下界限值加上组距第二组的下界值为上界限值,第一组的上界值加上组距就是第二组上界限值,照此类推,定出各组的边界。编制频数分布表
分层法
分层的目的是把杂乱无章和错综复杂的数据,按照不同的目的、性质、来源等加以分类整理,使之系统化、条理化,能更确切地反映数据所代表的客观事实,便于查明产品质量波动的实质性原因和变化规律,以便抓住主要矛盾,找到主要影响因素,从而对症下药,采取相应的措施。
分层的原则是使同一层内的数据波动尽可能小、而层与层之间的差别尽可能大。
为了达到目的,通常按操作者、机器设备、材料、工艺方法、测量手段、环境条件和时间等标志对数据进行分层。
调查表
调查表也叫检查表或核对表,它是一种为了便于搜集数据而使用简单记号并予统计整理,并作进一步分析或作为核对、检查之用而事先设计的一种表格或图表
控制图
控制图是一种带有控制界限的反映过程质量的记录图形,图的纵轴代表産品质量特性值(或由质量特性值获得的某种统计量);横轴代表按时间顺序(自左至右)抽取的各个样本号;图内有中心线(记爲CL)、上控制界限(记爲UCL)和下控制界限(记爲LCL)三条线(见下图)