第一篇:利用python轻松玩转Excel,完成数据分析与统计,学习心得分享
利用python轻松玩转Excel,完成数据分析与统计,学习心
得分享
写在前面这是我学习python写的第一个完整的脚本过程大概是从一头懵逼,到满是问题,再到一个个解决问题我没有系统的学习过python阻碍我的问题是什么,我就学什么这里尤为重要的一点,就是需要清楚的知道自己需要什么对于一个初学者来说,这真的是很难有时候就算知道自己需要什么,也不知道该如何准确的表达这是一个极为让人迷茫和不知所措的过渡时期个人的总结有明确的目标将大目标分解成最小颗粒的小目标针对小目标,一个个去解决举例目标:有一份市面上主流机型使用某APP的兼容性测试报告,包括了详细的手机信息,其中报告中“日志包”这一列是一个超链接,可以访问下载一个ZIP日志包,现需要检查每一个日志文件里是否包含事先埋点的信息,并根据需要生成一份报告目标分解:打开excel测试报告访问“日志包”这一列的超链接,下载ZIP文件解压ZIP文件,得到log文件利用正则表达式,在log文件里查找埋点信息,返回查找结果提取当前行其它需要的信息生成最终结果文件实现脚本动态打印处理进度结果文件源码获取方式私信“数据分析与统计”源码与兼容性报告
第二篇:数据统计与分析演讲稿
演讲稿
以下是我们的数据统计与分析
1、通过分析原始数据,我们发现湛师运动人数多,对运动设施的需求量大
由图表一我们可以看到:
高达45人的受访者一周运动次数在1—2次间,30人在5次以上,还有8人一周基本没有运动,经过计算湛师学生一周运动量次数至少有两万次。另外周一至周五,运动场在日间基本是不开放的,而且体育馆或篮球场总是有体育课,学生们也有课,所以大家基本都在周六日或晚上运动,人流量太大。因此我校对于运动设施的需求较大。
2、其次,我们发现湛师学生不进行运动的原因与运动场地的问题有较大的联系
通过图表二,我们可以看出受访者不进行的运动的原因有很多,其中以自身因素不进行运动是不进行运动的原因,但是也有32人认为有场地数量少的因素,将近三分之一的人数,还有13人认为是运动场地远,还有其他的客观因素。由此可以看出湛师运动设施的场地数量和分布位置对大部分湛师人的运动次数有一定的影响。
3、我们的调查问卷还涉及到湛师学生对湛师运动设施的了解程度
由图表可知,超过半数人对运动设施的了解程度一般,但还是有21人认为他们不了解湛师的运动设施,只有23人认为他们在了解程度以上的。由此可以看出大部分湛师人对湛师的运动设施都处于一知半解的状态甚至是不了解,因此湛师应该加大对湛师运动设施的宣传力度,加深湛师人对运动设施的了解。
4、关于目前湛师运动设施存在的问题
从表格与图中可看出,最多人人为学校运动设施存在的最大的问题是运动设施的运动数量较少,其次是有33%的被调查者认为湛师的运动设施年久失修,有损失,接着也有学生认为运动设施还存在人为损失的问题,最后是7%的学生觉得游泳馆的收费是有问题的。经过调查我们不难看出学校在运动设施方面还存在着许多的问题,最大的问题就是设施的年久失修和数量过少的问题,所以建议学校可适量地增加运动设施,定期地派人进行维修,光靠学校的力量是不足以维护好学校的设施,我们同学自己也要维护好这些公共的财产。
5、此外关于湛师学生认为数量不足的运动场地
从表和图中可以看出,大多数的人即27%的人认为学校的羽毛球场的数量不足,还有相当一部分人认为游泳馆的场地有限,占到19%,觉得篮球场和乒乓球场数量不多的人数差不多相同,最后剩下少部分人觉得其它运动场地的数量少,比如排球场、田径场和足球场。大多数同学反映,不是他们不想运动,而是运动场地实在是有限,或者是场地离中心地区较远,较偏僻,这应该引起学校的重视。
6、表六是湛师学生对湛师运动设施的爱惜情况
通过表与图可知,在调查身边的同学对运动设施的爱惜情况的问题上,明显可看出绝大多数人都觉得身边的同学对运动设施的爱惜情况是一般般,有17%的人的身边的同学是爱惜运动设施的,剩下的10%的人的身边的同学是不爱惜运动设施的。爱惜设施的程度与自身的素质有关,不爱惜设施的同学还是大有人在,但我们维护好公共设施时才能更好的维护自己的利益,我们自己才能更多的享受运动给我们带来的好处。
7、表七是学校在关于运动设施的问题上与学生沟通的程度
如表7和图所示,大学生们在关于学校在有关设施问题上有没有及时有效地与同学沟通的问题上,给出了自己的意见。68%的同学认为学校在运动设施的问题上很少与学生及时有效地沟通,同时也占了较大比重的28%的同学表示没怎么留意,很少的同学认为学校在关于运动设施的问题上与学生沟通较多,占到被调查者的4%。所以希望学校可以在以后有关设施的问题上多与同学沟通,可以派几名代表与学校进行对话,可传达出学生的意见。
8、表八是湛师学子对现有的运动设施改进的看法
由表8与图可得出,大学生们对我校现有的运动设施积极地提出了自己的看法,看来大学生对自身有切实利益的问题还是比较关心的。我们不难看出,43%的学生认为学校目前应该着手完善室内室外的运动设施,接着认为学校应该加派人手维护运动设施和应该增添更多的休息区的人数是一样的,最后也有相当一部分也就是17%的学生认为学校应该加大宣传,增强学生维护公共设施的意识,很少有学生选择其它的。现在大学生运动的群体不是特别高,这也跟学校对运动设施方面的关注度,这应该引起学校的重视,通过有效的手段提高学生对运动的重视。
通过本次数据分析我们的除了以下调查结论与建议
1、调查结论:(1)由本次调查可知湛师学生对运动设施的需求量较大,而湛师学生不想运动的原因与目前湛师运动设施所存在的问题有很大的关系。(2)湛师运动设施存在的问题主要是运动设施的数量少与设施年久失修,有严重损伤,当然运动设施的破损与学生对湛师运动设施的爱惜程度有很大的关系,因为很多同学对湛师运动设施的爱惜程度都是一般般,不爱惜设施的同学也不少。(3)学校在关于运动设施的问题上很少与学生进行沟通,大部分学生对于湛师运动设施的了解程度都是一般般,甚至是不了解,这使得很多关于运动设施的问题得不到及时的解决与完善,也使得学生们对运动设施的需求与建议得不到满足与答复。
2、建议:存在问题是难免的,但最重要的是怎样去利用有效的途径去解决问题。通过调查,我们可以给出小小的建议。现在提倡全民运动,因此学生对运动设施的需求还是比较较大的,所以学校可适量地增加运动设施。为了提高学生的运动次数与质量,以后学校可把运动设施建设在人流较多且地理位置靠近中心的地方,这样人们运动起来也更加的方便。而且对运动设施进行定期的维修也是非常有必要的,破破烂烂的运动设施钩不起人们运动的欲望,加大宣传保护运动设施的重要程度。不过做运动的人们更应该爱护这些公共的设施,如果人人都把这些设施当做是自己家的财产,那么我想人们任何时候都可享受到很好的运动效果。最后想说的是决策问题,进行有关的运动设施的建设,学校可通知学生代表参加有关建设问题的会议,集思广益,这样才更有利于学校的管理。
第三篇:数据统计与分析心得
数据统计与分析心得
(第三组)
数据统计与分析是一个比较复杂、比较费时和费力的工作,在工作中,小组成员既要有明确的独立的分工,也要有集体的团队的协作精神。每个人在统计数据时都要做到认真严谨、实事求是,要有耐心而不是用一颗浮躁的心来对待工作。在数据分析中,要用一颗客观的、真实的心来做好对统计数据的客观分析与评价。这样才能使问卷调查统计出来的数据真实有效,为下一步的工作实施和决策做好准备。
我们这次东华理工大学校园文化调查问卷印发的总数为210份,其中有6份未收回,实际收回问卷共204份,其中无效问卷(被调查人未填写性别、专业、年级等相关信息)有5份,则实际有效问卷为199份。合格问卷占总数的94.76%,问卷收回率较高。在接下来的数据统计与分析中,则以此199份有效问卷的数据来统计,并计算数据结果。
此次参与问卷调查的年级有11级大
一、10级大
二、09级大三的学生,08级大四学生未参与调查,其中问卷调查又以大一学生为主,有186人,占总人数的93%;而大二学生只有8人,占总人数的4%,大三学生只有5人,占总人数的3%。在此次参与问卷调查的性别比中,女生有136人,占总人数(199人)的68.34%;男生有63人,占总人数的31.66%。问卷调查的女生占有多数。
此外,这次问卷所调查的专业有15个专业,其中文科类专业(广告、法学、对外汉语、英语)调查人数有133人,所占总人数的百分比为66.83%;经济类专业(国际贸易、旅游管理、会计、市场营销、物流管理)调查人
数有50人,占总人数的百分比为25.12%;理科类专业(自动化、科工程、土木工程、资源勘探、信息管理、测绘工程)调查人数有16人,占总人数的百分比为8.05%。调查对象以文科类同学占多数。
在这次数据统计与分析过程中,我们发现了问卷还存在一些问题,但总体还是好的。首先,问卷中存在漏字的情况,主要是出题组印刷前没有认真做好校对的工作造成的;其次,选项有的出现错乱及其选项中没有明确注明题目是多选或者单选的题目,因此在我们数据统计过程中也带来了一些困惑,但经过向出题组的询问,我们还是明确了题目的多选与单选问题。但我想,这对于我们的调查所统计出来结果,其实际真实效果多少会有一些水分的。再次,就是我们问卷的发放组没有考虑我们要调查的比例的分配,比如年级的比例分配、专业类别的比例分配、男女性别的比例分配。这样就造成我们统计分析出来的数据有一点不合理性、不太全面性。此外,我们数据统计与分析小组中也出现过一些问题,由于我们从来没有做过数据统计与分析的工作,因此缺乏经验,在统计数据过程中其实每一道题也有不不合理的作答选项,而我们第一次都把他们统计上了,没有考虑到每道题都有回答无效的答案。而后来的结果是,又让我们成员重新统计了一次,这次考虑了把每道题目中无效答案剔除后,再统计出每道题目中有效答案的选择数量。
数据统计与分析不但要有团队协作的精神,而且还要会懂电脑,利用Excel操作系统来计算出最终的数据结果。这就在不同的两个方面考查了我们当代大学生应有的素质。在这次数据统计与分析过程中,我们组成员都表现得积极认真,按时按量地完成了我们每个人所分配的任务。因此在这次数据统计与分析中我们组虽然花费了有一定的时间,但还是比较少的,而且成功地完成了这次统计任务。这也为下一组的成员的论文写作及其总结工作争取了更多的时间。在使用Excel操作系统时,由于有些成员不会使用此操作,所以给其他会操作的成员增加了工作量。在此也让这些不会使用电脑操作系统的同学能够体会到对于掌握好电脑基础知识的重要性。希望他们都能够好好地学习这些知识,为今后的工作和学习带来更多的便利。
这次问卷调查的数据统计与分析实践活动,让每个同学都有收获。有的收获了出题时应当注意的问题,有的收获了问卷调查中所获得的经验,有的收获了同学们之间的友谊,使同学之间的交流与沟通在实践活动中无形当中就增加了,有的〃〃〃〃〃〃
总之,我们都认为这次问卷调查实践活动是一次成功的实践活动,因为在这次调查活动中,我们都看到了每一个同学都在努力的把事情做的更好,都认真地对待自己所分配到的任务,都在积极的讨论与交流。
另:附第三组成员数据统计与分析的工作图片
第四篇:数据的统计与分析教案
数据的统计与分析教案
www.5y
kj.co
m 数据的统计与分析
教学内容:本节课的内容安排是七上第四章的一点补充,即在学习了数据的分析的基础上带学生到网络教室利用网络和EXcEL平台对生活和社会中的一些热点问题的相关数据进行统计和分析并得出相应的信息
教材分析:数据的处理和分析是社会生活中较为普遍的一个知识点,与我们的生活息息相关,也是北师大版新教材每学期都要涉及的一个重要内容。本节课不仅仅要让学生回顾和掌握所学的相关知识,还要通过动手实做了解信息技术在数据处理中的作用。
学校及学生状况分析:重庆外国语学校是全国首批创办的八所外国语学校之一,重庆市教委直属重点中学,全国享受20%保送名额的13所外国语学校之一,学校设备先进一流,实现了校园网络化,学生来自全国各地,素质普遍较高,由于我校是国家级课题“Z+Z智能教育平台运用与国家数学课程改革的实验研究”实验学校,学生有在网络教室上数学课的实际体验。
学习目标:
认知目标:经历综合运用已有知识解决问题的过程,加深对数据的认识,体会数学与现实生活的联系。
能力目标:经历观察、比较、估计、推理、交流等过程,发展获得一些研究问题与合作交流的方法与经验。让学生实际操作,了解信息技术在数据处理中的作用。
情感目标:设置丰富的问题情景与活动,激发学生的好奇心和自动学习的欲望,让学生想学,会学,乐学;体验数学与日常生活密切相关。
重点:通过对数据的分析从而得出相应的一些信息
难点:比较、估计、推理等方法的应用
教具:采用多媒体教学并让学生在网络教室动手实做。
教法:运用多种教学方法,既有老师的讲解,又有学生探索、师生共做,学生小组合作及动手实做。
教学过程:
我们今天生活的这个世界,是一个充满信息、瞬息变化的世界,而表达信息的重要方式之一就是数据。如果大家看看报纸、电视,就会发现无论是新闻、经济论坛、天气预报、广告或者是体育比赛,很多地方都十分频繁地使用着数据。请大家从自己的身边选取一两个有意义的数据,并想一想从中可以获得哪些信息?
为了要了解自己感兴趣的事情,人们往往需要收集数据、分析数据、整理数据。它的一般过程是:
感受生活中的数据→经历数据处理的过程→从数据中获取信息
下面我们来看几个具体的例子,我们首先来回顾一下去年发生的伊拉克战争的实况。
一、战争
XX年3月20日,美英联军绕开联合国,直接向伊拉克发动了代号为“斩首行动”的大规模军事行动。美英飞机全天侯对伊拉克各目标进行轰炸,造成大量平民伤亡和建筑物被毁,其中包括老人、妇女和儿童。伊拉克共和国卫队和民兵也进行了还击,甚至采用自杀性袭击,造成美英联军的部分伤亡。
战争是残酷的,轰炸以后的伊拉克到处是断壁残垣。
伊拉克的平民也遭受了极大的痛苦。
综合到目前为止,有下列一些相关数据:
①美军死亡125人,英军死亡37人。
②伊拉克平民死亡625人,受伤4000多人,军人无相关统计。
③美英联军已向伊发射18000余枚精确制导炸弹和近1000枚“战斧”式巡航导弹
④布什总统向国会要求拨款747亿美元用于对伊战争并获得批准,英国也紧急追加拨款19亿英镑。
⑤伊拉克是世界第二大产油国,随着战争时间的延长,全世界股市下挫,油价上扬,经济学家预测:伊拉克战争造成中东地区经济损失约4000亿美元,伊拉克经济战后将倒退20年并将导致全球经济萎靡。
⑥几只伊拉克的鸟儿为躲避战火飞到我国南昌,专家分析,这次战争会导致相当长一段时间该地区气候异常。
⑦全世界每天都有数百万群众举行反战游行示威活动。
请大家以小组为单位就以上数据进行讨论,你能从其中获得哪些信息? ,但最有意义的信息是:
我们需要和平!
二、体育
其实在我们的生活中还经常发生没有硝烟的战争──体育
同学们最喜欢的体育运动是什么?
下面我们来看一个关于足球的例子:
有甲、乙、丙三个足球队进行单循环比赛,一共比赛了三场,比赛情况如下:
胜
负
平
进球数
失球数
甲队
0
0
乙队
0
丙队
0
0
请你根据上表中的数据,你能从其中获得哪些信息?
以小组为单位进行讨论,一般情况下,同学们都是从数据的表面得到一些相关结论,如甲队第一、乙队第二、丙队第三,没有平局,甲队赢两场、乙队赢一场、丙队全输等信息。
其实,我们还可以从更深层次进行分析:给出的数据是否有错误;更进一步,我们是否可以从这些数据中得到三场比赛的具体比分?
有甲、乙、丙三个足球队进行单循环比赛,一共比赛了三场,比赛情况如下:
胜
负
平
进球数
失球数
甲队
0
0
乙队
0
丙队
0
0
请你根据上表中的数据,写出三场比赛的具体比分。
,来做一道比较简单的问答题:
练习:阅读下列数据:
①北约1999年对南联盟78天轰炸期间共使用了3万多枚贫铀弹.②中国总人口数为12.9533亿.③我们班献血的人数有38人.④据联合国XX年发表的报告,今后5年内全球预计有1550万人死于艾滋病.⑤由于受“9?11”事件的影响,美国航空公司裁员约50000人.其中哪些是精确的数据?
三、人口与发展
西部大开发,中国才能大发展,早在几年前,中共中央、国务院就作出了“西部大开发”的战略决策,近几年,西部地区也得到了长足的发展。下面请同学们打开国家统计局的网站,下载XX年西部地区的人口数和国内生产总值。然后打开Excel表,自己设计出相应的统计表,再用Excel表计算人均国内生产总值。
XX年西部地区相关数据
西部十二省区
人口数
国内生产总值
人均国民生产总值
重庆
3090
971.1
0.63789644
四川
8329
4875.12
0.585318766
云南
4288
2231.88
0.520494403
广西
4489
2437
0.542882602
内蒙古
2376
732.48
0.729158249
x疆
925
598.28
0.830275325
宁夏
562
329.7
0.586654804
青海
518
341.03
0.658359073
甘肃
2562
161
0.453161593
首先从各个省市的人口数据进行分析,如谁的人口最多?谁的人口最少?哪些又比较接近?等等。类似地分析国内生产总值。
下面我们通过Excel表将上面的数据制成扇形统计图和条形统计图更形象地进行分析
进一步提问,四川省的人口和国内生产总值都是最多的,是否人均国内生产总值也是最多?若否,又是谁?能否简要说明理由等等。
练习:N地政府为了振兴本地经济发展,打算在N地开办一家尼龙制品厂,阅读下表并完成下列问题。
尼龙制品厂区位成本比较表
选定地点
成本构成 成本合计
劳动费
电
费
燃料费
原料费
成品运费
税
收
A
B
c
D
E
F
..m
N
..Z
6.00
6.00
4.00
3.00
6.00
7.00
..6.00
8.00
..5.00
3.50
3.50
3.00
3.00
2.50
2.50
..3.00
2.00
..3.00
2.00
2.00
2.00
2.00
.50
.50
.& nbsp;
.2.00
2.00
..2.00
9.00
7.00
6.00
7.00
5.00
5.00
..8.00
8.00
..9.00
0.00
8.00
8.00
8.00
7.00
9.00
..6.00
6.00
..8.00
5.00
5.00
6.00
6.00
3.00
4.00
..3.00
4.00
..6.00
35.00
31.00
29.00
29.00
25.00
29.00
..28.00
30.00
..33.00
从表中可以看出,在影响N地生产尼龙制品的诸多因素中,N地与其它地区比较因_______过高而无竞争力,看来这个地区不适于发展需要较多_______的企业,但N地的_______成本与其它地区相比具有明显的优势,比其它地区成本最低的那个还要低______%,故N地适合发展_________的企业。
小结:通过以上的数据分析,让同学们自己进行小结,从本节课的学习过程中自己学习到了哪些东西?掌握了哪些方法?对数学的认识是否又获得了一些新的发展?等等
作业:略
教学过程预期
本课采用“创设情境-提出问题-解决问题-应用拓展”的教学过程,知识与能力要求符合学生实际并体现新课程标准的基本理念。学程设计使学生不仅获得了书本上的知识,而且让学生实际操作,了解信息技术在数据处理中的作用,完善了认知结构,拓展知识应用,渗透数学思想方法,体现应用与创新意识。设计的几个实例都是社会中的热点问题,使课堂气氛活跃,学生积极主动地参与学习的全过程并在学法上有一定收获。让大多数学生能正确掌握知识,并能运用所学的知识解决简单的实际问题。老师及时进行课堂信息反馈,评价中肯且有激励作用,并能给学生创设二次评价的机会,帮助学生认识自我,建立信心。
www.5y
kj.co
m
第五篇:C02 利用Python实现大数据分析与数据挖掘技术培训(5天)
Python实现大数据挖掘技术培训
【课程目标】
Python已经成为数据分析和数据挖掘的首选语言,作为除了Java、C/C++/C#外最受欢迎的语言。
本课程基于Python工具来实现大数据的数据分析和数据挖掘项目。基于业务问题,在数据挖掘标准过程指导下,采用Python分析工具,实现数据挖掘项目的每一步操作,从数据预处理、数据建模、数据可视化,到最终数据挖掘结束,帮助学员掌握Python用于数据挖掘,提升学员的数据化运营及数据挖掘的能力。
通过本课程的学习,达到如下目的:
1、全面掌握Python语言以及其编程思想。
2、掌握常用扩展库的使用,特别是数据挖掘相关库的使用。
3、学会使用Python完成数据挖掘项目整个过程。
4、掌握利用Python实现可视化呈现。
5、掌握数据挖掘常见算法在Python中的实现。【授课时间】
5天时间
(全部模块讲完需要5天时间,可以根据时间需求拆分内容模块)。【授课对象】
业务支持部、IT系统部、大数据系统开发部、大数据分析中心、网络运维部等相关技术人员。【学员要求】
课程为实战课程,要求:
1、每个学员自备一台便携机(必须)。
2、便携机中事先安装好Excel 2010版本及以上。
3、便携机中事先安装好Python 3.6版本及以上。
注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。
【授课方式】
语言基础 +挖掘模型 +案例演练+开发实践+可视化呈现
采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。【课程大纲】
第一部分:Python语言基础
目的:掌握基本的Python编程思想与编程语句,熟悉常用数据结构的操作
1、Python简介
2、开发环境搭建 Python的安装 扩展库的安装
3、掌握Python的简单数据类型
字符串的使用及操作 整数、浮点数
4、掌握基本语句:
if、while、for、print等 基本运算:
函数定义、参数传递、返回值
5、掌握复杂的数据类型:列表/元组
列表操作:访问、添加、修改、删除、排序 列表切片、复制等 列表相关的函数、方法 元组的应用
6、复杂数据类型:字典 创建、访问、修改、删除、遍历 字典函数和方法
7、复杂数据类型:集合
8、掌握面向对象编程思想 创建类、继承类 模块
9、函数定义、参数传递、返回值10、11、标准库与扩展库的导入 异常处理:try-except块
演练:基本的Python编程语句
第二部分:Python语言与数据挖掘库
目的:掌握数据集结构及基本处理方法,进一步巩固Python语言
1、数据挖掘常用扩展库介绍 Numpy数组处理支持 Scipy矩阵计算模块
Matplotlib数据可视化工具库 Pandas数据分析和探索工具 StatsModels统计建模库 Scikit-Learn机器学习库 Keras深度学习(神经网络)库 Gensim文本挖掘库
2、数据集读取与操作:读取、写入 读写文本文件 读写CSV文件 读写Excel文件 从数据库获取数据集
3、数据集的核心数据结构(Pandas数据结构) DataFrame对象及处理方法 Series对象及处理方法
演练:用Python实现数据的基本统计分析功能
第三部分:数据可视化处理
目的:掌握作图扩展库,实现数据可视化
1、常用的Python作图库 Matplotlib库 Pygal库
2、实现分类汇总
演练:按性别统计用户人数
演练:按产品+日期统计各产品销售金额
3、各种图形的画法 直方图 饼图 折线图 散点图
4、绘图的美化技巧
演练:用Python库作图来实现产品销量分析,并可视化
第四部分:数据挖掘基础 目的:掌握数据挖掘标准流程
1、数据挖掘概述
2、数据挖掘的标准流程(CRISP-DM) 商业理解 数据准备 数据理解 模型建立 模型评估 模型应用
3、数据挖掘常用任务与算法
案例:用大数据实现精准营销的项目过程
第五部分:数据理解和数据准备
目的:掌握数据预处理的基本环节,以及Python的实现
1、数据预处理
异常值处理:3σ准则,IQR准则 缺失值插补:均值、拉格朗日插补 数据筛选/抽样 数据的离散化处理 变量变换、变量派生
2、数据的基本分析
相关分析:原理、公式、应用 方差分析:原理、公式、应用 卡方分析:原理、公式、应用 主成分分析:降维
案例:用Python实现数据预处理及数据准备
第四部分:分类预测模型实战
1、常见分类预测的模型与算法
2、如何评估分类预测模型的质量 查准率 查全率 ROC曲线
3、逻辑回归分析模型 逻辑回归的原理 逻辑回归建模的步骤 逻辑回归结果解读
案例:用sklearn库实现银行贷款违约预测
4、决策树模型
决策树分类的原理 决策树的三个关键问题 决策树算法与实现 案例:电力窃漏用户自动识别
5、人工神经网络模型(ANN) 神经网络概述 神经元工作原理
常见神经网络算法(BP、LM、RBF、FNN等)案例:神经网络预测产品销量
6、支持向量机(SVM) SVM基本原理 维灾难与核心函数
案例:基于水质图像的水质评价
7、贝叶斯分析 条件概率 常见贝叶斯网络
第五部分:数值预测模型实战
1、常用数值预测的模型 通用预测模型:回归模型
季节性预测模型:相加、相乘模型 新产品预测模型:珀尔曲线与龚铂兹曲线
2、回归分析概念
3、常见回归分析类别
第六部分:聚类分析(客户细分)实战
1、客户细分常用方法
2、聚类分析(Clustering) 聚类方法原理介绍及适用场景 常用聚类分析算法 聚类算法的评价
案例:使用SKLearn实现K均值聚类 案例:使用TSNE实现聚类可视化
3、RFM模型分析
RFM模型,更深入了解你的客户价值 RFM模型与市场策略 案例:航空公司客户价值分析
第七部分:关联规则分析实战
1、关联规则概述
2、常用关联规则算法
3、时间序列分析
案例:使用apriori库实现关联分析 案例:中医证型关联规则挖掘
第八部分:案例实战(学员主导,老师现场指导)
1、电商用户行为分析及服务推荐
2、基于基站定位数据的商圈分析
结束:课程总结与问题答疑。