第一篇:数理统计学习心得
数理统计学习心得
现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征。例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等。这时只靠部分数据的描述是无法获得总体特征的知识。我们利用统计推断的方法来解决。所谓统计推断就是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断可以用于总体数量特征的估计,也可以用于对总体某些假设的检验,所以又有不同的推断方法,下面就参数估计和假设检验的基本概念及原理简单谈谈。
参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。参数估计包括点估计和区间估计两种方法。
点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。构造点估计常用的方法是:①矩估计法。用样本矩估计总体矩,如用样本均值估计总体均值。②最大似然估计法。于1912年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。③最小二乘法。主要用于线性统计模型中的参数估计问题。④贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。
区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。1934年统计学家J.奈曼创立了一种严格的区间估计理论。求置信区间常用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。③利用大样本理论。
假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样
本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。假设检验的一般步骤
1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。
假设检验应注意的问题
1、做假设检验之前,应注意资料本身是否有可比性。
2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。回归分析:应用数学的方法,通过对大量的试验数据进行处理和分析,从而得出正确的反映变量之间的相互关系的数学表达式,并判断其有效性。进而根据表达式,根据一些变量的取值去预测或控制另一变量的变化,并分析这些变量对另一变量的影响程度。(强调的是数学模型的建立,且用F检验验证所有自变量与因变量的显著性。用T检验验证模型中每个自变量单独与因变量的影响显著性。)
相关分析:在统计分析中,对两个及两个以上变量间数量关系的性质、特点、表现形式进行描述、处理的一种专门的统计分析技术。变量之间的不严格、不准确、不稳定的数量依存关系被称为相关关系,相关关系的强弱、疏密、因环境、时间的变化而呈现出一种独特的规律性。相关分析的目的就是探索相关关系的变动规律,并利用相关分析的结果,为回归分析及统计决策提供有力的依据。
相关系数只能描述变量间的关系密切程度,不能揭示现象间的本质联系。相关系数:随机向量的各个变量之间线性关系的密切程度。
多重共线问题:当自变量之间存在一定程度的关联,即相关系数在0和1之间时,回归模型中的自变量就会削弱各自对因变量的影响,在一定程度上影响参数估计值的准确性和稳定性。
对多重共线问题的测度:
1,自变量的容忍度,以容许度指标表示。容许度=1-R平方。容许度越大,说明某个自变量X与方程中的其他自变量之间的线性关系越弱,多重共线性较低。反之,容许度接近0,说明某个自变量X与方程中的其他自变量之间的线性关系较强,多重共线性较高,应将此自变量剔除出模型。
2,方差膨胀因子。方差膨胀因子是容许度的倒数,其数值越大,说明自变量之间的多重共线越高。
3,D-W检验。检验模型中的误差项是否存在自相关的一种有效方法。D在0-4之间。D=2,残差之间独立。D<2,残差之间正相关。D>2,残差之间负相关。根据经验,D∈(1.5,2.5)之间表示没有显著自相关问题。
自变量:我们将变量中的原因变量称为自变量,即不受其他因素影响而发生变化在前的变量。
因变量:结果变量,受自变量变化影响而跟着发生变化的变量。
线性回归模型:是线性模型中的一种,变量之间的关系呈线性关系,数学基础是回归分析。(用回归分析方法建立的,变量之间的关系呈线性关系,用以揭示经济现象中的因果关系的模型)。
事件分析法:主要是分析某事件对于社会经济生活是否确实有冲击作用。需要首先界定事件发生作用的时间段,即事件窗口,然后通过事件窗口超额收益的大小来衡量事件的影响。所谓超额收益是指实际收益与假设发生该事件的期望收益之差,而期望收益是由计量经济模型计算。
事件窗口即为事件期。
配对T检验主要解决配对样本数据的两个总体均值有否显著差异的问题。主要解决来自配对样本数据的两个总体均值有否显著差异的问题。所谓配对样本,通常是指对同一观察对象在使用某种新方法前后的两组数据进行比照,用两组数据的均值,有否显著差异来判断这种新方法的有效性。配对样本的T检验对数据的要求:1,抽取样本数据的两个总体必须服从正态分布。2,两个样本的样本容量相同。
显著性水平:假设检验中,常有=0.05,=0.01作为检验的显著水平。显著性水平是指当原假设为真时人们拒绝它的概率,亦称拒真概率。根据假设检验的原理,拒真概率应是一个小概率事件。如果在检验中发现用样本数据计算出来的实际概率小于或等于事先给定显著性水平(p≦),就可以认为这个在一次试验中不应该发生的更小概率,居然在一次试验中发生了,我们有理由怀疑原假设的真实性,所以拒绝原假设。(p>),接受原假设。学习到连续型随机变量时已经与高中学习的相差很大,对连续型随机变量求其在去某值时的概率是无意义的,只能求变量落在某一范围内的概率。因为现实生活中的事件大多受到两个或多个因素影响,很多随机现象中,往往要涉及到多个随机变量,而且这些随机变量之间存在某种联系,因此多维随机变量的知识在生活中应用更广。随机变量的概率密度与分布直接反映出随机变量的分布情况,随机变量的数学期望,方差等在生活中可以帮助人们做出选择。比如大赛前选拔选手才赛,对某产品的质量估计等。
当一些随机变量的分布不易求出或不需要知道随机变量的概率分布,而只需要知道其数学期望,方差即可知道其大概分布情况。随机变量的数学期望反映了随机变量取值的平均值,而随机变量的方差反映了随机变量离开其平均值的平均偏离大小,反映了随机变量的稳定性。
学好数理统计这门课程,其实有很大的作用,它会让人对日常生活中一些涉及概率方面的问题有更加深刻的体会。如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。
第二篇:数理统计学习心得
数理统计学习心得
现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征。例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等。这时只靠部分数据的描述是无法获得总体特征的知识。我们利用统计推断的方法来解决。所谓统计推断就是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断可以用于总体数量特征的估计,也可以用于对总体某些假设的检验,所以又有不同的推断方法,下面就参数估计和假设检验的基本概念及原理简单谈谈。
参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。参数估计包括点估计和区间估计两种方法。
点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。构造点估计常用的方法是:①矩估计法。用样本矩估计总体矩,如用样本均值估计总体均值。②最大似然估计法。于1912年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。③最小二乘法。主要用于线性统计模型中的参数估计问题。④贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。
区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。1934年统计学家J.奈曼创立了一种严格的区间估计理论。求置信区间常用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。③利用大样本理论。
假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。假设检验的一般步骤
1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。
学好数理统计这门课程,其实有很大的作用,它会让人对日常生活中一些涉及概率方面的问题有更加深刻的体会。如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。
第三篇:概率与数理统计学习心得
概率与数理统计学习心得
概率论与数理统计是研究随机现象统计规律性的一门数学学科,其理论与方法的应用非常广泛,几乎遍及所有科学技术领域、工农业生产、国民经济以及我们的日常生活。对于作为电子通信专业的我,其日后的帮助也是很大的。
这门课程给我最深刻的体会就是这门课程很抽象,很难以理解,初学时,就算觉得理解了老师的讲课内容,但是一联系实际也会很难以应用上,简化不出有关所学知识的模型。后来经过老师的生动现实的实例分析,逐渐对这门课程有了新的认识。首先,这门课程给我带来了一种新的思维方式。前几章的知识好多都是高中大学讲过的,接触下来觉得挺简单,但是后面从大数定理及中心极限定理就开始是新的内容了。我觉得学习概率论与数理统计最重要的就是要学习书本中渗透的一种全新的思维方式。统计与概率的思维方式,和逻辑推理不一样,它是不确定的,也就是随机的思想。这也是一个人思维能力最主要的体现,整个学习过程中要紧紧围绕这个思维方式进行。这些都为后面的数理统计还有参数估计、检验假设打下了基础。
概率论与数理统计不仅在自然科学中发挥重要作用,实证的方法就是基于数据分析整理并推理预测,而且在社会实践中发挥着重要的不可替代的作用,这是因为 1.人类活动的各个领域都不同程度与数据打交道,都有如何收集和分析数据的问题,因此概率论与数理统计学的理论和方法,与人类活动的各个领域都有关联。
2.组成社会的单元——人、家庭、单位、地区等,都有很大的变异性、不确定性,如果说,在自然现象中尚有一些严格的、确定性的规律,在社会现象中则绝少这规律,因此更加依靠从概率论与数理统计的角度去考察。
概率论与数理统计的发展方向是更加实用,基于多元函数、通过建立数学模型来分析解决问题,理论更加严密,应用更加广泛,发展更加迅速。
通过老师的教学,使我初步了解了概率论与数理统计的基本概念和基本理论,知道了处理随机现象的基本思想和方法,有助于培养自己解决实际问题的能力和水平。
第四篇:概率论与数理统计 学习心得
《概率论与数理统计》由于其理论及应用的重要性,目前在我国高等数学教育中,已与高等数学和线性代数渐成鼎足之势。
学生们在学习《概率论与数理统计》时通常的反映之一是“课文看得懂,习题做不出”。概率论习题的难做是有名的。要做出题目,至少要弄清概念,有些还要掌握一定的技巧。这句话说起来简单,但是真正的做起来就需要花费大量的力气。不少学生在学习时,只注重公式、概念的记忆和套用,自己不对公式等进行推导。这就造成一个现象:虽然在平时的做题过程中,自我感觉还可以;尤其是做题时,看一眼题目看一眼答案,感觉自己已经掌握的不错了,但一上了考场,就考砸。这就是平时的学习过程中只知其一,不知其二,不注重对公式的理解和推导造成的。比方说,在我们教材的第一章,有这样一个公式:A-B=bar(AB)=A-AB,这个公式让很多人迷糊,因为这个公式本身是错误的,在教材后面的例题1-15中证明利用了这个公式,很多人就用教材上这个错误的公式套用,结果看不懂。其实这个公式正确的应该是A-B=AbarB=A-AB.这是一个应用非常多的公式,而且考试的时候一般都会考的公式。在开始接触这个公式的时候就应该自己进行推导,发现这个错误,而不是看到这个公式之后,记住,然后运用到题目中去。大家在看书的时候注意对公式的推导,这样才能深层次的理解公式,真正的灵活运用。做到知其一,也知其二。
现在概率统计的考试试题难度,学员呼声不一,有的人感觉非常难,而且最让他们难以应对的是基础知识,主要涉及排列组合、导数、积分、极限这四部分。现在就这部分内容给大家分析一下。说这部分是基础,本身就说明这些知识不是概率统计研究的内容,他们只是在研究概率统计的时候不可缺少的一些工具。即然这样,在考试中就不会对这部分内容作过多的考察,也会尽量避免大家在这些方面丢分。分析到这里,就要指出一些人在学习这门课的“战术失误”。有些人花大量的力气学习微积分,甚至学习概率统计之前,将微积分重新学一遍,这是不可取的。对这部分内容,将教材上涉及到的知识选出来进行复习,理解就可以。万不能让基础知识成为概率统计的拦路虎。学习中要知道哪是重点,哪是难点。
如何掌握做题技巧?俗话说“孰能生巧”,对于数学这门课,用另一个成语更贴切——“见多识广”。对于我们自考生而言,学习时间短,想利用“孰能生巧”不太现实,但是“见多识广”确实在短时间内可以做到。这就是说,在平时不能一味的多做题,关键是多做一些类型题,不要看量,更重要的是看多接触题目类型。同一个知识点,可以从多个角度进行考察。有些学员由于选择辅导书的问题,同类型的题目做了很多,但是题目类型却没有接触多少。在考试的时候感觉一落千丈。那么应该如何掌握题目类型呢?我想历年的真题是我们最好的选择。
平时该如何练习?提出这个问题可能很多人会感到不可思议。有一句话说得好“习惯形成性格”。这句话应用到我们的学习上也成立。这么多年以来,有些人有很好的学习习惯,尽管他的学习基础也不好,学习时间也有限,但是他们能按照自己知道的学习规律坚持学习,能够按照老师说得去思考、前进。我们大多数人都有惰性,一个题目一眼看完不会,就赶紧找答案。看了答案之后,也就那么回事,感觉明白了,就放下了。就这样“掰了很多玉米,最后却只剩下一个玉米”。我们很清楚,最好的方法是摘一个,留一个。哪怕一路你只摘了2个,也比匆匆忙忙摘了一路,却不知道保留的人得到的多。平时做题要先多思考,多总结,做一个会一个,而且对于做过的题目要经常地回顾,这样才能掌握住知识。就我的辅导经验而言,绝大多数人还是在这个问题上出现了问题。
考试有技巧,学习无捷径。平时的学习要注重知识点的掌握,踏踏实实,这才是方法中的方法。“梅花香自苦寒来”,“书山有路勤为径”。
这学期的数学学习情况比以往都好。可能是因为老师讲得好,注意把握整本书的体系,在每节课上都会不断提醒我们以往学过的知识,或者根本就是整本书的知识都是脉状的,各个知识点都有相互交错碰撞的节点,而不是线性的,仅有一条主线牵引,旁支彼此互不相干。一个知识点的学习需要用到以往学过的知识,所以每个知识都显得很饱满,有新的因子又有旧的根基,它们彼此交融补充,向我展示了概率论与数理统计的丰富多彩的面貌。也是在这本书的学习中,我强烈地感受到了数学的丰富多彩,逻辑的严密和体系的完整。我不禁老泪纵横,在数学的殿堂门口晃悠了10多年,终于看到了那辉煌庄严富丽堂皇的大门。
偶然在图书馆自然科学书库发现的一本小书,由商务印书馆出版的科学之旅系列的《概率论与数理统计》,让我看到了这个体系的发展过程,从随机的赌博事件到布朗运动、马尔可夫链再到核弹航空航天,从事件的简单分析再总结规律推广到不同领域。由不知名的数学教师再到世界顶级数学家,在前人研究结果上不断修正补充发展,将这一体系不断完善,我看到那是一棵枝繁叶茂的数学之树,坚定稳固的根基不断为后续生长提供源源不断的养分。
下面对课本所学知识做一个简要总结。本书从简单随机事件出发,将随机事件分为有限或无限可数的古典概论事件和不可测的几何概率事件。再用数学语言——随机变量(是函数)描述出这两类事件的概率发生情况,划分为离散型随机变量和连续性随机变量。离散型随机变量函数的自变量是每个可能取值,因变量是每个可能取值的概率。而连续性随机变量函数则用面积来表示,随机变量的概率等于其概率密度在区间上的积分。再将这些用分布函数表达,分别形成离散型和连续性随机变量函数的分布。
再推广到二维随机变量,X和Y的不同取值相互组合,构成联合离散型随机变量和联合连续性随机变量,再出现了联合概率分布律,联合概率分布函数及其密度函数等等。其中在事件概率中,出现了条件概率和事件独立性这两个概念。A和B同时发生的概率等于A的概率乘以B的概率,当B受A影响时,B的概率应为A下B的概率,即条件概率,AB的概率则用乘法公式表达;若B不受A影响,彼此相互独立,则直接相乘,即独立性。如果一个事件在不同的条件下发生,则其概率为不同原因下发生的概率的总和,即全概率。有点类似前面讲随机事件,有一个提法,事情还没做完(即前后两步有联系,即条件关系)用乘法,不同事情用加法(每个事件彼此不影响)。全概率公式倒推过来则是贝叶斯公式。基本上就是这样了吧......每天脑子里想的都是怎么样去简化理解,而不是死记公式,所以那些公式记得有些模糊,什么泊松分布,正态分布!@#$
第五篇:概率论与数理统计学习心得
概率论与数理统计学习心得
摘要:通过概率论与数理统计这门课的学习,我掌握了基本的概率论的知识,当然学习中也曾遇到过很多的问题。本文主要就概率论的发展历史、我的学习心得和其在生活中的应用三个方面来阐述我对这门课的理解。
关键词:概率论,数理统计,学习心得,发展历史,应用。
一、概率论与数理统计的发展历史:
早在1654年,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。比赛进行三局后,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)*(1/2)=3/4,乙获胜的概率为(1/2)*(1/2)=1/4。所以甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。这个故事里出现了“期望”这个词,数学期望由此而来。
三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯企图自己解决这一问题,结果写成了《论机会游戏的计算》一书,这就是最早的概率论著作。在此期间,法国的费尔马与帕斯卡也在相互通信中探讨了随机博弈现象中所出现的概率论的基本定理和法则.惠更斯等人的工作建立了概率和数学期望等主要概念,找出了它们的基本性质和演算方法,从而塑造了概率论的雏形。
18世纪是概率论的正式形成和发展时期。1713年,贝努利的名著《推想的艺术》发表。在这部著作中,贝努利明确指出了概率论最重要的定律之一“大数定律”,并且给出了证明,这使以往建立在经验之上的频率稳定性推测理论化了,从此概率论从对特殊问题的求解,发展到了一般的理论概括。继贝努利之后,法国数学家棣谟佛于1781年发表了《机遇原理》。书中提出了概率乘法法则,以及“正态分布”的概念,为概率论的“中心极限定理”的建立奠定了基础。1706年法国数学家蒲丰的《偶然性的算术试验》完成,他把概率和几何结合起来,开始了几何概率的研究,他提出的“蒲丰问题”就是采取概率的方法来求圆周率π的尝试。通过贝努利等人的努力,使数学方法有效地应用于概率研究之中,使概率论成为数学的一个分支。数理统计是一个比较年轻的数学分支。多数人认为它的形成是在20世纪40年代克拉美的著作《统计学的数学方法》问世之时,它使得1945年以前的25年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方面的工作结合起来,从而形成数理统计这门学科。它是以对随机现象观测所取得的资料为出发点,以概率论为基础来研究随机现象的一门学科。
近二十年来,随着计算机的发展以及各种统计软件的开发,概率统计方法在金融、保险、生物、医学、经济、运筹管理和工程技术等领域得到了广泛应用。主要包括:极限理论、随机过程论、数理统计学、概率论方法应用、应用统计学等。极限理论包括强极限理论及弱极限理论;随机过程论包括马氏过程论、鞅论、随机微积分、平稳过程等有关理论。概率论方法应用是一个涉及面十分广泛的领域,包括随机力学、统计物理学、保险学、随机网络、排队论、可靠性理论、随机信号处理等有关方面。应用统计学方法的产生主要来源于实质性学科的研究活动中,例如,最小二乘法与正态分布理论源于天文观察误差分析,相关与回归分析源于生物学研究,主成分分析与因子分析源于教育学与心理学的研究,抽样调查方法源于政府统计调查资料的搜集等等。
二、学习心得与体会:
大二上学期,我们开始学习《概率论与数理统计》这门课程。如名称所述,课程内容分为两部分:概率论和数理统计。这两部分是有着紧密联系的。在概率论中,我们研究的随机变量,都是在假定分布已知的情况下研究它的性质和特点;而在数理统计中,是在随机变量分布未知的前提下通过对所研究的随机变量进行重复独立的观察,并对观察值进行分析,从而对所研究的随机变量的分布做出推断。因此,概率论可以说是数理统计的基础。
概率论与数理统计是一门在大学数学中极为重要的课程。以我个人的理解,如果说微积分、线性代数只是分析数学、或是说解题的工具,那么概率论才是真正把实际问题转换为数学问题的学问,因为它解决的并非纯数学问题,不是给你一个命题让你去解决,而恰恰是让你去构思命题,进而构建模型来想方设法解决实际问题。
在学习这门课程时,我逐渐掌握了几个要点:
1.在学习“概率论”的过程中要抓住对概念的引入和背景的理解,例如为什么要引进“随机变量”这一概念。随机变量X(即从样本空间到实轴的单值实函数)的引进使原先不同随机试验的随机事件的概率都可转化为随机变量落在某一实数集合B的概率,不同的随机试验可由不同的随机变量来刻画。此外若对一切实数集合B,知道P(X∈B)。那么随机试验的任一随机事件的概率也就完全确定了。所以我们只须求出随机变量X的分布P(X∈B)。就对随机试验进行了全面的刻画。2.在学习“概率论”过程中对于引入概念的内涵和相互间的联系和差异要仔细推敲,例如随机变量概念的内涵有哪些意义:它是一个从样本空间到实轴的单值实函数X(w),但它不同于一般的函数,首先它的定义域是样本空间,不同随机试验有不同的样本空间。
3.概率论中也有许多习题,在解题过程中不要为解题而解题,而应理解题目所涉及的概念及解题的目的,至于具体计算中的某些技巧基本上在高等数学中都已学过。因此概率论学习的关键不在于做许多习题,而要把精力放在理解不同题型涉及的概念及解题的思路上去。这样往往能“事半功倍”。
三、概率论与数理统计在生活中的应用:
以下举几个有趣的实例来说明概率论与统计在生活中的应用。
一、首先来看一个经典的生日概率问题:
1.团体有一群人,我绝对可以肯定至少有2人生日相同,这群人人数至少要多少?(假设一年是365天)
对于这个问题,某一团体中,绝对肯定至少有2人生日相同,即为必然事件,p=1。由抽屉原理可知,这群人至少要有366人。或者这样想,若是365人,则有可能这365人出生在一年的365天里,所以至少是366人。
2.如果某个随机而遇的团体有50人以上,我敢打贿,这个团体几乎可以肯定有生日相同的两个人,你相信吗?
要解决这个概率问题,我们首先来计算一下,50个人生日的搭配一共有多少种可能情况。第一个人生日,可以是一年中任何一天,一共有365种可能情况,而第二、第三及其它所有人生日也都有365种,这样50个人共有36550种可能搭配。如果50人的生日无一相同,那么生日搭配可能情况就少得多了。第一个人有365种可能,第二人因不能与第一个生日相同,只有364种可能,依次类推,如50人生日无一相同,其生日搭配情况只有365×364×363×……×317×316。那么50人生日无一相同的概率仅为3%,所以至少有两人的生日相同的概率为97%。所以我敢打赌是基本可以稳操胜券的。在这个实例中,我们可以清楚地发现有时自己感觉起来不太可能的事,其实概率是很大的。学习了概率论之后,我们要学会用概率论的知识判断周围的事物,使自己收益最大化。
二、中奖问题:
在各个国家都有各种彩票,使不少人一夜之间变成千万或百万富翁,但这种游戏究竟对参与者来说有没有利,现在我们用概率论的知识来简单地说明这个问题。
首先假设有十个人参与抽奖,每人要向彩票公司缴纳一元钱,彩票公司必须挣钱呀,所以它最多会拿出5元钱作为中奖者的奖金。因为每个人中奖几率一样,即十分之一,所以每个人获得回报的期望是0.5元,那么回报的期望小于自己的付出,显然对自己来说是不划算的。
当然,由于彩票的价钱一般不高,中奖奖金又数以千万计,所以人们购买彩票的欲望才会这么高。再者人都是想不劳而获的,所以虽然很多人知道中奖机率几乎为零,还是想像自己可能会是幸运儿。
三、考试问题:
大学英语四六级考试是全面检验大学生英语水平的一种考试,四六级考试改革前除写作和翻译20分外,其余85道题是单项选择题,每道题有四个选项,这种情况使个别学生产生碰运气和侥幸心理,那么靠运气能通过四六级考试吗?答案是否定的。假设不考虑写作和翻译20分,及格按60分算,则85道题必须答对51题以上,可以看成85重伯努利试验。概率非常小,相当于1000亿个靠运气的考生中仅有0.874人能通过。所以靠运气通过考试是不可能的。这也告诉我们做人做事要脚踏实地,在有些时候学会用概率论的知识来判断事物,但千万不可做投机取巧的事,而要真真实实,脚踏实地。
掌握了概率论的知识会让我们终生受益,它可以指导我们进行判断与决策,让我们避免人生的危机,走在通往光明的康庄大道上。当然远离了脚踏实地,就像那些天天指望中一百万、一千万的人那样,人生将会在漫无目的的等待和渴望中度过,一辈子浑浑噩噩,一事无成。
参考文献:《概率论公理化进程的历史研究》,张鑫,山东大学,2012-10-20 《数理统计学小史》,陈希儒,数理统计与管理,1998-04-10 《概率论的缘起、发展及其应用》,徐洪香,辽宁工学院学报,2001-06-30 《浅析现实生活中概率论的应用》,段静涵,华章,2012-02-10