第一篇:C语言学习总结(模版)
C语言学习总结
第一章入门
1、UNIX操作系统,C编译器和几乎所有的UNIX应用程序都使用C
语言编写的。
2、在C语言中,所有变量都必须先声明后使用。声明通常放在函数起始处,在任何可执行语句之前。声明用于说明变量的属性,它有一
个类型名和一个变量表组成。
3、printf函数并不是C语言本身的一部分,仅仅是标准库函数中的一个函数。
4、EOF定义在头文件
都不同。
5、函数最好按照ANSI C中定义的方式声明。
6、在C语言中,所有的函数参数都是“通过值”传递的。被调用函数不能直接修改主调函数中变量的值,而只能修改其私有的临时副本的值。
7、要想让函数能够修改主调函数中的变量,需要用指针或者数组作
为参数。
8、函数中的每个局部变量只在函数被调用时存在,在函数执行完毕
退出时消失。
9、外部变量必须定义在所有函数之外,且只能定义一次,定义后编
译程序将为它分配存储单元。
10、外部变量在数据段分配。重复定义其实是重复分配,所以会出现
错误。
11、所有在目标代码中的地址都是相对地址,直到链接时重定位。
12、“定义”表示创建变量或分配存储单元,而“声明”指的是说明变量的性质,但并不分配存储单元。
13、外部变量的使用会降低程序的通用性,应尽量减少使用。
14、变量名(标识符)都是给人看的,最后都变成内存地址。
15、变量名,变量类型都是编译时的概念,而不是运行时的概念。
第二章 类型、运算符与表达式
1、关于变量名:局部变量一般使用较短的变量名,外部变量使用较
长的名字来表达用途。
2、short int一般写为short,通常为16位,long int一般写为long,通常为32位。int可以是16位或32位。
3、char可以有signed和unsigned加以限定,不加限定的char符号取决于具体机器,但是可打印字符总是正值。
4、无符号常量以字母u或U结尾。后缀ul或UL表明是unsigned long
类型。
5、带前缀O的整型常量表示它为八进制形式;前缀为0x或0X,则
表示它是十六进制形式。
6、常量表达式在编译时求值。
7、某些字符可以用转义字符序列表示。例如,'ooo'和'xhh'。
8、字符串常量也叫做字符串字面值,是由双引号括起来的0个或多
个字符组成的字符序列。
9、(类型名)表达式这种方法经常用来转换指针。
10、自增和自减运算只能作用于变量。
11、赋值运算符有很多优点:简洁、高效,与人们的思维习惯接近。
12、三元运算符条件表达式可以写出很简洁的代码。
13、运算符的优先级:多用括号。
14、按位与运算符&经常用于屏蔽某些二进制位;按位或运算符|常
用于将某些二进制位置为1。
第三章控制流
1、if语句要注意配对。
2、switch语句的最后一个分支(即default分支)的后面也应该加上
一个break语句。
3、for语句的各组成部分可以是任何表达式,所以for语句并不限于
通过算术级数进行循环控制。
4、do while语句至少执行一次。
5、应尽量少用或不用goto语句。
第四章函数与程序结构
1、C语言程序一般有许多小的函数组成,而不是由少量较大的函数
组成。
2、最简单的函数可以是dummy(){},它可以在程序开发期间用于保留
位置。
3、如果两个函数必须共享某些数据,而这两个函数互不调用对方,则用外部变量。
4、函数的参数实际是局部变量。
5、外部变量的初始化只能出现在其定义中。
6、名字的作用域指的是程序中可以使用该名字的部分。
7、对于在函数开头声明的自动变量来说,其作用域是声明该变量名的函数。
8、不同函数中声明的具有相同名字的各个局部变量之间没有任何关
系。
9、如果要在外部变量的定义之前使用该变量,或者外部变量的定义与变量的使用不在同一个源文件中,则必须在相应的变量声明中强制
性地使用关键字extern。
10、外部变量的初始化只能出现在其定义中。
11、对于某些中等规模的程序,最好只用一个头文件存放程序中各部分共享的对象。较大的程序需要更多的头文件,我们需要精心地组织
它们。
12、关于static(1)static既可用于声明外部变量,也可用于声明内部变量。
(2)static既可用于声明变量,也可用于声明函数。
(3)通常情况下,函数名字是全局可访问的,对整个程序的各个部分而言都可见。但是,如果把函数声明为static类型,则该函数除了对该函数声明所在的文件之外,其他文件都无法访问。
(4)用static也可以限定外部变量的作用域为其所在的源文件。这与限定函数其实是一样的。因为函数可以看作是外部变量。(5)static类型的内部变量同自动变量一样,是某个特定函数的局部变量,只能在该函数中使用,但它一直占用存储空间,而且在编
译时分配内存。
13、在一个好的程序设计风格中,应该尽量避免出现变量名隐藏外部
作用域中相同名字的情况。
14、在不进行显示初始化的情况下,外部变量和静态变量都将被初始化为0,而自动变量和寄存器变量的初值则没有定义。
15、对于外部变量和静态变量来说,初始化表达式必须是常量表达式,且只初始化一次(程序开始执行前进行初始化)。
16、对于自动变量和寄存器变量,则在每次进入函数或程序块时都将
被初始化。
17、数组的初始化可以在声明的后面紧跟一个初始化表达式列表。当省略数组的长度时,初始化表达式的个数就被当作是数组的长度。
18、如果数组的初始化表达式的个数比数组的元素数少,则对外部变量、静态变量和自动变量来说,没有初始化表达式的元素将被初始化
为0。
19、续行可以在待续行的末尾处加上一个反斜杠符。
20、宏替换中,参数名以#作为前缀则结果将被扩展为由实际参数替
换该参数的带引号的字符串。
21、预处理器运算符##为宏扩展提供了一种连接实际参数的手段。如果替换文本中的参数与##相邻,则该参数将被实际参数替换,##与前后的空白符将被删除,并对替换后的结果重新扫描。
第五章指针与数组
1、ANSI C使用类型void *代替char *作为通用指针的类型。
2、指针只与字长有关。
3、每个指针都必须指向某种特定的数据类型。
4、void类型的指针可以存放指向任何类型的指针,但是它不能间接
引用其自身。
5、指针pa+1就意味着pa所指向的对象的下一个对象。相应地,pa+i指向pa所指向的对象之后的第i个对象。
6、数组名不是变量,指针则是变量。因此指针可以作自增和赋值运
算,但是数组名不可以。
7、类似于p[-1]、p[-2]这样的表达式在语法上都是合法的,它们分别
引用位于p[0]之前的两个元素。
8、一般情况下,同其他类型的变量一样,指针也可以被初始化。通常,对指针有意义的初始化值只能是0或者是表示地址的表达式,对后者来说,表达式所代表的地址必须是在此前已定义的具有适当类型的数据的地址。
9、C语言保证0永远不是有效的数据地址。
10、指针没有合理合法的初值,通常出现断错误。
11、字符串长度、拷贝和比较的函数:
int strlen(char *s)
{
char *p = s;
while(*p!= ' ')
p++;
return p*t;
} 第六章 结构
1、结构可以拷贝、赋值、传递给函数,函数也可以返回结构类型的返回值。
2、如果结构声明后面不带变量表,则不需要为它分配存储空间,它仅仅描述了一个结构的模板或轮廓。
3、结构的合法操作只有几种:作为一个整体复制和赋值,通过&运
算符取地址,访问其成员。
4、在所有运算符中,下面四个运算符的优先级最高:结构运算符“.”和“->”,用于函数调用的“()”以及用于下标的“[]”。
5、sizeof是编译时的一元运算符,它用来计算任意对象的长度。
6、条件编译语句#if不能使用sizeof,应为预处理器不对类型名进行分析。但预处理器并不计算#define语句中的表达式,因此在#define
中使用sizeof是合法的。
7、结构有对齐问题,主要是为了提高访问效率。
8、typedef可以使表达更简洁,可以使程序参数化,还可以为程序提
供更好的说明性。
9、联合实际上就是一个结构,它的所有成员相对于基地址的偏移量都为0,此结构的容量要大到足够容纳最“宽”的成员,其对齐方式要
适合联合中所有类型的成员。
10、对联合的操作与对结构允许的操作相同;作为一个整体单元进行赋值、复制、取地址及访问其中一个成员。
11、联合只能用其第一个成员类型的值进行初始化。
12、位字段与具体的实现有关,而且与大小端有关,因此具有不可移
植性。
第二篇:c语言学习总结
c语言学习总结
c语言学习总结篇一:
怎么才能学好c语言呢?
1,要学习c语言的基本语言及程序结构,这时谭浩强的那本书就比较经典了。c语言学习心得。当然你不能只看书,要动手动写代码,去上机测试。因为很多时候写程序就是一个测试,你就是再牛的程序员也不能可写出没有bug的程序,所以学会找出程序中的错误很重要。这也是你以后分析他人的程序的先决条件,不可偷懒只看书,这样你是不可能学好一门计算机语言的。
2,分析他人写的程序,网上有很多实例代码,下载下来自己先看一下他们的实例是解决什么问题的,有时候很多经典的模块可以为已所用的。不过,网上下的代码中会存在很多问题,环境问题啊,编程习惯问题了,不过也好,在解决问题的过程中你会学到很多东西的,像我在分析网上下的代码时就遇到了我平时没有遇到的dos函数,masm与c语言的接合等方面的问题,学到了不少东西呢。
3,要是你再想学的深一点儿,那还得学习,及,再深就要去分析linux内核或是驱动程序了,这因人而异。但不管怎么学,一定要有个方向,有计划,这样才会事半功倍。c语言学习心得。如果你能找到你想学习方面的高手指导,或是几个人一起学的话那就更好了。
4,分析c语言函数的实现方法。这对你很好地使用函数会很有帮助的,再者很多大公司的笔试题就是让你实现c语言的数,比如:中兴的strcpy,阿里巴巴的strcmp,上海贝尔公司宣讲会上一个技术总监说,要是谁能说出printf的实现方法及返回值,当场录用。再者,c语言经过这么多年的考验,仍然很热门,可见其开发是多么经典啊,学习一下c函数实现,比学习任何书都要好。要是再有兴趣的话就分析一下c的头文件,这也是个不错的学习方面。c语言学习总结篇二:
学习c程序设计语言除了课堂讲授以外,必须保证有不少于课堂讲授学时的上机时间。因为学时所限,课程不能安排过多的统一上机实验,所以希望学生有效地利用课程上机实验的机会,尽快掌握用c语言开发程序的能力,为今后的继续学习打下一个良好的基础。为此,我们结合课堂讲授的内容和进度,安排了12次上机实验。课程上机实验的目的,不仅仅是验证教材和讲课的内容、检查自己所编的程序是否正确,课程安排的上机实验的目的可以概括为如下几个方面:
1。加深对课堂讲授内容的理解
课堂上要讲授许多关于c语言的语法规则,听起来十分枯燥无味,也不容易记住,死记硬背是不可取的。然而要使用c语言这个工具解决实际问题,又必须掌握它。通过多次上机练习,对于语法知识有了感性的认识,加深对它的理解,在理解的基础上就会自然而然地掌握c语言的语法规定。对于一些内容自己认为在课堂上听懂了,但上机实践中会发现
原来理解的偏差,这是由于大部分学生是初次接触程序设计,缺乏程序设计的实践所致。
学习c语言不能停留在学习它的语法规则,而是利用学到的知识编写c语言程序,解决实际问题。即把c语言作为工具,描述解决实际问题的步骤,由计算机帮助我们解题。只有通过上机才能检验自己是否掌握c语言、自己编写的程序是否能够正确地解题。
通过上机实验来验证自己编制的程序是否正确,恐怕是大多数同学在完成老师作业时的心态。但是在程序设计领域里这是一定要克服的传统的、错误的想法。因为在这种思想支配下,可能你会想办法去“掩盖”程序中的错误,而不是尽可能多地发现程序中存在的问题。自己编好程序上机调试运行时,可能有很多你想不到的情况发生,通过解决这些问题,可以逐步提高自己对c语言的理解和程序开发能力。
2。熟悉程序开发环境、学习计算机系统的操作方法
一个c语言程序从编辑、编译、连接到运行,都要在一定的外部操作环境下才能进行。所谓“环境”就是所用的计算机系统硬件、软件条件,只有学会使用这些环境,才能进行程序开发工作。通过上机实验,熟练地掌握c语言开发环境,为以后真正编写计算机程序解决实际问题打下基础。同时,在今后遇到其它开发环境时就会触类旁通,很快掌握新系统的使用。
3。学习上机调试程序
完成程序的编写,决不意味着万事大吉。你认为万无一失的程序,实际上机运行时可能不断出现麻烦。如编译程序检测出一大堆错误。有时程序本身不存在语法错误,也能够顺利运行,但是运行结果显然是错误的。开发环境所提供的编译系统无法发现这种程序逻辑错误,只能靠自己的上机经验分析判断错误所在。程序的调试是一个技巧性很强的工作,对于初学者来说,尽快掌握程序调试方法是非常重要的。有时候一个消耗你几个小时时间的小小错误,调试高手一眼就看出错误所在。
通过这次为数不多的几天计算机实践学习,我们了解了一些关于c语言的知识,理解巩固了我们c语言的理论知识,着对我们将来到社会工作将会有莫大的帮助。同时它让我知道,只要你努力,任何东西都不会太难。
第三篇:c语言学习总结
(1)两个if并列的时候,if函数是有先后顺序的。
如 iMax = a;
if(b > iMax)
{
iMax = b;
}
if(c > iMax)
{
iMax = c;
}
printf(“三个数的最大值是:%dn”,iMax);
(2)
printf(“请输入机票价格:”);
scanf(“%f”,&fTicketPrice);
(3)%5.2f的意思是以长度为5,小数点后面2位的形式输出。
(4)闰年判断((iYear % 400 == 0)||(iYear % 4 == 0 && iYear % 100!= 0))
第四篇:C语言学习总结
C语言学习总结
学了一个学期的C语言,我只有一个感觉,那就是一个字:难。不过,我觉得对C语言已经有了一个初步的认识。能够做到利用C语言编织出一些非常简单的程序,和读懂大部分的程序代码,明白程序要表达的意思。
下面是对C语言中我理解的知识的总结:
1、一些基本的函数和基本数据类型的应用。其中,基本数据类型分为整
型、浮点型、字符型、枚举类型。基本函数包括输入输出函数。
2、把运算符的优先顺序排列清楚,要分清楚哪个先运算,哪个后运算。
3、在编程之前要考虑好程序的算法,写出流程图,这样才能更加快速的、有效的编程。
4、要分清楚各个变量的生存期和作用域,不能发生混淆,以致发生错误。
5、数组和指针是C语言的经典之处,可以通用,并且互相转换,具有非
常强大的功能,但是使用不当的话,会造成程序出错,打乱原有程序的规律,使可读性明显变差。
6、结构体也是常用的一种数据类型,它的功能也比较强大,相对于指针
而言,结构体掌握起来比较容易理解和使用。
7、对于文件的操作是非常关键的,把输入的数据保存起来,下次还能够
使用,这才是关键问题。所以对文件操作是否成功,使程序是否编制成功的重要因素。
C语言虽然是一门很基础的语言,但是对我来说学习起来是有些困难的。在学习C语言期间,做了很多实验,这是学好C语言必不可少的一步。因为不管你理论知识掌握的如何熟练,不上机实际操作的话,是没有任何效果的,许多问题都是在实际上机操作中显现出来的,在书本上是体现不出来的。书本上是永远不会出现你自己的思想成果的,正是应了那句话“实践是检验真理的唯一标准。”所以,在以后的学习中,实践是必不可少的!
第五篇:R语言学习总结
R语言学习总结经过接近一个学期的学习,从对R语言的完全陌生,到现在对其有了一些粗浅的认识,其中经历了遇到困难苦思冥想的艰辛,也有解决问题以后豁然开朗的畅快。在学习的过程中,以前掌握的数理基础给我带来了不少便利,而认真地态度和踏实的性格也使我获益匪浅。
在这个学期中,我学会了R语言的基本操作和语法,以及针对具体的统计学问题相应的解决方法。并按时完成老师布置的课后作业,以达到学以致用的目的,也加强了对R语言操作的熟练度。
一、初识R软件
R软件是一套完整的数据处理、计算和制图软件系统。其功能包括:据存储和处理,数组运算,完整连贯的统计分析工具,优秀的统计制图功能已及简便而强大编程语言。
接触R语言以后,我的第一感觉就是方便和强大。R语言中有非常多的函数和包,我们几乎不用自己去编一些复杂的算法,而往往只需要短短几行代码就能解决很复杂的问题,这给我们的使用带来了极大地方便;于此同时,它又可操纵数据的输入输出,实习分支、循环,使用者可以自定义功能,这就意味着当找不到合适的函数或包来解决所遇的问题时,我们又可以自己编程去实现各种具体功能,这也正是R语言的强大之处。
二、学习心得
在学习该书的过程中,我不仅加深了对统计学方法的理解,同时也掌握了R软件的编程方法和基本技巧,了解了各种函数的意义和用法,并能把两者结合起来,解决实际中的统计问题。
1、R语言的基本语法及技巧
R语言不仅可以进行基础的数字、字符以及向量的运算,内置了许多与向量
运算有关的函数。而且还提供了十分灵活的访问向量元素和子集的功能。R语言中经常出现数组,它可以看作是定义了维数(dim属性)的向量。因此数组同样可以进行各种运算,以及访问数组元素和子集。二维数组(矩阵)是比较重要和特殊的一类数组,R可以对矩阵进行内积、外积、乘法、求解、奇异值分解及最小二乘拟合等运算,以及进行矩阵的合并、拉直等。apply()函数可以在对矩阵的一维或若干维进行某种计算,例如apply(A,1,mean)表示对A按行求和。R语言允许将不同类型的元素放在一个集合中,这个集合叫做一个列表,列表元素总可以用“列表名[[下标]]”的格式引用。而“列表名[下标]”表示的是一个子列表,这是一个很容易混淆的地方。R语言中非常重要的一种数据结构是data.frame(数据框),它通常是矩阵形式的数据,但每列可以是不同类型,数据框每列是一个变量,每行是一个观测,要注意的是每一列必须有相同的长度。数据框元素可以使用下标或者下标向量引用。
用一个非常简单的例子来说明向量、矩阵和数据框的简单运用。输入:
A<-matrix(c(1:12),2,6,byrow=T)#A为一个2行6列,按行排列的矩阵 X<-as.data.frame(A)#把A转化成数据框形式的X X[1:2,seq(1,5,2)] #输出X的第1、2行和1、3、5列 结果为: V1 V3 V5 1 1 3 5 2 7 9 11 输入:
attach(X);R<-V1/V5;R #调用数据框X,计算并输出V1和V5的比值 结果为: [1] 0.2000000 0.6363636 与此同时R语言中也提供了其它高级程序语言共有的分支、循环等程序控制结构。比如if/else语句,for循环等。因此R语言也可以很容易的根据情况编写自己所需要的函数。
以习题2.7为例:编写一个R程序,输入一个整数n,如果n小于等于0,中止运算,并输出:“要求输入一个正整数”;否则,如果n是偶数,则将n除2赋值给n;否则将3n+1赋给n。不断循环,直到n=1停止,并输出:“运算成功”
解:新建一个程序脚本,名为chapter2.R”,写入代码: f<-function(n){ if(n<=0)list(“要求输入一个正整数”)else{repeat{ if(n==1)break #n=1时终止 else if(n/2==as.integer(n/2))n<-n/2 #n为偶数时除2 else n<-3*n+1 } list(“运算成功”)} } 在R窗口中输入:
Source(“chapter2.R”);f(32)输出: [1] “运算成功” 输入: f(-5)输出:
[1] “要求输入一个正整数”
2、R在统计描述中的应用
使用R软件可以方便直观的对数据进行描述性分析。如使用均值、中位数、顺序统计量等度量位置;用方差、标准差、变异系数等度量分散程度;以及用峰度系数、偏度系数度量分布形状。例如在窗口中输入:
x<-seq(1,589,3)length(x);mean(x);var(x);sd(x);median(x);100*sd(x)/mean(x)[1] 197 #长度 [1] 295 #均值 [1] 29254.5 #方差 [1] 171.0395 #标准差 [1] 295 #中位数 [1] 57.97948 #样本标准差
n<-length(x);m<-mean(x);s<-sd(x)n/((n-1)*(n-2))*sum((x-m)^3)/s^3;((n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4-(3*(n-1)^2)/((n-2)*(n-3)))[1] 0 #偏度系数 [1]-1.2 #峰度系数
R软件可以检验样本是不是来自某种分布总体,以正态分布为例,我们可以通过shapiro.test()函数提供W统计量和相应的p值,并通过p值的大小判断样本是否来自正态分布的总体。经验分布的K-S检验方法的应用范围则更加广泛,不仅可以判断样本是否来自正态总体,也能判断是否来自其它类型的分布总体。
以习题3.3为例:分别用W检验方法和Kolmogorov-Smirnov检验方法检验习题3.1的数据是否服从正态分布;
首先将一百个数据存入”data.txt”中(此文件要放在工作空间目录中)x<-read.table(“data.txt”);shaoiro.test(x)Shapiro-Wilk normality test data: x W = 0.9901, p-value = 0.6708 可见该样本来自正态总体 ks.test(x,pnorm,mean(x),sd(x))One-sample Kolmogorov-Smirnov test data: x D = 0.073, p-value = 0.6611 alternative hypothesis: two-sided 结果与W检验相同
除此之外,R语言还有强大的画图功能,例如我们可以通过作直方图、茎叶图和总体分析来描述数据的分布。R中的高水平作图函数有:plot()、pairs()、coplot()、qqnorm()、hist()等等。当高水平作图函数并不能完全达到作图的指标时,需要低水平的作图函数予以补充。低水平作图函数有:points()、lines()、text()、polygon()、legend()、title()和axis()等。需要注意的是低水平作图函数必须是在高水平作图函数所绘图形的基础之上增加新的图形。
hist()函数可以做出已知数据的直方图,stem()函数可以作茎叶图,boxplot()函数可用作箱线图,qqline()和qqmorm()可以做出正态QQ图和相应的直线。R语言同时还能对两组数据进行相关性检验,cor.test()函数提供了Pearson相关性
检验,Spearman秩检验和Kendall秩检验。其原假设为两组数据不相关,通过p值的大小来判断是否拒绝原假设。我们还能用stars()函数作出星图,来表示多元数据,以上用法都非常简单易用,这里就不再赘述。
3、R语言在统计推断中的应用 首先,R语言可以用来进行参数估计;
统计学中我们应用矩估计和极大似然估计来进行点估计,矩估计是通过解正规方程组得到参数估计的值;极大似然估计通过解极大似然函数的极值点得到参数估计的值。在R中我们可以使用Newton迭代法求解正规方程组,获得矩估计;用optimize()函数求解极大似然函数,获得最大似然估计;由此可见,R语言能够很方便的解决参数点估计问题。
点估计给出未知参数的近似值以后,并不能知道这种估计的精确性如何,可信程度如何,为了解决这些问题,就需要用到区间估计,在学习用R语言解决区间估计问题的过程中,我最大的体会就是R软件中内置的一些函数极大地方便了我们处理具体问题。比如t.test()函数。对单个正态总体,向量x包含了来自该总体的一个样本,我们可以直接用t.test(x)指令得到均值u的点估计和区间估计;对于两个正态总体,向量y包含了来自第二个总体的一个样本,我们可以用t.test(x,y)来得到均值差u1-u2的点估计和区间估计,其中当两个总体方差相同时,只需要加上var.equal=T(缺省值为F,即默认两个总体的方差是不同的);同时t.test()函数不仅可以进行双侧置信区间估计,也能进行单侧置信区间估计,只需要在括号内加上al=”l”或者al=”g”。当数据不服从正态分布是,可以利用中心极限定理,取较大的样本量,构造近似服从正态分布的统计量进行估计。
其次,R语言可以用来进行假设检验。
假设检验也是统计推断中的一个重要的内容,在统计学中,我们用搜索到的数据对某个事先作出的统计假设按照某种设计好的方法进行检验,来判断此假设是否正确。也就是说为了检验一个假设是否成立,先假定它是成立的,看看由此会导致什么结果。如果导致一个不合理的现象出现,就认为原假设不正确,如果没有导出不合理的现象,则不能拒绝原假设。
R软件给出了参数假设检验的方法。以正态总体为例,t.test()函数也可以用来进行单个或者两个正态总体的均值的假设检验。进行单边检验时可以加入指令alternative(备择假设),缺省时表示双边检验,less表示备择假设为u X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)t.test(X,Y,var.equal=T,al=”l”)输出:Two Sample t-test data: X and Y t =-4.2957, df = 18, p-value = 0.0002176 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval:-Inf-1.908255 sample estimates: mean of x mean of y 76.23 79.43 结果中我们不仅能得到X和Y的均值的点估计76.23和79.43、左侧区间估计、同时也能通过p值的大小判断是否接受原假设,该例中p<0.05,认为拒绝原假设,即认为两总体方差不同。与均值假设检验相类似。 R语言中还可以用var.test()函数进行正态总体的方差假设检验。而且R语言不仅能就正态总体进行均值和方差检验,也能对其他总体分布进行检验。例如用binom.test()进行二项分布的检验和估计。习题5.3中检验铁剂和饮食两种方法治疗后患者病情表现有无差异: x<-c(113,120,138,120,100,118,138,123)y<-c(138,116,125,136,110,132,130,110)binom.test(sum(x 参数假设检验假定了总体分布的具体形式,但实际问题中我们往往不知道总体的分布,很难对总体的分布做出假定,所有要尽量从样本本身获得所需要的信息,即非参数检验方法。 R语言中有很多种非参数的检验方法,这里仅介绍几个较为重要的方法。Pearson拟合优度的卡方检验:首先假设随机变量有某种分布,将数轴分成m个区间,然后用样本落在每个区间内的个数和其期望构造K统计量,当n很大是,K依分布收敛于自由度为m-1的卡方分布。然后进行参数假设检验。在R语言中可以用chisq.test()函数来实现。符号检验可以用来检验一个样本是否来自某个总体,或者检验两个总体是否有显著区别。对于前者,如果样本中位数等于假设的总体的中位数,我们就认为样本来自该假设,此时每个样本中位数和总体中位数的差额应该正负各一半,所以可以用p=0.5的二项分布来检验。对于后者,如果认为两个总体无显著差异,则对应的两个样本观测值正负差额的个数应该大体相当,即正负各占一半,像单个样本一样,检验其是否来自p=0.5的二项分布。这在R语言中只需要用binom.test()函数就能实现。秩统计量检验是一种经常被用来检验分布无关性的非参数检验,R语言提供了Spearman、Kendall和Wilcoxon三种秩检验方法,前两种可以用cor.test()函数实现,最后一种可以用wilcox.test()函数实现。 最后,R语言还可以用来处理回归分析问题 对于普通的多元线性回归模型,已知被解释变量y和i个解释变量的样本数据,利用R语言中的lm()函数可以非常方便的求出各解释变量的回归参数,并做相应的检验。以 y=β0+β1x+β2z+ε 为例,将数据赋给各个变量后,只需要输入lm<-lm(y~1+x+z);summary(lm)就能得到参数估计值、每个参数估计值的标准差、参数显著性的t检验和总体显著性的F检验,以及模型的拟合优度等信息。然后我们可以用predict()函数非常方便的求出预测值和预测区间,同样我们还能用前面介绍过的plot()和abline()等函数做出各种图形来进行回归分析。 当然之前讲的都是比较理想的情况,而现实中往往影响被解释变量y的因素很多,我们希望找出若干个比较关键的变量建立回归方程,这便涉及变量选择的问题。选择“最优”变量的方法有很多,比较常用的一种是逐步回归法。它以 我是一个做事非常认真地人,这个学期除了上课时间,我还会利用课余时间练习R语言的操作,俗话说的好,动眼部动手,什么都学不走。很多时候看书上的内容觉得非常简单,实际操作中却会遇到很多小问题,往往也正是这些小问题导致我们的程序无法运行或者无法得出想要的结果。期间我就遇到过一些这样的问题,例如没有把数据文件放在工作空间目录里,导致“read.table”指令读不出数据,或者是一些符号输错导致错误。正是我认真细致的将每个用法都尝试一遍,才掌握了很多不起眼的小细节,也正是因为这一点,当其他两名同学遇到问题问我的时候我才能迅速地找出问题所在。 总的来说,R语言归根到底只是我们解决问题的工具,而我们对问题的分析首先是要根据理论进行的,例如参数估计、假设检验以及线性回归、时间序列方面的知识,我们只有深刻理解这些理论背后的意义,才能用对R语言中的各个方法,就好比战场上如果R是利刃,理论知识就是我们的身体和战术素养,只有我们学好了理论知识,才能面对一个个问题迎刃而解。 这个学期获得的收获则更多,不仅加深了对统计和计量方面知识的进一步理解,更对R软件有了初步的了解和认识。而其实最重要的,是这种全力以赴做一件事情的状态和收获的喜悦。我相信这种经历会让我在以后的学习和工作中获益匪浅。 这个学期的学习让我对R语言产生了浓厚的兴趣,而我现在对R语言也仅仅是学到了些皮毛,我一定要再努力学习,希望能够在今后的实习中学到更多的东西,为自己大四时期找工作打下基础。