数学一般都不太好学,因为比较抽象。初学者和数学基础不好的话不要直接看大学课本《》,这可不是我打击你,是大学教科书坑你们,马上你就没自信了。现在想想学理科的大学生们,真苦啊,可恶的应试教育,你这不是摧残祖国未来的花朵吗。
对统计学感兴趣的话可以先看这本书,《深入浅出统计学》,外国人写的,外国人数学理论普遍不如我们,但他们注重实用性,尤其是理解性的方式学习,所以这本书可以热热身,打打基础。等看完这本书,再去看大学课本《》会好很多。
下面是我自己的学习总结,给大家分享下。
《》这本书分两个部分,一眼就看出来了,分为,真是废话啊,傻子都知道。
概率部分是统计学的理论基础,统计学是概率论的应用部分。
概率论起源于,如果你对感兴趣,请好好学习概率论,对你戒赌有很大的帮助。从其起源和发展为分古典概率论和现代概率论。(柯19__年在他的《概率论基础》一书中首次给出了概率的测度论式定义和一套严密的公理体系。他的公理化方法成为现代概率论的基础,使概率论成为严谨的数学分支)
统计学分为描述统计学和推断统计学。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。从描述统计学发展到推断统计学,既反映了统计学发展的巨大成就,也是统计学发展成熟的重要标志。
描述统计学中的一些概念,如平均值、中位数、众数、方差、标准差、极差、分位数;还有一些描述类的图形如直方图、线图、柱形图、饼图、箱线图、茎叶图都是基本知识,不在繁述,值得注意的是数据的均值和方差要理解,后面会大量提到,均值也就是数学期望。均值反映数据的集中趋势,方差反映数据的离散程度。
而推断统计学可就复杂了,是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
第一部分:概率论
概率的基本概念
一个事件的概率情况分为古典概型(等可能概型)和几何概型,区别在于试验的样本空间包含的元素是有限还是无限。
古典概型的概率是包含基本事件数的占比,如果与顺序有关为排列问题,与顺序无关为组合问题。
几何概型的概率是构成事件的区域长度的(面积体积)占比。经典的蒲丰投针试验,当投针次数足够多的话,根据针与平行线相交的概率可以求出π的近似值。
多个事件的概率情况求解,往往数学的研究特点是先研究一个,再扩展到两个,最后是n个。可以使用图和数学公式的方法。首先需要了解下事件关系,图的方法有维恩图和概率树,数学公式有事件的运算定律和加法公式。
在两个事件的基础上,出现了条件概率公式、乘法公式、全概率公式、贝叶斯公式。随后再扩展到n个。
贝叶斯公式在很多方面都有应用,比如诉讼、医疗诊断、垃圾邮件的判别、数据挖掘方面等,有兴趣可以看两篇文章《数学之美番外篇:平凡而又神奇的贝叶斯方法》和《论人类思考时的贝叶斯过程》。
最后弄明白事件、互斥事件和对立事件的关系,事件的性是概率论中非常重要的概念,后面的内容基本上都要有这个前提。
随机变量及其分布
之前只是探讨了事件中某个基本事件发生的概率情况,若事件中有很多基本事件,那么出现取值为多个的情况又该怎么计算。
数学中引入了函数,将这些问题转化成一般的问题。函数的重要参数是变量,在概率论中,因为是随机试验,所以叫随机变量。有了函数,现实中的很多问题都有了模型。
随机变量分为两种:一种是离散型的(取值有限),一种是连续型的(取值无限)
离散型随机变量的分布情况布(两点分布),二项分布(n重伯试验),泊松分布。两点分布是二项分布的特殊情况(n=1),当n很大时,二项分布的计算较为复杂,可用泊松分布近似二项分布(λ=np)。
连续型随机变量的分布情况:均匀分布和正态分布(高斯分布)。通过分布图型也可以看出二项分布是离散情况下的正态分布,因此也可以用正态分布来计算二项分布,但是当n不大的时候,需要进行连续型修正。
正态分布的两个重要参数是均值和方差,有了这两个参数就可以求出随机变量在任何取值范围内的概率,其实就是定积分求面积。但是为了简便计算,我们给出了标准正态分布的查表,这样只要满足了标准正态分布的随机变量,就不用手工计算,直接查表就行了。因此要满足标准正态分布的条件需要进行标准化的调整。
随机变量及其分布
前面探讨一个随机变量的情况,按套路出牌就是先讨论2个随机变量的情况,最后再衍变成n个。
二维随机变量也分为离散型的二维随机变量和连续型的二维随机变量,离散型的二维随机变量的所有可能取值叫联合分布律,连续型的叫联合分布函数。
在随机变量中,将_,Y各自的分布称为边缘分布。离散的叫分布律,连续的叫分布函数。
条件分布,由条件概率公式推导,离散的叫条件分布律,连续的叫条件分布函数。
各种分布的关系:联合分布可以唯一地确定边缘分布和条件分布,但仅有边缘分布或条件分布无法确定联合分布,两个都有可以。
这一章涉及高数定积分的计算,有时计算量大,比较麻烦,往往作为选修内容,n个随机变量的就以此类推,算不死你啊。
随机变量的数字特征
这部分内容主要介绍期望、方差、协方差及相关系数。
熟悉期望和方差的数学定义,性质以及一些常见分布的期望和方差。能手工推导出来记忆会更牢靠,理解的东西越多,需要记忆的东西就越少。
二项分布:E(_)=np,D(_)=npq
泊松分布:E(_)=λ,D(_)=λ
均匀分布:E(_)=(a+b)/2,D(_)=[^2]/12
正态分布:E(_)=μ,D(_)=σ^2
当_与Y相互时,cov(_,y)=0,随机变量_和Y不相关,但是随机变量_和Y不相关,不能说明两者相互。
大数定理与中心极限定理
大数定理与中心极限定理在概论与统计学中有非常关键的作用。
大数定理:人们在长期实践中认识到频率具有稳定性,而频率的稳定性是概率定义的客观基础。
中心极限定理表明,在相当一般的条件下,当随机变量的个数增加时,其和的分布趋于正态分布。一方面揭示了为什么在实际应用中会经常遇到正态分布,另外,它提供了同分布的随机变量之和的近似分布,不管随机变量服从什么分布,只要个数充分大,都可以用正态分布来近似,这在应用上是有效和重要的。
内容包括一个不等式、2个大数定理和3个中心极限定理
切比雪夫不等式:切比雪夫不等式的优点是无需知道_的分布,只知道其期望和方差就可以估计事件(_)|)>=£)的概率,因而适用性强。其缺点是所给估值一般较粗糙,精度不够。且只限于以均值E(_)为中心的有限对称区间。
弱大数定理(辛钦):意义是可以使用样本的均值去估计总体均值。
伯大数定理:告诉我们当试验次数趋于无穷时,事件A发生的频率依概率收敛于A发生的概率,这样,频率接近于概率这一直观的经验就有了严格的数学意义。
伯大数定理是弱大数定理的特殊情况。大数定理应用广泛,在赌场、保险公司、彩票中都有应用,你会发现为什么这些行业是稳赚不赔,无本万利了。
同分布的中心极限定理:n个相互同分布的随机变量之和的分布近似于正态分布,n愈大,此种近似程度愈好。
李XX:当n很大时,无论各个随机变量_服从什么分布,只要相互而且满足定理条件,则它们的和就近似满足正态分布。
棣拉斯定理:这个定理主要是阐明正态分布是二项分布的极限分布。给离散和连续的随机变量分布情况的互相转化提供了理论依据。
样本与抽样分布
样本和总体,比较好理解,需要记住的是样本和总体表示均值和方差的符号。
总体为正态分布,下面是3个来自总体的抽样分布。
1、卡方分布,若n个相互的随机变量ξ、ξ、……、ξn,均服从标准正态分布(也称同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。卡方分布的两个主要用途。
第一是检验拟合优度,通俗点是检验观察值与期望值之间的吻合程度。第二是检验两个变量的性即是否存在相关性。
2、t分布,样本很小的时候,样本的均值符合t分布。
由于在实际工作中,往往总体σ是未知的,常用样本s作为总体σ的估计值,为了与u变换区别,称为t变换,统计量t值的分布称为t分布。
3、F分布,F分布定义为:设_、Y为两个的随机变量,_服从自由度为k1的卡方分布,Y服从自由度为k2的卡方分布,这2个的卡方分布被各自的自由度除以后的比率这一统计量的分布。即:上式F服从第一自由度为k1,第二自由度为k2的F分布。
参数估计与假设检验