?1、样本空间、样本点、随机事件、必然事件、不可 能事件、基本事件和复合事件的概念;
?2、事件的包含与相等:若事件A包含事件B,则B的发生必然导致A的发生。进而有P(AB)=P(B),P(AUB)=P(A) ? ?
3、和事件:A、B至少有一个发生的事件,即AUB ? ?
4、积事件:A、B同时发生的事件,即AB ? ?
5、互斥事件:A、B不能同时发生的事件,即满足AB=φ,也称互不相容事件。
?6、对立事件:满足条件AB=Φ而且A∪B=S,A的对立事件 用A ?表示,A ?=S-A;对立事件一定是互不相容事件。 ? ?
7、差事件:A发生B不发生的事件称为A与B的差事件,表示为A-B或 ? ?
8、常用运算式:
1、概率的公理化定义,规定了概率要满足的三 个条件:
(1)P(A)≥0,即非负性;
(2)P(S)=1,即规范性;
(3)两两互不相容事件的和的概率等于事件 的概率之和,即概率的可加性。
2、概率的性质
(1)对于任一事件A,有P(A ?)=1-P(A);
(2)P(Φ)=0;
(3)若B包含A,则有P(B-A)=P(B)-P(A),而 且P(B)≥P(A);
(4)对任一事件A,有P(A)≤1;
(5)对任意两个事件A、B有 ?P(A∪B)=P(A)+P(B)-P(AB), 该式称为概率的加法公式。
(6)【概率减法公式】P(A-B)=P(A)-P(AB)
当B?A时,P(A-B)=P(A)-P(B) 当A=Ω时,P(B)=1- P(B)。
?3、古典概率计算:P(A)=K/N=事件A包含的样本点数/样本空间S包含的样本点数
?4、条件概率的定义: 当P(B)>0时,有P(A/B)=P(AB)/P(B)
?5、乘法定理: 计算事件之积的概率公式 设P(A)>0,则有P(AB)=P(A)P(B/A)
?6、全概率公式:设S为试验E的样本空间,B1,B2,···Bn为S的一个划分,A为E的事件,且 ? ? ? ? ? ?P(Bi)>0(i=1,2,3···n),则有 ? ?
7、贝叶斯公式:实质为一条件概率
设S为试验E的样本空间,B1,B2,···Bn为S的一个划分,A为E的事件,且P(Bi)>0(i=1,2,3···n),P(A)>0,则有??
满足全概率公式和贝叶斯公式的前提是“完备事件群”。?
满足 :BiBj=?(i≠j)B1+B2+?=Ω
这样的一组事件称为一个“完备事件群”。简而言之,就是事件之间两两互斥,所有事件的并集是整个样本空间(必然事件)。
1、独立性的定义:设A、B为两事件,如果有P(AB)=P(A)P(B)成立,则称事件A和事件B相互独立。
2、推论
(1)若A与B独立,则有A ?与B,A与B ?,A ?与B ?也相互独立;
(2)若A、B互斥,且P(A)>0,P(B)>0,则A与B不独立;
(3)若A、B独立,且P(A)>0,P(B)>0,则A与B不互斥;
(4)样本空间中,S与Φ既独立又互斥;
(5)Φ与任何事件都独立且互斥。
设E的样本空间为S={e},X=X{e}是定 义在样本空间上的实值单值函数,称X=X{e}为随机变量, 记为R.V。R.V一般用大写的字母X、Y、Z等表示,而小 写的x、y、z用来表示R.V所取的值。
?1、离散型R.V的定义:R.V的全部可能取值是有限个 或可列无限多个。 ??
?2、离散型R.V的分布律:P{X=xk}=pk,k=1,2,3··· ?? ?
3、分布律的性质:pk≥0,
1、(0—1)分布,记为X~(0,1) ?? ?
,其中k=0,1,0<p<1。
2、二项分布,记为X~B(n,p)
(1)伯努利试验:试验E只有两种可能的结果,A和A ?。 令A发生的概率为p。
(2)n重伯努利试验:将试验E独立地重复进行n次。
(3)定义R.V X为N重伯努利试验中A发生的次数,则有 ??
3、泊松分布,记为X~π(λ)
(1)泊松分布的定义:,k=0,1,2···
(2)泊松定理:当二项分布中n很大,p很小时,可以用泊松分布来近似二项分布,泊松分布中的 参数λ=np。
1、分布函数的定义:F(x)=P{X≤x},其中X是随机变量,x是实数参变量.
由定义可P{a<X≤b}=F(b)-F(a)?? ??? ? ?? ?
2、分布函数的性质:F(x)是一个不减函数,0≤F(x)≤1,F(x)右连续。
1、,其中f(x)为随机变量X的概率密度 函数。
2、概率密度的性质:f(x)≥0,,,
若f(x)在x处连续,则有f(x)=F′(x).
3、连续型随机变量X取任一指定值的概率为0,即? P{X=a}=0,其中a为任意实数。
4、对于连续性随机变量X,有P{a≤X≤b}=P{a<X≤b}=P{a<X<b}=P{a≤X<b}.
1、均匀分布,记为X~U(a,b),概率密度为?
2、指数分布,记为X~E(θ),概率密度为
?3、正态分布,也称为高斯分布,记为X~N(u,σ2)
(1)正态分布的概率密度,-∞<x<∞, 其中u可取任意实数,σ取大于0的实数。
(2)正态曲线关于x=u对称。
(3)当x=u时,f(x)取到最大值,即f(u)=1/σ√2π。
(4)u决定了正态曲线的中心位置,称为位置参数;σ 决定了正态曲线的中峰陡峭程度,称为尺度参数。
(5)标准正态分布: ? ? ? ? ? ?
?u=0,σ=1的正态分布称为标准正态分布, 即X~N(0,1).
(6)标准正态分布的密度函数为 标准正态分布的分布函数为
φ(x)可通过标准正态分布函数表查表得到。
(7)正态分布转化为标准正态分布的方法(必会): 因此有F(x)=P(X≤x)=φ(x?u/σ); P(x1<X≤x2)=φ(x_1?u/σ)-φ(x_2?u/σ)
(8)上α分位点:设X~N(0,1),若z_α满足条件? P{X>zα}=α,0<α<1,则称z_α为标准正态分布的上α 分位点。
1、离散型随机变量函数的分布 若X的分布律为,
则Y=g(X)的分布律为 ,
若g(xk)中有一些取值相同,则把它们的概率相加。
?2、连续型随机变量的函数的分布 ? ?
问题的提法:已知X的概率密度为f(x),求Y=g(X)概率密度。 ? ?
做法1(针对g(X)为严格单调时):设Y的分布函数为FY(y),则有FY(y)=P{Y≤y}=P{g(X)≤y}=P{X≤h(y)}=FX(h(y)), 其中h(y)为y=g(x)的反函数。然后FY(y)对y求导,即得 Y的概率密度f(y)。 ? ?
定理:若函数g(x)处处可导且g(x)的倒数恒大与0或恒小于0,则有以下结论: ? ? ? ? ? ? ? f(y)=fX[h(y)]|h/(y)|,其中h(y)为y=g(x)的反函数。
做法2(分布函数法)【必会】连续型随机变量函数的分布的求法,通常是采用分布函数的定义的方法。我们将分布函数变形,将它化成关于?的分布函数,然后对?y 求导,就得到了?Y?的概率密度。
设E是一个随机试验,它的样本空间是S={e},设X=X{e}和Y=Y{e}是定义在S上的随机变量,由它们构成的一个向量(X,Y)称为二维随机变量。
1、定义:F(x,y)=P{X≤x,Y≤y},也称为联合分布函数。?? ? ?? ???
?P{a<X≤b,c<Y≤d}=F(b,d)-F(b,c)-F(a,d)+F(a,c) ? ? ?
2、性质 ? ? ? ?
(1)F(x,y)是变量x和y的不减函数。
(2)0≤F(x,y)≤1,F(-∞,y)=0,F(x,-∞)=0,F(-∞,-∞)=0,F(∞,∞)=1 ? ? ? ?
(3)F(x,y)关于x和y右连续
1、定义:二维R.V的所有可能取值是有限对或可 列无限多对。 ? ? ?
2、分布律:P{X=xi,Y=yj}=pij,i,j=1,2,3······也称联合分布律
1、定义:存在非负函数f(x,y),有, 其中f(x,y)称为二维随机变量(X,Y)的概率密度。
2、二维概率密度函数f(x,y)的性质
(1)f(x,y)≥0
(2)【必知】
(3)若f(x,y)在(x,y)处连续,则有
(4)设G是xoy平面上的一个区域,点(X,Y)落 在区域G内的概率为 ,积分区域为G。
1、边缘分布函数:已知联合分布函数F(x,y)
X的边缘分布函数为:FX(x)=P{X≤x}=P{ X≤x,Y≤∞}=F(x,∞) ? ? ?
?Y的边缘分布函数为:FY(y)=P{Y≤y}=P{ X≤∞,Y≤y}=F(∞,y)
2、离散型二维R.V的边缘分布律:已知联合分布律pij X的边缘分布律为:? ? ?
Y的边缘分布律为:
3、连续型二维R.V的边缘概率密度:已知联合概率密度f(x,y)? ?【必会】?
X的边缘概率密度为:
Y的边缘概率密度为:
1、离散型R.V的条件分布分布律 ?
(1) 若P{Y=yi}>0,则在Y=yi 条件下X的条件分布律为
P{ X=xi| Y=yi}= P{X=xi,Y=yj}/ P{Y=yi}=pij/p.j,i=1,2··· ?
(2)若P{X=xi}>0,则在X=xi 条件下Y的条件分布律为
P{ Y=yi | X=xi }= P{X=xi,Y=yj}/ P{ X=xi }=pij/ pi.,j=1,2··· ?
2、连续型R.V的条件概率密度 ? ?
(1)若fY(y)>0,在Y=y条件下X的条件概率密度为 ? ?
(2)若fX(x)>0,在X=x条件下Y的条件概率密度为??
(3)综合来说,条件分布=联合分布/边缘分布
3、二维R.V的均匀分布的定义
设G是平面上的有界区域,其面积为A,若其联合概率密度为 ,
则称(X,Y)在G上服从均匀分布。
1、定义:设F(x,y)及FX(x)、FY(y)分别是二维R.V(X,Y)的联合分布函数和边缘分布函数,若对于所有的x,y,有 ? ?
?F(x,y)= FX(x)·FY(y),则称R.V X和Y是相互独立的。
?2、对于连续型随机变量,有f(x,y)= fX(x)·fY(y)
?3、对于离散型随机变量,有P{X=xi,Y=yj}= P{X=xi}·P{Y=yi} ?
4、二维正态随机变量:? ? ? ?
?两个边缘分布为 ? ? ? ? ?
当ρ=0时,X和Y相互独立;若X和Y相互独立,则ρ=0.
1、Z=X+Y的分布 已知(X,Y)的联合概率密度为f(x,y),则Z的概率密度为 ;
若X和Y相互独立,则Z的概率密度为
;
2、关于随机变量之和的分布的几个结论
(1)设X和Y相互独立,且X~N(u1, σ12),Y~N(u2,σ22),则Z=X+Y仍服从正态分布, 且.
(2)若Xi~N(ui, σi2),i=1,2···且它们相互独立,则它们的和服从正态分布,
且有
(3)设X和Y相互独立,且X~π(λ1),Y~π(λ2),则Z=X+Y~π(λ1+λ2).
(4)设X和Y相互独立,且X~b(n,p),Y~b(n,p),则 Z=X+Y~b(2n,p)
3、M=max(X,Y)和N=min(X,Y)的分布函数?? ? ? ? ? ?
(1) 设X、Y相互独立,其分布函数分别为FX(x)、FY(y),则【必知】
? ? ? ? ?
上述结论可以推广到n个相互独立的随机变量的情况。 ? ? ?
?(2)若?相互独立且均服从参数为θ的指数分布,定义,则Z服从参数为θ/n 的指数分布。
1、离散型随机变量X,其分布律为P{X=xk}=pk,k=1,2,3···若级数绝对收敛,则称该级数的和为R.V X的数学期望,记为。
2、连续型随机变量X,其概率密度为f(x),若积分绝对收敛,则称该积分值为随机变量X的数学期望,记为。【必知】
设Y为随机变量X的函数,Y=g(X),其中g是连续函数 ? ?
1、已知离散型随机变量X,其分布律为P{X=xk}=pk, k=1,2,3···则Y的数学期望为
2、已知连续型随机变量X,其概率密度为f(x),则Y的数学期望为
结论:不必知道Y的概率分布,可以通过X的概率分布求Y的 数学期望。
以上结论可以推广到求取二维随机变量的函数的数学期望, 已知条件为二维随机变量的联合概率分布。
1、设C是常数,则有E(C)=C。
2、设X是随机变量,C是常数,则有E(CX)=CE(X).
3、设X、Y是两个随机变量,则有E(X+Y)=E(X)+E(Y).
4、设X、Y是相互独立的随机变量,则有E(XY)=E(X)E(Y). ? ? ? ? ?
第3、4条性质可以推广到n个随机变量。
1、方差的定义:设X是R.V,若E{[X-E(X)]2}存在,则称其 为X的方差,记为D(X),即D(X)=E{[X-E(X)]2}。
2、方差的意义:方差表示随机变量X的取值与其数学期望E(X)的偏离程度。
3、方差的计算:由方差的定义可知,方差实质为一数学期 望,是随机变量的函数[X-E(X)]2的数学期望。
(1)离散情况:
(2)连续情况:
(3)计算方差的重要公式:D(X)=E(X2)-[E(X)]2【必会】
设R.V X的E(X)=u,D(X)=σ2≠0,记X*=(X-u)/σ,则称X*为X的标准化的随机变量。且E(X*)=0,D(X*)=1。
1、设C为常数,则D(C)=0。
2、设X是R.V,C是常数,则有【必知】
3、设X、Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}
4、若X、Y相互独立,则有D(X+Y)=D(X)+D(Y),此结论可以推广到n 个相互独立的随机变量的情况。
5、D(X)=0的充要条件是X以概率1取常数C,且C=E(X)。
1、X~(0-1),X=1的概率为p,则有E(X)=p,D(X)=p(1-p) ? ?
2、X~B(n,p),则有E(X)=np,D(X)=np(1-p) ? ?
3、X~π(λ),则有E(X)=λ,D(X)=λ ? ?
4、X~U(a,b),则有E(X)=(a+b)/2,
5、X~E(θ),则有E(X)=θ,?
6、X~N(u,σ2),则有E(X)=u,
定理:设随机变量X具有数学期望E(X)= u,D(X)=σ2,则对于任意正数ε,不等式 ? ? ? ? ? ? ? ? ? ? 成立,该不等式称为切比雪夫不等式。 ? ?
切比雪夫不等式的另一种形式:
1、X、Y的协方差的定义:Cov(X,Y)=E{[X-E(X)][Y-E(Y)]} ? ?
2、X、Y的相关系数的定义:ρXY= Cov(X,Y)/√D(X)D(Y) ? ?
3、跟协方差及相关系数有关的计算公式:
(1)D(X+Y)=D(X)+D(Y)+2Cov(X,Y);D(X-Y)=D(X)+D(Y)-2Cov(X,Y)
(2)Cov(X,Y)= ρXY√D(X)D(Y)
(3)Cov(X,Y)=E(XY)-E(X)E(Y)【必会】
(4)Cov(X,X)=E(X2)-E(X)E(X)=D(X)
?4、协方差的性质 ? ?
(1)Cov(X,Y)= Cov(Y,X) ? ?
(2)若a,b为常数,则Cov(aX,bY)=ab Cov(X,Y) ? ?
(3)Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y) ?
5、相关系数的性质 ? ? ?
(1)|ρXY|≤1 ? ?
(2)|ρXY|=1的充要条件是:存在常数a,b,使 P{Y=a+bX}=1
?6、不相关的定义及性质 ? ? ?
(1)不相关的定义:如果ρXY=0,则称X和Y不相关 ? ? ?
(2)以下4条说法和不相关等价 ? ? ? ? ? ? ? ? ? ?
①ρXY=0; ? ? ? ? ? ? ? ? ?②Cov(X,Y)=0; ? ? ? ? ? ? ? ? ? ?
③E(XY)=E(X)E(Y);④D(X+Y)=D(X)+D(Y)。 ? ? ?
(3)若X和Y相互独立,则X和Y不相关;反之不成立。 ?
?7、 二维正态分布X和Y不相关的充要条件为:ρ=0; ? ? ? ? ? ? ?
结合二维正态分布X和Y相互独立的条件可知, ? ? ? ? ? ? ?
二维正态分布X和Y不相关和独立是等价的,充 要条件均为ρ=0。
1、X的k阶原点矩:E(Xk),K=1,2,3······ ?
2、X的k阶中心距:E{[X-E(X)]k},k=2,3······ ? ?
3、X和Y的k+l阶混合矩:E[XkYl],k,l=1,2,3······ ?
4、X和Y的k+l阶混合中心矩:E{[X-E(X)]k[Y-E(Y)]l},k,l=1,2,3······ ? ?
由矩的概念知,E(X)为X的一阶原点矩;D(X)为X的二阶中心矩;
Cov(X,Y)为X、Y的二阶混合中心矩。
1、n维正态随机变量(X1,X2···Xn)的每一个分量Xi(i=1,2···n)都是正态随机变量;
反之,若X1,X2···Xn是相互独立的正态随机变量, 则(X1,X2···Xn)是n维正态随机变量。
2、n维随机变量(X1,X2···Xn)服从n维正态分布的条件是X1,X2···Xn的任意线性组合服从一维正态分布。
设随机变量X1,X2···Xn···相互独立,且具有相同的数学期望和方差:,
做前n个随机变量的算术平均值,则对于任意的ε>0,有
实际意义:用n很大时的Yn来估计u的值。
设nA是n次独立重复试验中事件A发生的次数,p是 事件A在每次试验中发生的概率,则对于任意的ε>0,有
实际意义:以严格的数学形式证明了频率的稳定性,从而可以用n很大时的频率来代替概率。
设随机变量X1,X2···Xn···相互独立,服从同一分布且具有数学期望E(Xk)=u,则对于任意的ε>0,有
设X1,X2···Xn···是一个随机变量序列,a是一个常数,若 对于任意的ε>0,有
则称序列X1,X2···Xn···依概率收敛于a。记为
1、定义:把和的分布收敛于正态分布这一类定理都叫 作中心极限定理。
2、独立同分布的中心极限定理: 设随机变量X1,X2···Xn···相互独立,服从同一分布 且具有数学期望,
定义随机 变量,则有,从而有
3、李雅普诺夫定理:
设随机变量X1,X2···Xn···相互独立,具有数学期望 和方差:,定义随机变量 ,则有,从而有
4、棣莫佛-拉普拉斯定理:
设随机变量Xn~B(n,p),定义随机变量,则有,从而有
设随机变量X1, X2,…, Xn相互独立,且服从相同的分布,他们的数学期望和方差均为μ和σ2(>0)。记:【理解清楚】
则有
?其中φ(z)是标准正态分布的分布函数。
1、总体:研究对象的某项数量指标的值得全体。一般用随机变量或随机变量的分布函数来表示总体。
2、个体:总体中的每个元素称为个体。
3、抽样:为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息 ,这一抽取过程称为抽样。
4、样本和样本值:抽样得到的个体称为样本,样本所取到的观察值称为样本值。
5、简单随机样本X1,X2···Xn的特点:独立同分布
(1)X1,X2···Xn是相互独立的随机变量;
(2)X1,X2···Xn中的每一个个体与所考察的总体有相同的分布。
1、统计量的定义: 不含任何未知参数的样本的函数称为统计量。
2、常用统计量: 设X1,X2···Xn是来自总体的样本,则有以下常用统计量
(1)样本均值:
(2)样本方差:
(3)样本标准差:
(4)样本k阶原点矩:
(5)样本k阶中心矩:
1、抽样分布的定义:统计量的分布称为抽样分布。
2、常用抽样分布
(1) ? ?分布的定义及性质 (2)t分布的定义 (3)F分布的定义
?3、正态总体的样本均值和样本方差的分布 ?
(1)样本均值和样本方差的数字特征 ? ? ? ? ?
设总体X的均值为u,方差为σ2,X1,X2···Xn是总体X的 一个样本,则总有 ? ? ? ?(2)正态总体样本均值的分布 ? ? ? ? ?
设X1,X2···Xn是总体N(u,σ2)的一个样本,则有 ?
(3)正态总体样本方差的分布 (卡方分布)?【必会】?
设X1,X2···Xn是总体N(u,σ2)的一个样本,则有 a: (主要结论)? ? ? ? ?
b:样本均值与样本方差相互独立 ?
(4)与样本均值和样本方差有关的一个分布? (t分布)? ? ? ? ? ??
设X1,X2···Xn是总体N(u,σ2)的一个样本,则有
(5)F分布
F分布是由两个卡方分布与其自由度比值的比值确定的分布,记作
1、点估计问题 ? ? ? ?
设总体X的分布函数为F(x;θ),θ为待估计的参数。X1,X2···Xn是总体X的一个样本,x1,x2,···xn是相应的一个样本值。点估计问题就是构造一个适当的统计量 ?,用它的观察值来估计参数θ。统计量称为估计量,观察值称为估计值。?
2、矩估计法 ? ? ? ?
理论依据:样本矩Ak依概率收敛于相应的总体矩uk ? ? ? ? ?
具体做法:令Ak=uk,有几个未知参数就列几个等式,求解方程或方程组即可得到未知参数的矩估计量,代入样本值,即可得到相应的矩估计值。
求解:求出期望,令其=x的绝对值,求得未知参数的^
3、最大似然估计法
对于离散总体,已知其分布律;对于连续总体,已知其概率密度。
由总体的分布律或概率密度写出样本似然函数L(θ)
求样本似然函数的最大值,最大值所对应的θ即为参数θ的最大似然估计值
最大似然估计的性质:设θ的函数u=u(θ)具有单值反函数 ? ? θ=θ(u),若 是θ的最大似然估计,则是u(θ)的 最大似然估计。 ?
求解:对L(θ)取对数,两边分别对θ求导,令其为0,求得
1、无偏性:如果,则称是θ的无偏估计量。 ? ? ? ? ? ? ?
结论:Ak是uk的无偏估计;样本均值是总体均值的无偏估计;样本方差是总体方差的无偏估计。
无偏估计量:若a为b的无偏估计量,则E(a)=b;
2、有效性:设和是θ的无偏估计,若有 ,则称比有效。
3、相合性:设 (X1,X2…Xn)是θ的估计量,当n趋于?无穷大时,若(X1,X2…Xn)依概率收敛于θ,则称 ?(X1,X2…Xn)为θ的相合估计量。
1、区间估计的定义: ?? ?
设总体X的分布函数为F(x;θ),其中含有一个未知参数θ,对于 给定的α(0<α<1),若由样本X1,X2…Xn确定的 ? ? ? 两个统计量?和 ,满足?,则称区间为θ的置信度为1-α的 置信区间。 ? ? ? ?
其中为置信下限,为置信上限,1-α为置信度。?
2、求未知参数θ的置信区间的步骤 ?
(1)明确问题。确定求什么参数的置信区间,置信水平1-α是多少。 ?
(2)寻找参数θ的一个良好的点估计T(X1,X2…Xn),可从无偏估计入手。 ?
(3)寻找一个待估参数θ和估计量T的函数Z(T,θ),而且其分布已知。Z(T,θ)称为枢轴量。 ? (4)对于给定的置信水平1-α,根据Z(T,θ)的分布,确定常数a,b,使得。 ?
(5)做等价变形,求出 。?
3、正态总体均值的区间估计 ? ? ?
总体X~N(u,σ2), X1,X2…Xn为样本,设置信度为1-α,求均值u的置信区间。 ?
(1)已知的情况。置信区间为
(2)未知的情况。置信区间为 ? ? ? 4、正态总体方差的区间估计
总体X~N(u,σ2), X1,X2…Xn为样本,设置信度为1-α,求方差 的置信区间。 ? ? ?
u未知情况下,置信区间为 ??? ? ?
5、单侧置信区间 ? ? ? ?
给定值α ?( 0< α<1 ),若由样本X1,X2…Xn确定的统计量 ?
(1)满足?,则称 为θ的置信度为1-α的单侧置信区间, ?称为单侧置信下限; ?
(2)满足 ?,则称 为θ的置信度为1-α的单侧置信区间, ?称为单侧置信上限;
(3)在形式上,将双侧置信区间里面的上下限中的α/2改成 α,即可得到对应的单侧置信上下限。 ? ? ? ?? ? ? ? ?