b。 当aw X1VX2W b时,X落在区间(x1,x2)内的概率为 x2 x. P(x1 X x2)———1。 b a指数分布
「 e
f(x) w
0,
其中 0,则称随机变量X服从参数为
X的分布函数为
的指数分布
1
F(x)'
记住积分公式:
0,
e
x
, x<0。
x
xe dx n!
n
x
0
正态分布 设随机变量X的密度函数为 1 — f(x) 其中 、 2J2 2 x , X , 0为常数,则称随机变量 X服从参数为 、 的正态分布或高斯(Gauss 分布,记为X ~ N(,)。 f(X)具有如下性质: 对称的; 1° f(x)的图形是关于X 2°当X 时,f( ) 2 1 _ 为最大值; V2 若x ~ N(,),则X的分布函数为 彳 F(x) 1 V2 0住)2 x ----------- 2^ e dt 2 o o 参数 、 1时的正态分布称为标准正态分布,记为 X~N(0,1),其密度函数记为 1 乂 2(x) VTe ,x, 分布函数为 1 X丄 (x)厂 e 2dt。 (x)是不可求积函数,其函数值,已编制成表可供查用。 1 ①()=1-①(X且 ①()=一。 2 2 X 如果 X~N(,),则 〜N(0,1)。 。 P(x1 X x2) (6)分位数 下分位表:P(X )=; )=。 已知布 上分位表:P(X (7)函数分 布 离散型 X的分亍列为 X P(X Xi) Y g(X) 的 Y P(Y y) X1, X2, P1, P2, i勺分布列(yi , Xn, , Pn,' g(xi )互不相等)如下: , g(xn), , Pn, g(X1), g(X2), P1, P2, 若有某些g() 0)相等,则应将对应的 Pj相加作为g (Xi)的概率。
连续型 先利用X的概率密度fxx)写出丫的分布函数Fv(y) = P(g(X)< y),再利用变上下限积分的求导公式求 出 %y)。
第三章二维随机变量及其分布 (1)联合分 离散型 布
如果二维随机向量 (X, Y)的所有可能取值为至多可列个有序对(x,y),则称 为离散型随机
设 =(X,Y)的所有可能取值为(Xi,yj)(i,j 1,2,),且事件{ =(Xi,yj)}的概率为
Pij,,称
P{(X,Y) (Xi,yj)} Pj(i,j 1,2,)
为 =(X,Y)的分布律或称为 X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:
y1 y2 ・・・ yj ・・・ X1 X2 pn P21 P12 P22 ・・・ P1j P2j ・・・ ・・・ ・・・ Xi Pi1 ・・・ Pij ・・・
这里Pij具有下面两个性质
(1) (2)
i j
Pij>0 (i,j=1,2,…);
Pj 1.
连续型 对于二维随机向量 (X,Y), 如果 存在非负函数 f(x,y)( x , y 使对任意一个其邻边分别平行于坐标 ), 轴的矩形区域 D,即 D={(X,Y)|a 0; f (x, y)dxdy 1. (X x,Y 机变量的本 质 y) (X x Y y) (3)联合分 布函数 设(X,Y)为二维随机变量,对于任意实数 x,y,二元函数 F(x, y) P{X x,Y y} 称为二维随机向量(X,Y)的分布函数,或称为随机变量 X和Y的联合分布函数。 分布函数是一个以全平面为其定义域,以事件 {( 1, 2)| X( 1) x, Y( 2) y}的概率为函 数值的一个实值函数。分布函数 (1) F(x,y)具有以下的基本性质: 0 F (x, y) 1; (2) F( x,y)分别对x和y是非减的,即 当 X2>xi 时,有 F(X2,y) > F(xi,y);当 y2>yi 时,有 F(x,y2) > F(x,yi); (3) F (x,y)分别对x和y是右连续的,即 F(x,y) F(x 0,y),F(x, y) F(x, y 0); (4) F(, )F( , y) F(x, ) X2,y1 y2, 0,F( 1 , ) (5)对于x1 F(X2, y2) Fg, yj (4)离散型 与连续型的 Fg y2)Fg, yj 0. P(X x,Y y) P(x X x dx,y Y y dy) f(x, y)dxdy关系
(5)边缘分 布 离散型 X的边缘分布为 P? P(X xj j Pj(i,j 1,2,); Y的边缘分布为 P?j P(Y yj) i Pj(i, j 1,2,)。 连续型 X的边缘分布密度为 fx(x) Y的边缘分布密度为 f (x, y)dy; fY(y) (6)条件分 布 离散型 f (x, y)dx. 在已知X=Xi的条件下,Y取值的条件分布为 Pij P(Y yj |X xj 二; Pi? 在已知Y=yj的条件下,X取值的条件分布为 P(X Xi|Y yj)—, 连续型 Pij P?j 在已知Y=y的条件下,X的条件分布密度为 f(x|y) f(x,y); fY(y) 在已知X=x的条件下,Y的条件分布密度为 f(y|x)曽 fx(X) (7)独立性 一般型 离散型 F(X,Y)=F(x)FY(y) Pij Pi?P?j 有零不独立 连续型 f(x,y)=fX(x)fY(y) 直接判断,充要条件: ① 可分离变量 ② 正概率密度区间为矩形 1 x 1 2 (x 1)(y 2二维正态分布 2) y 2 2 2 1 2 2 f (x, y) 2 1 1 2(1 / ------ - e 201 2) 1 =0
随机变量的函 若Xi,X2,…Xm,Xm+1,…Xn相互独立,h,g为连续函数,则: h ( Xi, X2,…Xm)和 g ( Xm+1,…Xn)相互独立。 数 特例:若X与Y独立,则:h (X)和g (Y)独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 (9)二维正 态分布 设随机向量(X, Y)的分布密度函数为 2 2 1 x 1 1 2 (x 1)(y 1 2 2) y 2 2 f(x, y) 2 0, N ( 1 1 21 2(1 2) 2 6J1 其中1, 2, 1 2 0,| | 1是5个参数,则称(X, 2, 1 Y)服从二维正态分布, 记为(X, Y〜 , , 2 ,)・ 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即X〜N ( 1 , 12),Y~N( 2, ;)• 0 0 但是若X〜N ( (10)函数分 布 11 , ),丫 ~ N( 2, 2),(X,丫未必是二维正态分布。 Y z) Z=X+Y 根据定义计算:FZ(z) P(Z z) P(X 对于连续型,f^z)= f (xz, x)dx 1 2 1 2 2 2 )。 两个独立的正态分布的和仍为正态分布( , n个相互独立的正态分布的线性组合,仍服从正态分布。 2 i i i > 2 2 2 C・ i C 2 i i i 22 Z=max,min(Xi, 若X1,X2 Xn相互独立,其分布函数分别为 FX1 (x), Fx2 (x) FXn (x),则 Z=max,min(X1,X2,… X2,…Xn) Xn)的分布函数为: Fmax(x) Fx1(x)?Fx2(x) Fxn(x) 1 [1 卩沟仪)]?[1 FX2(X)] Fmin(x)
[1 Fxn(x)]
2分布 设n个随机变量X1,X2, ,Xn相互独立,且服从标准正态分布,可以证明它们的平方和 n W i 1 的分布密度为 “ n Xi 21 f(u) 2 y 2 0 , 2 2 U 2 e 2 2 n — 1 — u u 0, u 0. 我们称随机变量 W服从自由度为n的 分布,记为 W〜2(n),其中 n — 2 0 2 - i x2 e xdx. 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。 分布满足可加性:设 丫i k 2 (n),i 则 Z i 1 丫 ~ (ni n2 X ~ N(0,1),Y~ 2nQ. (n), 设X,Y是两个相互独立的随机变量,且 t分布 可以证明函数 T 二 丁丫 / n 的概率密度为 f(t) n 1 2 / 勺n n 1 n — 1 一 n t2 2 ' ( t ) 八 2 我们称随机变量T服从自由度为n的t分布,记为T〜t(n)。 t1 (n) t (n)
F分布 2(、 2(、 X / n〔 的概率密度函数为 设X ~ (n 1), Y ~ (n2),且X与丫独立,可以证明F Y/n 2ni n2 f(y) f(y2 n1 2 2 n2 丿 ni 2 号 y2 1 y n2 0,y 0 山 1n1 n2 ni n2 2 ,y 0 我们称随机变量F服从第一个自由度为 ni,第二个自由度为n2的F分布,记为F〜f(ni,n2). F (ni,n?)厂
第四章 随机变量的数字特征 XI F (n, nJ 2/ \\
(- > 随变的字征维机量期望 数特期望就是平均值 离散型 设X是离散型随机变量,其分布律为 连续型 P(X xk) 设X是连续型随机变量,其概率密度为 f(x), =Pk,k=1,2,…,n, n E(X) (要求绝对收敛) xf (x)dx E(X) (要求绝对收敛) 函数的期望 Y=g(X) n Xk Pk k 1 Y=g(X) E(Y) k 1 g(Xk)Pk E(Y) g(x)f (x)dx 方差 D(X)=E[X-E(X)2, 标准差 D(X) [Xk E(X)] Pk k 2 D(X) [x E(X)]2 f (x)dx (X) JD(X), 矩 ① 对于正整数k,称随机变量X的k次幂的数学期望 为X的k阶原点矩,记为v«即 ① 对于正整数k,称随机变量X的k次幂的数学期 望为X的k阶原点矩,记为v«即 V k=E(X)二 X:Pi , k=1,2,… i v k=E(刈=xkf(x)dx, k=1,2,… ② 对于正整数 k,称随机变量 X与E (X)差的k 次幂的数学期望为 X的k阶中心矩,记为 k,即 ② 对于正整数k,称随机变量X与E( X)差的k次幂 的数学期望为X的k阶中心矩,记为 k,即 k E(X E(X))k k k E(X E(X ))k =(Xi i E(X)) Pi , k=1,2,… =(x E(X)) f(x)dx, k=1,2,… k 切比雪夫不等式 设随机变量X具有数学期望E (X) =g,方差D ( X) 2 P(|X I ) 2 =b 2,则对于任意正数£,有下列切比雪夫不等式 率 切比雪夫不等式给出了在未知 X的分布的情况下,对概 P(|X 的一种估计,它在理论上有重要意义。 ) (2) 期望 的性 (1) (2) E(C)=C E(CX)=CE(X) n n CE(3) 质 (4) E(X+Y)=E(X)+E(Y)E( CiXi ) i 1 i 1 i(Xi) E(XY)=E(X) E(,充分条件:X 和 丫 独立; 充要条件:X和Y不相关。 (3) 方差 的性 质 (1) D(C)=0 E(C)=C (2) (3) (4) D(X)=E(X)-E2(X) (5) D(X± Y)=D(X)+D(Y)充分条件:X 和 丫独立; 充要条件:X和丫不相关。 D(X± Y)=D(X)+D(Y)± 2E[(X-E(X))(Y-E(Y))]无条件成立。 而 E(X+Y)=E(X)+E(Y)无条件成 D(aX)=^D(X); E(aX)=aE(X) D(aX+b)= aD(X); E(aX+b)=aE(X)+b 立。 期望 方差 (4) 常见 分布 的期 望和
0-1 分布 B(1, p) p 二项分布B(n, p) p(1 p) np np (1 p) 泊松分布P() 方差 几何分布G(p) 1 P 1 P ~2~ P 超几何分布 H(n, M, N) nM N ,M N n nM 1 N N N 1 均匀分布U (a,b) a b (b a)2 12 2 指数分布e() 1 21 2 2 正态分布N ( , ) n 2 分布 2n t分布 0 -------- (n>2) n n 2 (5) 期望 二维 n E(X) i 1 n Xi Pi? E(X) xfX (x)dx 随 机 变 量 E(Y) j 1 yj P?j E(Y) yfY(y)dy 的 数 字 特 函数的期望 E[G(X,Y)]= E[G(X,Y)]= 征 G(Xi, y j)Pj i j G(x, y) f (x, y)dxdy 方差 D(X) [Xi i D(X) E(X)]2pi? [x E(X)]2fx (x)dx D(Y) j [Xj E(Y)]2p?j D(Y) [y E(Y)]2fY(y)dy 协方差 对于随机变量X与Y ,称它们的 二阶混合中心矩11为 X与 Y的协方差或相关矩,记为 XY 或 cov(X, Y) ,即 XY 11 E[(X E(X ))(Y E(Y))]. XX 与 YY。 与记号 XY相对应, X与Y的方差D (X)与D (Y)也可分别记为
相关系数 对于随机变量X与丫,如果D(X)>0, D(Y)>0,则称 XY JD(X)JD(Y) XY (有时可简记为 为X与Y的相关系数,记作 )。 | | < 1,当 | |=1 时,称 X与丫完全相关:P(X aY b) 1 完全相关正相关,当负相关,当 时, 1时(a 0), 1(a 0)而当 0时,称X与Y不相关。 以下五个命题是等价的: ① XY 0 ; ② cov(X,Y)=0; ③ E(XY)=E(X)E(Y); ④ D(X+Y)=D(X)+D(Y); ⑤ D(X-Y)=D(X)+D(Y) 协方差矩阵 XX XY YX YY 混合矩 对于随机变量X与Y,如果有E(X kYl )存在,则称之为X与Y的k+l阶混合原点矩,记为 ki ; k+l阶 混合中心矩记为: uk E[(X E(X))k(Y E(Y))1]. (6) 协方 差的 性质 (7) 独立 (i) (ii) (iii) (iv) (i) cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(Xi+X2, Y)=cov(X,Y)+cov(X;Y); cov(X,Y)=E(XY)-E(X)E(Y). 若随机变量 X与Y相互独立,则 〜N ( 2 XY 0 ; ) 反之不真。 2(ii) 和不 若(X,Y) ' 1) 2? 1 ) 2 1 丿〉 相关 则X与Y相互独立的充要条件是 X和Y不相关。 第五章 大数定律和中心极限定理
( 1)大数定律 X
( 2)中心极限定理
2
X N(,)
n
切比雪 夫大数 定律
大数定
辛钦大 数定律
格定理
设随机变量 冶,X2,…相互独立,均具有有限方差,且被同一常数 C所界:D (Xi) 于任意的正数£,有P
lim
Lx,丄
n n ° E(Xi)
n
i 1 i 1
1
特殊情形: 若 X1,
X2,
…具有相同的数学期望 E (X)=「
则上式成为
lim P
1 n
Xi
n
1
.
设卩是n次独立试验中事件 A发生的次数,p是事件A在每次试验中发生的概率,则对于任意
的正数£,有
lim
n
1.
伯努利大数定律说明,当试验次数 很大时,事件 A发生的频率与概率有较大判别的可能性很
小,即
lim
n
0.
这就以严格的数学形式描述了频率的稳定性。
设X1, X2,…,Xi,…是相互独立同分布的随机变量序列,且
E ( Xn) =g,则对于任意的正数£有
1 n
lim P X1n
n i i 1
.
设随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:
E(Xk)
,D(Xk)
0(k 1,2,
),则随机变量
n
Xk n
Yn
k 1
的分布函数Fn(x)对任意的实数X,
Xk
n
2X
t
lim F2
n
(x) lim
e dt.
n n
此定理也称为独立同分布的中心极限定理。
棣莫弗 设随机变量Xn为具有参数n, p(0
常见统计量及
样本均值
其性质
一
1 X
n
Xi. n i 1
—2
1 /
n
—、2
样本方差
a S
. n 1 i 1
n
(v(X X).
样本标准差
S
1 J / i 1 \\ n 1
1
(x X)2 (XX)
-
样本k阶原点矩
Mk
1
n
X,k 1,2,
k i
■
n i 1
样本k阶中心矩
Mk
1
n
(X
i
X),k
k
2,3,.
n
1
2
E(X)
, D(X)
n
E(S)
22
*2
E(S )n
1
2
n
>
n
其中S*
2
1 n
(Xi
2
X),为二阶中心矩。
1
2
(2)正态总 体下的四大
正态分布
设 Xi, X2 ,
,x n为来自正态总体N(,
)的一个样本,则样本函数
分布
def X
u
设 Xi, X2 ,
_
N(0,1).
t分布
,X n为来自正态总体N(,
2
)的一个样本,则样本函数
def
X t
s.
1),
其中t(n-1)表示自由度为 n-1的t分布。
2
分布
设 Xi, X2 , ,xn为来自正态总体N(,
def
2
)的一个样本,则样本函数
2
2 ,
(n 1)S
2
八
w
其中
2
~ (n 1),
(n
2
1)表示自由度为n-1的 ,Xn为来自正态总体 )的一个样本,则样本函数
def
分布。
F分布
设 Xi, X2,
N( ,12)
的一个样本,而
丫1」2, ,Yn 为来自正态总体
N( , 1
S; / 21
F_^- 2 S; / 2
F(n〔 1,门2 1),
其中
Si
ni
2
1
n
i
— 2
‘1 i i (Xi X)
2 1
SS
2
A
n
2
(Yi ■y)2;
匕1 i 1 1的F分布。
F(m 1, n2 1)表示第一自由度为m
1,第二自由度为n2
(3)正态总
2
X与S独立。
体下分布的 性质
第七章参数估计
(1 )点
矩估计
设总体X的分布中包含有未知数
m,则其分布函数可以表成
F(X; 1, 2
m
).它的k阶原
, m)
估计
k
点矩 Vk E(X )(k 1,2, ,m)中也包含了未知参数
12
, , , m,即 vk vk( 1, 2,
又设X1 , X2 , , Xn为总体X的n个样本值,其样本的k阶原点矩为
k
n i 1
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
V1 ( 1 , 2 ,
V2 ( 1 , 2 ,
Vm( 1,
2 ,
由上面的m个方程中,解出的m个未知参数(「2,
i
(k 1,2, ,m).
,m
)
n 1 n Xi ,
i 1 ,1 n 2
m)
Xi
n i 1
,1 n
m)
n 1i 1
, m)即为参数(1, 2, , m)的矩估计量。
若 为 的矩估计,g(x)为连续函数,则g( 3为g()的矩估计
极大似然 估计
当总体X为连续型随机变量时,设其分布密度为
f (X; 1 ,
2
m
),其中
数。又设X1 , X2 , , xn为总体的一个样本,称
n
L(
为样本的似然函数,简记为
当总体X为离型随机变量时,设其分布律为
f (Xi;
m
)
P{X
X} p(x;
m
),则称
(2 )估 计量的 评选标 准
无偏性
致性
L(X1,X2 ,
, Xn; 1, 2,
m
)
p( Xi;
m
)
为样本的似然函数。
若似然函数L(X1 ,X2, , Xn; 1,
2
m
)在1
m处取到最大值, 则称 1 ,
分别为
m的最大似然估计值,相应的统计量称为最大似然估计量。
In Ln
0,i 1,2, ,m
-H-*若 为 的极大似然估计,g(x)为单调函数,则g ( ?)为g()的极大似然估计。
(x1 , X2, , Xn )为未知参数
的估计量。若E ()=,则称 为 的无偏估计量。
E( X)=E( X), E(於)=D( X)
设1
1
(x1 , X,2 , , xn )和 2
2
(x1 , x,2 , , xn)是未知参数 的两个无偏估计量。若D ( 1 ) D ( 2),则称1比2有效。
设n是 的一串估计量,如果对于任意的正数 ,都有
lim P(| n |
) 0,
则称 n为的一致估计量(或相合估计量)。 若 为 的无偏估计,且D( ?)
0(n ),则 为 的一致估计。
只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
2
(3 )区 间估计
置信区间 和置信度
设总体X含有一个待估的未知参数
。如果我们从样本x1, x,2 ,
2
,Xn岀发,找岀两个统计量
)
1
(X, x,, 11 2
, x)
n
与 2
(X1,X,2, , Xn)(
1 2
,
使得区
间[ 1
,
2
]
以
1
(0 1)的概率包含这个待估参数
,即
P{ 1
2
} 1
7
那么称区间[1,
2]为 的置信区间,1
2
为该区间的置信度(或置信水平) 。
2
单正态总
设 x1, x,2 , , Xn 为总体 X ~ N(
7
)的一个样本,在置信度为1
下, 我们来确定
和
的置信区
体的期望
和方差的
间[1, 2]。具体步骤如下: (i)选择样本函数;
区间估计
(ii)由置信度1
,查表找分位数;
(iii)导岀置信区间[1,
2]。
已知方差,估计均值 (i)选择样本函数
u
X
o /』
-N(0,1). n
(ii)查表找分位数
P
X
0 z
n
■—
1
(iii)导岀置信区间
X
0 _ 厂,
X
0 /~
J n
(i)选择样本函数
v n
未知方差,估计均值
X
t - SV」
一
(ii)查表找分位数
X
P
S/玄n
厂
1 .
(iii)导岀置信区间
X
S -
_S J n
基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设 Ho是否成立。我们先假定 Ho是成立的。如果根据这个假定导致了一个不合理的事件发生,那就 表明原来的假定Ho是不正确的,我们拒绝接受 Ho;如果由此没有导出不合理的现象,则不能拒绝接受 Ho,我们称Ho是 相容的。与 Ho相对的假设称为备择假设,用 Hi表示。 这里所说的小概率事件就是事件 {K R },其概率就是检验水平a,通常我们取a 基本步骤 =,有时也取或。 假设检验的基本步骤如下: (i) 提出零假设Ho; 选择统计量K; 对于检验水平a查表找分位数入; 由样本值X2 , (ii) (iii) (iv) , Xn计算统计量之值K; (或K )时否定Ho,否则认为Ho相容。 Ho。这时,我们 将K两类错误 与 进行比较, 作出判断:当|K | 第一类错误 当Ho为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 把客观上Ho成立判为Ho为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或 第一类错误,记 为犯此类错误的概率,即 P否定 Ho|Ho 为真}=; 此处的a恰好为检验水平。 第二类错误 当Hi为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H。。这时,我们 把客观上Ho。不成立判为Ho成立(即接受了不真实的假设),称这种错误为“以假当真”的错误 或第二类错误,记 为犯此类错误的概率,即 P接受 Ho| Hi 为真}=。
人们当然希望犯两类错误的概率同时都很小。但是,当容量 两类错误的关系 相反地, 变小,则 变大。取定 n—定时, 变小,则 变大; 要想使 变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平aoa大小的选 取应根据实际情况而定。当我们宁可“以假为真” 女口,甚至。反之,则应把a取得大些。
、而不愿“以真当假”时,则应把a取得很小, 单正态总体均值和方差的假设检验 对应样本 条件 零假设 统计量 函数分布 否定域 H 0 : 已知2 0 |u| ui U /法 N(o,1) H :o 0 ou u1 u U1 1 — 2 H 0 : H o : 2 o o |t| t1 (n 1) 誌 t(n 1) t t1 (n 1) t t1 (n 1) w 2未知 H :0 0 TH o : o (n 1)或 2 Ho: 2 2 2 w 2未知 H : □ o・ 2 2 …(n 1)S2 W 2 o 1 — 2 (n 1) 2(n 1) w w o ; (n 1) 2H : 2 □ o・ 2 o (n 1)