搜索
您的当前位置:首页正文

概率论与数理统计公式整理(超全免费版)

来源:二三四教育网
第1章随机事件及其概率 Dn m! --------------- 从m个人中挑出n个人进行排列的可能数。 Pm (1)排列组合公式 rn (m n)! m! Cm n !(m n)! ---------- 从m个人中挑出 n个人进行组合的可能数。 加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由 可由m+n种方法来完成。 (2)加法和乘法原理 乘法原理(两个步骤分别不能完成这件事) 某件事由两个步骤来完成,第一个步骤可由 可由mx n种方法来完成。 重复排列和非重复排列(有序) 顺序问题 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不 能断言它岀(4)随机试验和随机事件 现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 在一个试验下,不管事件有多少个,总可以从其中找岀这样一组事件,它具有如下性质: ① 每进行一次试验,必须发生且只能发生这一组中的一个事件; ② 任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用 (5)基本事件、样本空间 和事件 基本事件的全体,称为试验的样本空间,用 一个事件就是由 们是 的子集。 中的部分点(基本事件 来表示。 表示。 )组成的集合。通常用大写字母 A,B,C,…表示事件,它 对立事件(至少有一个) :mxn m种方法完成,第二个步骤可由 n种方法来完成,则这件事 m种方法完成,第二种方法可由 n种方法来完成,则这件事 (3) —些常见排列 为必然事件,?为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Q)的概率为 1,而概率为1的事件也不一定是必然事件。 ① 关系: 如果事件A的组成部分也是事件 B的组成部分,(A发生必有事件B发生):A B 如果同时有A B,B A,则称事件A与事件B等价,或称A等于B: A=Bo A、B中至少有一个发生的事件: A B,或者A+Bo 属于A而不属于B的部分所构成的事件,称为 A与B的差,记为A-B,也可表示为A-AB或者AB,它 表示A(6)事件的关系与运算 发生而B不发生的事件。 A、B同时发生:A B,或者ABo A B=?,则表示A与B不可能同时发生,称事件 A与事件B互不 相容或者互斥。基本事件是互不相容的。 -A称为事件A的逆事件,或称 A的对立事件,记为 A。它表示A不发生的事件。互斥未必对立。 ② 运算: 结合率:A(BC)=(AB)C AU (BU C)=(AU B)U C 分配率:(AB)U C=(AU C)n (BU C) (AU B)Q C=(AC)U (BC) Ai 德摩根率:「 瓦 i 1 A B A B , A B A B 设 为样本空间, A为事件,对每一个事件 A都有一个实数P(A),若满足下列三个条件: 1° 0 < 2° P(Q) =1 3°对于两两互不相容的事件 A1, A2,-有 (7)概率的公理化定义 P 常称为可列(完全)可加性。 则称P(A)为事件A的概率。 1Ai i 1 P(Ai) i 1 1 , 2 n , 1 2° P( 1) P( 2) 设任一事件A,它是由1, P(A)= ( 1) ( 2) P( n) 一。 2 n (8)古典概型 m组成的,则有 ( m) =P( 1) P( 2) P( m) m A所包含的基本事件数 n 基本事件总数 同时样本空间中的每一个基本事件可以 A, 若随机试验的结果为无限不可数并且每个结果岀现的可能性均匀, (9)几何概型 使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件 P(A) L(A)。其中L为几何度量(长度、面积、体积)。 L() P(A+B)=P(A)+P(B)-P(AB) 当 P(AB)= 0 时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当 B A 时,P(A-B)=P(A)-P(B) (11)减法公式 当 A=Q 时,P( B )=1- P(B) 定义设A、B是两个事件,且P(A)>0,则称P(AB)为事件A发生条件下,事件 B发生的条件概率,记为 P(A) (10)加法公式 P(B/A) P(AB)。 (12)条件概率 P(A) 条件概率是概率的一种,所有概率的性质都适合于条件概率。 例如 P(Q /B)=1 P(B /A)=1-P(B/A) 乘法公式:P(AB) P(A)P(B/A) (13)乘法公式 更一般地,对事件 A1, A2,…An,若P(AlA2…An-1)>0,则有 P( A1A2 ... An) P(A1) P(A2 | A1) P(A3 | A1 A2) P(An | A1 A2 ... An 1) (14)独立性 ①两个事件的独立性 设事件A、B满足P(AB) P(A)P(B),则称事件A、B是相互独立的。 若事件A、B相互独立,且P(A) P(B|A) P(AB) P(A)P(B) P(B) P(A) P(A) °,则有 若事件A、B相互独立,则可得到 A与B、A与B、A与B也都相互独立。 必然事件 和不可能事件?与任何事件都相互独立。 ?与任何事件都互斥。 ②多个事件的独立性 设ABC是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B) P(BC)=P(B)P(C) P(CA)=P(C)P(A) 并且同时满足 P(ABC)=P(A)P(B)P(C) 那么A、B、C相互独立。 对于n个事件类似。 设事件Bl,BN , Bn满足 1° Bi, B2, , Bn两两互不相容,P(Bi) °(i 12 , n), n (15)全概公式 A 2° i 1Bi , 则有 P(A) P(B1)P(A| B1) P(B2)P(A| B2) 设事件B1, B2,…,Bn及A满足 P(Bn)P(A| Bn)。 1 ° B1, B2,…,Bn两两互不相容,P(Bi)>o,i 1,2,…,n, n 2° A i1Bi,P(A) 0,则 P(Bi)P(A/Bi) P(Bi / A) (16)贝叶斯公式 j 1 i=1 2 …n i12nn ' 八———,=, , 。 P(Bj)P(A/Bj) 此公式即为贝叶斯公式。 P(Bi),( i 1,2,…,n),通常叫先验概率。P(Bi / A),( i 1,2,…,n),通常称为后 验概率。贝叶斯公式反映了 “因果”的概率规律,并作岀了“由果朔因”的推断。 我们作了 n次试验,且满足 每次试验只有两种可能结果, A发生或A不发生; n次试验是重复进行的,即 A发生的概率每次均一样; 每次试验是独立的,即每次试验 这种试验称为伯努利概型,或称为 A发生与否与其他次试验 A发生与否是互不影响的。 (17)伯努利概型 n重伯努利试验。 用P表示每次试验A发生的概率,则A发生的概率为1 P q,用Pn(k)表示n重伯努利试验中A 出现k(0 k n)次的概率, k/1 \\ k n k Pn(k) CnP q ,k 0,1,2, ,n。 第二章随机变量及其分布 (1)离散型 随机变量的 分布律 设离散型随机变量X的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=X)的概率为 P(X=x)=pk, k=1,2,…, 则称上式为离散型随机变量 X的概率分布或分布律。有时也用分布列的形式给出: X | xi, X2, P(X Xk) pi, p2, 显然分布律应满足下列条件: , xk, , pk,。 pk 1 (1) pk 0 , k ^2, , (2) 。 k 1(2)连续型 随机变量的 分布密度 设F(x)是随机变量X的分布函数,若存在非负函数 f(x),对任意实数x,有 F(x) X f(x)dx f则称X为连续型随机变量。 密度函数具有下面4个性质: 1° f(x) 0。 (X)称为X的概率密度函数或密度函数,简称概率密度。 f (x)dx 1 2° (3)离散与 连续型随机 变量的关系 似。 设X为随机变量,x是任意实数,则函数 。 P(X x) P(x X x dx) f (x)dx 积分元f(x)dx在连续型随机变量理论中所起的作用与 P(X xk) pk在离散型随机变量理论中所起的作用相类 (4)分布函 数 F(x) P(X x) 称为随机变量X的分布函数,本质上是一个累积函数。 P(a X b) F (b) F (a)可以得到X落入区间(a,b]的概率。分布函数F(X)表示随机变 量落入区间(-a, x]内的概率。 分布函数具有如下性质: 1° 0 F(x) 1, x ; 2° F (x)是单调不减的函数,即 x1 x2时,有F (x1) F (x2); 3° F ( ) Jim F(x) 0, F ( ) Jim F (x) 1; 5° P(X x) F (x) F (x 0)。 x 4° F (x 0) F (x),即 F (x)是右连续的; 对于离散型随机变量,F(x) pXk x k ; 对于连续型随机变量,F (x) f (x)dx o

(5)八大分 0-1分布 P(X=1)=p, P(X=0)=q 布 二项分布 在n重贝努里试验中,设事件 A发生的概率为 p。事件A发生的次数是随机变量,设为 X,则 X可能取值为0,1,2,, n。 P(X k) Pn(k) Cpqkkn k,其中 q 1 p,0 p 1,k 0,1,2, ,n, 则称随机变量 X服从参数为n, p的二项分布。记为 X〜B(n, p)。 当n 1时, P(X k) pqk1 k,k 0.1,这就是(o-1)分布,所以(0-1)分布 是二项分布的特例。 泊松分布 设随机变量X的分布律为 k P(X k) — e , k! 0,k 0,1,2 的泊松分布,记为 X ~ , 则称随机变量 X服从参数为 ()或者P()。 泊松分布为二项分布的极限分布(np=^, nTB)。 超几何分布 P(X k) CM?CNM k 0,1,2 ,1 CN ,1 min(M,n) 随机变量X服从参数为n,N,M的超几何分布,记为 H(n,N,M)。 几何分布 P(X k) qk 1 p, k 1,2,3,,其中 p>0,q=1-p。 A 随机变量X服从参数为p的几何分布,记为 G(p)。 均匀分布 f(x)------- ,即 设随机变量X的值只落在 [a,b]内,其密度函数在[a,b]上为常数 b a 1 f (x) b a 0 ,aw xw b 其他, 则称随机变量 X在[a,b]上服从均匀分布,记为 X~U(a,b)。 分布函数为 广 0, xb。 当aw X1VX2W b时,X落在区间(x1,x2)内的概率为 x2 x. P(x1 X x2)———1。 b a

指数分布

「 e

f(x) w

0,

其中 0,则称随机变量X服从参数为

X的分布函数为

的指数分布

1

F(x)'

记住积分公式:

0,

e

x

, x<0。

x

xe dx n!

n

x

0

正态分布 设随机变量X的密度函数为 1 — f(x) 其中 、 2J2 2 x , X , 0为常数,则称随机变量 X服从参数为 、 的正态分布或高斯(Gauss 分布,记为X ~ N(,)。 f(X)具有如下性质: 对称的; 1° f(x)的图形是关于X 2°当X 时,f( ) 2 1 _ 为最大值; V2 若x ~ N(,),则X的分布函数为 彳 F(x) 1 V2 0住)2 x ----------- 2^ e dt 2 o o 参数 、 1时的正态分布称为标准正态分布,记为 X~N(0,1),其密度函数记为 1 乂 2(x) VTe ,x, 分布函数为 1 X丄 (x)厂 e 2dt。 (x)是不可求积函数,其函数值,已编制成表可供查用。 1 ①()=1-①(X且 ①()=一。 2 2 X 如果 X~N(,),则 〜N(0,1)。 。 P(x1 X x2) (6)分位数 下分位表:P(X )=; )=。 已知布 上分位表:P(X (7)函数分 布 离散型 X的分亍列为 X P(X Xi) Y g(X) 的 Y P(Y y) X1, X2, P1, P2, i勺分布列(yi , Xn, , Pn,' g(xi )互不相等)如下: , g(xn), , Pn, g(X1), g(X2), P1, P2, 若有某些g() 0)相等,则应将对应的 Pj相加作为g (Xi)的概率。

连续型 先利用X的概率密度fxx)写出丫的分布函数Fv(y) = P(g(X)< y),再利用变上下限积分的求导公式求 出 %y)。

第三章二维随机变量及其分布 (1)联合分 离散型 布

如果二维随机向量 (X, Y)的所有可能取值为至多可列个有序对(x,y),则称 为离散型随机

设 =(X,Y)的所有可能取值为(Xi,yj)(i,j 1,2,),且事件{ =(Xi,yj)}的概率为

Pij,,称

P{(X,Y) (Xi,yj)} Pj(i,j 1,2,)

为 =(X,Y)的分布律或称为 X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:

y1 y2 ・・・ yj ・・・ X1 X2 pn P21 P12 P22 ・・・ P1j P2j ・・・ ・・・ ・・・ Xi Pi1 ・・・ Pij ・・・

这里Pij具有下面两个性质

(1) (2)

i j

Pij>0 (i,j=1,2,…);

Pj 1.

连续型 对于二维随机向量 (X,Y), 如果 存在非负函数 f(x,y)( x , y 使对任意一个其邻边分别平行于坐标 ), 轴的矩形区域 D,即 D={(X,Y)|a 0; f (x, y)dxdy 1. (X x,Y 机变量的本 质 y) (X x Y y) (3)联合分 布函数 设(X,Y)为二维随机变量,对于任意实数 x,y,二元函数 F(x, y) P{X x,Y y} 称为二维随机向量(X,Y)的分布函数,或称为随机变量 X和Y的联合分布函数。 分布函数是一个以全平面为其定义域,以事件 {( 1, 2)| X( 1) x, Y( 2) y}的概率为函 数值的一个实值函数。分布函数 (1) F(x,y)具有以下的基本性质: 0 F (x, y) 1; (2) F( x,y)分别对x和y是非减的,即 当 X2>xi 时,有 F(X2,y) > F(xi,y);当 y2>yi 时,有 F(x,y2) > F(x,yi); (3) F (x,y)分别对x和y是右连续的,即 F(x,y) F(x 0,y),F(x, y) F(x, y 0); (4) F(, )F( , y) F(x, ) X2,y1 y2, 0,F( 1 , ) (5)对于x1 F(X2, y2) Fg, yj (4)离散型 与连续型的 Fg y2)Fg, yj 0. P(X x,Y y) P(x X x dx,y Y y dy) f(x, y)dxdy

关系

(5)边缘分 布 离散型 X的边缘分布为 P? P(X xj j Pj(i,j 1,2,); Y的边缘分布为 P?j P(Y yj) i Pj(i, j 1,2,)。 连续型 X的边缘分布密度为 fx(x) Y的边缘分布密度为 f (x, y)dy; fY(y) (6)条件分 布 离散型 f (x, y)dx. 在已知X=Xi的条件下,Y取值的条件分布为 Pij P(Y yj |X xj 二; Pi? 在已知Y=yj的条件下,X取值的条件分布为 P(X Xi|Y yj)—, 连续型 Pij P?j 在已知Y=y的条件下,X的条件分布密度为 f(x|y) f(x,y); fY(y) 在已知X=x的条件下,Y的条件分布密度为 f(y|x)曽 fx(X) (7)独立性 一般型 离散型 F(X,Y)=F(x)FY(y) Pij Pi?P?j 有零不独立 连续型 f(x,y)=fX(x)fY(y) 直接判断,充要条件: ① 可分离变量 ② 正概率密度区间为矩形 1 x 1 2 (x 1)(y 2二维正态分布 2) y 2 2 2 1 2 2 f (x, y) 2 1 1 2(1 / ------ - e 201 2) 1 =0

随机变量的函 若Xi,X2,…Xm,Xm+1,…Xn相互独立,h,g为连续函数,则: h ( Xi, X2,…Xm)和 g ( Xm+1,…Xn)相互独立。 数 特例:若X与Y独立,则:h (X)和g (Y)独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 (9)二维正 态分布 设随机向量(X, Y)的分布密度函数为 2 2 1 x 1 1 2 (x 1)(y 1 2 2) y 2 2 f(x, y) 2 0, N ( 1 1 21 2(1 2) 2 6J1 其中1, 2, 1 2 0,| | 1是5个参数,则称(X, 2, 1 Y)服从二维正态分布, 记为(X, Y〜 , , 2 ,)・ 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即X〜N ( 1 , 12),Y~N( 2, ;)• 0 0 但是若X〜N ( (10)函数分 布 11 , ),丫 ~ N( 2, 2),(X,丫未必是二维正态分布。 Y z) Z=X+Y 根据定义计算:FZ(z) P(Z z) P(X 对于连续型,f^z)= f (xz, x)dx 1 2 1 2 2 2 )。 两个独立的正态分布的和仍为正态分布( , n个相互独立的正态分布的线性组合,仍服从正态分布。 2 i i i > 2 2 2 C・ i C 2 i i i 22 Z=max,min(Xi, 若X1,X2 Xn相互独立,其分布函数分别为 FX1 (x), Fx2 (x) FXn (x),则 Z=max,min(X1,X2,… X2,…Xn) Xn)的分布函数为: Fmax(x) Fx1(x)?Fx2(x) Fxn(x) 1 [1 卩沟仪)]?[1 FX2(X)] Fmin(x)

[1 Fxn(x)]

2分布 设n个随机变量X1,X2, ,Xn相互独立,且服从标准正态分布,可以证明它们的平方和 n W i 1 的分布密度为 “ n Xi 21 f(u) 2 y 2 0 , 2 2 U 2 e 2 2 n — 1 — u u 0, u 0. 我们称随机变量 W服从自由度为n的 分布,记为 W〜2(n),其中 n — 2 0 2 - i x2 e xdx. 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。 分布满足可加性:设 丫i k 2 (n),i 则 Z i 1 丫 ~ (ni n2 X ~ N(0,1),Y~ 2nQ. (n), 设X,Y是两个相互独立的随机变量,且 t分布 可以证明函数 T 二 丁丫 / n 的概率密度为 f(t) n 1 2 / 勺n n 1 n — 1 一 n t2 2 ' ( t ) 八 2 我们称随机变量T服从自由度为n的t分布,记为T〜t(n)。 t1 (n) t (n)

F分布 2(、 2(、 X / n〔 的概率密度函数为 设X ~ (n 1), Y ~ (n2),且X与丫独立,可以证明F Y/n 2ni n2 f(y) f(y2 n1 2 2 n2 丿 ni 2 号 y2 1 y n2 0,y 0 山 1n1 n2 ni n2 2 ,y 0 我们称随机变量F服从第一个自由度为 ni,第二个自由度为n2的F分布,记为F〜f(ni,n2). F (ni,n?)厂

第四章 随机变量的数字特征 XI F (n, nJ 2/ \\

(- > 随变的字征维机量期望 数特期望就是平均值 离散型 设X是离散型随机变量,其分布律为 连续型 P(X xk) 设X是连续型随机变量,其概率密度为 f(x), =Pk,k=1,2,…,n, n E(X) (要求绝对收敛) xf (x)dx E(X) (要求绝对收敛) 函数的期望 Y=g(X) n Xk Pk k 1 Y=g(X) E(Y) k 1 g(Xk)Pk E(Y) g(x)f (x)dx 方差 D(X)=E[X-E(X)2, 标准差 D(X) [Xk E(X)] Pk k 2 D(X) [x E(X)]2 f (x)dx (X) JD(X), 矩 ① 对于正整数k,称随机变量X的k次幂的数学期望 为X的k阶原点矩,记为v«即 ① 对于正整数k,称随机变量X的k次幂的数学期 望为X的k阶原点矩,记为v«即 V k=E(X)二 X:Pi , k=1,2,… i v k=E(刈=xkf(x)dx, k=1,2,… ② 对于正整数 k,称随机变量 X与E (X)差的k 次幂的数学期望为 X的k阶中心矩,记为 k,即 ② 对于正整数k,称随机变量X与E( X)差的k次幂 的数学期望为X的k阶中心矩,记为 k,即 k E(X E(X))k k k E(X E(X ))k =(Xi i E(X)) Pi , k=1,2,… =(x E(X)) f(x)dx, k=1,2,… k 切比雪夫不等式 设随机变量X具有数学期望E (X) =g,方差D ( X) 2 P(|X I ) 2 =b 2,则对于任意正数£,有下列切比雪夫不等式 率 切比雪夫不等式给出了在未知 X的分布的情况下,对概 P(|X 的一种估计,它在理论上有重要意义。 ) (2) 期望 的性 (1) (2) E(C)=C E(CX)=CE(X) n n CE(3) 质 (4) E(X+Y)=E(X)+E(Y)E( CiXi ) i 1 i 1 i(Xi) E(XY)=E(X) E(,充分条件:X 和 丫 独立; 充要条件:X和Y不相关。 (3) 方差 的性 质 (1) D(C)=0 E(C)=C (2) (3) (4) D(X)=E(X)-E2(X) (5) D(X± Y)=D(X)+D(Y)充分条件:X 和 丫独立; 充要条件:X和丫不相关。 D(X± Y)=D(X)+D(Y)± 2E[(X-E(X))(Y-E(Y))]无条件成立。 而 E(X+Y)=E(X)+E(Y)无条件成 D(aX)=^D(X); E(aX)=aE(X) D(aX+b)= aD(X); E(aX+b)=aE(X)+b 立。 期望 方差 (4) 常见 分布 的期 望和

0-1 分布 B(1, p) p 二项分布B(n, p) p(1 p) np np (1 p) 泊松分布P() 方差 几何分布G(p) 1 P 1 P ~2~ P 超几何分布 H(n, M, N) nM N ,M N n nM 1 N N N 1 均匀分布U (a,b) a b (b a)2 12 2 指数分布e() 1 21 2 2 正态分布N ( , ) n 2 分布 2n t分布 0 -------- (n>2) n n 2 (5) 期望 二维 n E(X) i 1 n Xi Pi? E(X) xfX (x)dx 随 机 变 量 E(Y) j 1 yj P?j E(Y) yfY(y)dy 的 数 字 特 函数的期望 E[G(X,Y)]= E[G(X,Y)]= 征 G(Xi, y j)Pj i j G(x, y) f (x, y)dxdy 方差 D(X) [Xi i D(X) E(X)]2pi? [x E(X)]2fx (x)dx D(Y) j [Xj E(Y)]2p?j D(Y) [y E(Y)]2fY(y)dy 协方差 对于随机变量X与Y ,称它们的 二阶混合中心矩11为 X与 Y的协方差或相关矩,记为 XY 或 cov(X, Y) ,即 XY 11 E[(X E(X ))(Y E(Y))]. XX 与 YY。 与记号 XY相对应, X与Y的方差D (X)与D (Y)也可分别记为

相关系数 对于随机变量X与丫,如果D(X)>0, D(Y)>0,则称 XY JD(X)JD(Y) XY (有时可简记为 为X与Y的相关系数,记作 )。 | | < 1,当 | |=1 时,称 X与丫完全相关:P(X aY b) 1 完全相关正相关,当负相关,当 时, 1时(a 0), 1(a 0)而当 0时,称X与Y不相关。 以下五个命题是等价的: ① XY 0 ; ② cov(X,Y)=0; ③ E(XY)=E(X)E(Y); ④ D(X+Y)=D(X)+D(Y); ⑤ D(X-Y)=D(X)+D(Y) 协方差矩阵 XX XY YX YY 混合矩 对于随机变量X与Y,如果有E(X kYl )存在,则称之为X与Y的k+l阶混合原点矩,记为 ki ; k+l阶 混合中心矩记为: uk E[(X E(X))k(Y E(Y))1]. (6) 协方 差的 性质 (7) 独立 (i) (ii) (iii) (iv) (i) cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(Xi+X2, Y)=cov(X,Y)+cov(X;Y); cov(X,Y)=E(XY)-E(X)E(Y). 若随机变量 X与Y相互独立,则 〜N ( 2 XY 0 ; ) 反之不真。 2(ii) 和不 若(X,Y) ' 1) 2? 1 ) 2 1 丿〉 相关 则X与Y相互独立的充要条件是 X和Y不相关。 第五章 大数定律和中心极限定理

( 1)大数定律 X

( 2)中心极限定理

2

X N(,)

n

切比雪 夫大数 定律

大数定

辛钦大 数定律

格定理

设随机变量 冶,X2,…相互独立,均具有有限方差,且被同一常数 C所界:D (Xi) 于任意的正数£,有

P

lim

Lx,丄

n n ° E(Xi)

n

i 1 i 1

1

特殊情形: 若 X1,

X2,

…具有相同的数学期望 E (X)=「

则上式成为

lim P

1 n

Xi

n

1

.

设卩是n次独立试验中事件 A发生的次数,p是事件A在每次试验中发生的概率,则对于任意

的正数£,有

lim

n

1.

伯努利大数定律说明,当试验次数 很大时,事件 A发生的频率与概率有较大判别的可能性很

小,即

lim

n

0.

这就以严格的数学形式描述了频率的稳定性。

设X1, X2,…,Xi,…是相互独立同分布的随机变量序列,且

E ( Xn) =g,则对于任意的正数£有

1 n

lim P X1n

n i i 1

.

设随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:

E(Xk)

,D(Xk)

0(k 1,2,

),则随机变量

n

Xk n

Yn

k 1

的分布函数Fn(x)对任意的实数X,

Xk

n

2X

t

lim F2

n

(x) lim

e dt.

n n

此定理也称为独立同分布的中心极限定理。

棣莫弗 设随机变量Xn为具有参数n, p(0常见统计量及

样本均值

其性质

1 X

n

Xi. n i 1

—2

1 /

n

—、2

样本方差

a S

. n 1 i 1

n

(v(X X).

样本标准差

S

1 J / i 1 \\ n 1

1

(x X)2 (XX)

-

样本k阶原点矩

Mk

1

n

X,k 1,2,

k i

n i 1

样本k阶中心矩

Mk

1

n

(X

i

X),k

k

2,3,.

n

1

2

E(X)

, D(X)

n

E(S)

22

*2

E(S )n

1

2

n

>

n

其中S*

2

1 n

(Xi

2

X),为二阶中心矩。

1

2

(2)正态总 体下的四大

正态分布

设 Xi, X2 ,

,x n为来自正态总体N(,

)的一个样本,则样本函数

分布

def X

u

设 Xi, X2 ,

_

N(0,1).

t分布

,X n为来自正态总体N(,

2

)的一个样本,则样本函数

def

X t

s.

1),

其中t(n-1)表示自由度为 n-1的t分布。

2

分布

设 Xi, X2 , ,xn为来自正态总体N(,

def

2

)的一个样本,则样本函数

2

2 ,

(n 1)S

2

w

其中

2

~ (n 1),

(n

2

1)表示自由度为n-1的 ,Xn为来自正态总体 )的一个样本,则样本函数

def

分布。

F分布

设 Xi, X2,

N( ,12)

的一个样本,而

丫1」2, ,Yn 为来自正态总体

N( , 1

S; / 21

F_^- 2 S; / 2

F(n〔 1,门2 1),

其中

Si

ni

2

1

n

i

— 2

‘1 i i (Xi X)

2 1

SS

2

A

n

2

(Yi ■y)2;

匕1 i 1 1的F分布。

F(m 1, n2 1)表示第一自由度为m

1,第二自由度为n2

(3)正态总

2

X与S独立。

体下分布的 性质

第七章参数估计

(1 )点

矩估计

设总体X的分布中包含有未知数

m,则其分布函数可以表成

F(X; 1, 2

m

).它的k阶原

, m)

估计

k

点矩 Vk E(X )(k 1,2, ,m)中也包含了未知参数

12

, , , m,即 vk vk( 1, 2,

又设X1 , X2 , , Xn为总体X的n个样本值,其样本的k阶原点矩为

k

n i 1

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有

V1 ( 1 , 2 ,

V2 ( 1 , 2 ,

Vm( 1,

2 ,

由上面的m个方程中,解出的m个未知参数(「2,

i

(k 1,2, ,m).

,m

)

n 1 n Xi ,

i 1 ,1 n 2

m)

Xi

n i 1

,1 n

m)

n 1i 1

, m)即为参数(1, 2, , m)的矩估计量。

若 为 的矩估计,g(x)为连续函数,则g( 3为g()的矩估计

极大似然 估计

当总体X为连续型随机变量时,设其分布密度为

f (X; 1 ,

2

m

),其中

数。又设X1 , X2 , , xn为总体的一个样本,称

n

L(

为样本的似然函数,简记为

当总体X为离型随机变量时,设其分布律为

f (Xi;

m

)

P{X

X} p(x;

m

),则称

(2 )估 计量的 评选标 准

无偏性

致性

L(X1,X2 ,

, Xn; 1, 2,

m

)

p( Xi;

m

)

为样本的似然函数。

若似然函数L(X1 ,X2, , Xn; 1,

2

m

)在1

m处取到最大值, 则称 1 ,

分别为

m的最大似然估计值,相应的统计量称为最大似然估计量。

In Ln

0,i 1,2, ,m

-H-*若 为 的极大似然估计,g(x)为单调函数,则g ( ?)为g()的极大似然估计。

(x1 , X2, , Xn )为未知参数

的估计量。若E ()=,则称 为 的无偏估计量。

E( X)=E( X), E(於)=D( X)

设1

1

(x1 , X,2 , , xn )和 2

2

(x1 , x,2 , , xn)是未知参数 的两个无偏估计量。若D ( 1 ) D ( 2),则称1比2有效。

设n是 的一串估计量,如果对于任意的正数 ,都有

lim P(| n |

) 0,

则称 n为的一致估计量(或相合估计量)。 若 为 的无偏估计,且D( ?)

0(n ),则 为 的一致估计。

只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。

2

(3 )区 间估计

置信区间 和置信度

设总体X含有一个待估的未知参数

。如果我们从样本x1, x,2 ,

2

,Xn岀发,找岀两个统计量

)

1

(X, x,, 11 2

, x)

n

与 2

(X1,X,2, , Xn)(

1 2

使得区

间[ 1

,

2

1

(0 1)的概率包含这个待估参数

,即

P{ 1

2

} 1

7

那么称区间[1,

2]为 的置信区间,1

2

为该区间的置信度(或置信水平) 。

2

单正态总

设 x1, x,2 , , Xn 为总体 X ~ N(

7

)的一个样本,在置信度为1

下, 我们来确定

的置信区

体的期望

和方差的

间[1, 2]。具体步骤如下: (i)选择样本函数;

区间估计

(ii)由置信度1

,查表找分位数;

(iii)导岀置信区间[1,

2]。

已知方差,估计均值 (i)选择样本函数

u

X

o /』

-N(0,1). n

(ii)查表找分位数

P

X

0 z

n

■—

1

(iii)导岀置信区间

X

0 _ 厂,

X

0 /~

J n

(i)选择样本函数

v n

未知方差,估计均值

X

t - SV」

(ii)查表找分位数

X

P

S/玄n

1 .

(iii)导岀置信区间

X

S -

_S J n

基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设 Ho是否成立。我们先假定 Ho是成立的。如果根据这个假定导致了一个不合理的事件发生,那就 表明原来的假定Ho是不正确的,我们拒绝接受 Ho;如果由此没有导出不合理的现象,则不能拒绝接受 Ho,我们称Ho是 相容的。与 Ho相对的假设称为备择假设,用 Hi表示。 这里所说的小概率事件就是事件 {K R },其概率就是检验水平a,通常我们取a 基本步骤 =,有时也取或。 假设检验的基本步骤如下: (i) 提出零假设Ho; 选择统计量K; 对于检验水平a查表找分位数入; 由样本值X2 , (ii) (iii) (iv) , Xn计算统计量之值K; (或K )时否定Ho,否则认为Ho相容。 Ho。这时,我们 将K两类错误 与 进行比较, 作出判断:当|K | 第一类错误 当Ho为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 把客观上Ho成立判为Ho为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或 第一类错误,记 为犯此类错误的概率,即 P否定 Ho|Ho 为真}=; 此处的a恰好为检验水平。 第二类错误 当Hi为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H。。这时,我们 把客观上Ho。不成立判为Ho成立(即接受了不真实的假设),称这种错误为“以假当真”的错误 或第二类错误,记 为犯此类错误的概率,即 P接受 Ho| Hi 为真}=。

人们当然希望犯两类错误的概率同时都很小。但是,当容量 两类错误的关系 相反地, 变小,则 变大。取定 n—定时, 变小,则 变大; 要想使 变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平aoa大小的选 取应根据实际情况而定。当我们宁可“以假为真” 女口,甚至。反之,则应把a取得大些。

、而不愿“以真当假”时,则应把a取得很小, 单正态总体均值和方差的假设检验 对应样本 条件 零假设 统计量 函数分布 否定域 H 0 : 已知2 0 |u| ui U /法 N(o,1) H :o 0 ou u1 u U1 1 — 2 H 0 : H o : 2 o o |t| t1 (n 1) 誌 t(n 1) t t1 (n 1) t t1 (n 1) w 2未知 H :0 0 TH o : o (n 1)或 2 Ho: 2 2 2 w 2未知 H : □ o・ 2 2 …(n 1)S2 W 2 o 1 — 2 (n 1) 2(n 1) w w o ; (n 1) 2H : 2 □ o・ 2 o (n 1)

因篇幅问题不能全部显示,请点此查看更多更全内容

Top