离散概率空间

基础部分

定义1 离散概率空间

离散概率空间(diskreter Wahrscheinlichkeitsraum)是单位元事件(Elementarereignis)的所有结果集合(Ergebnismenge) Ω={w1,w2,}

定义2 单位元事件

每个事件元素 wi 都对应一个可能性 Pr[wi] ,其中0Pr[wi]1, 并且

ωΩPr[ω]=1
#### 定义3 事件

集合 EΩ 是事件,该事件的概率是

Pr[E]:=ωEPr[ω]
事件 E¯ 是事件 E 的对立事件(komplementäres Ereignis)。两个事件A,B是分离的(disjunkt/unvereinbar)若 AB= .

定义4 相对频繁度(relative Häufigkeit)

 事件E相对频繁度:=E的绝对频繁度 所有观测次数= E的所有出现次数  所有观测次数 

定义5 无限概率空间

概率空间 Ω={ω1,,ωn} 是有限概率空间。关于无限概率空间,我们只考虑 Ω=N0 ,也就是离散的情况

例子

假设我们扔一个硬币,直到正面出现。p 是反面出现的概率,正面出现的概率是 q:=1p .那么概率空间我们可以表示为丢硬币的次数直到正面出现。

Ω=N={1,2,3,}
ωi=^ 仍硬币 i 次的事件元素。那么 Pr[ωi]=pi1q . 并且:
ωΩPr[ω]=i=1pi1q=qi=0pi=q1p=1
#### 数学公式补充

k=0n(1)kk!=1e

n=01n!=e

定理8 性质

对于事件 A,B,A1,A2, 有:

  • Pr[]=0,Pr[Ω]=1

  • 0Pr[A]1

  • Pr[A¯]=1Pr[A]

  • AB ,那么 Pr[A]Pr[B]

  • 加法原理:若事件 A1,,An 两两互斥,那么有

    Pr[i=1nAi]=i=1nPr[Ai]

定理9 容斥原理(Siebformel)

容斥原理:对于事件A1,,An

Pr[i=1nAi]=i=1nPr[Ai]1i1<i2nPr[Ai1Ai2]++(1)l11i1<<ilnPr[Ai1Ail]++(1)n1Pr[A1An]
容斥原理
Pr[A]=Pr[i=1nAi]=I[n](1)|I|+1Pr[iIAi]
推论
Pr[i=1nAi]i=1nPr[Ai]
Prinzip von Laplace:
Pr[E]=|E||Ω|

条件概率

对于条件概率 Pr[A|B] 有如下的性质

  • Pr[B|B]=1
  • Pr[A|Ω]=Pr[A]
  • 对于给定的 BPr[A|B] 正比于 Pr[AB]
定义12 条件概率

AB 是事件且 Pr[B]>0. 那么条件概率 Pr[A|B] 是如下定义的:

Pr[A|B]:=Pr[AB]Pr[B]
在事件 B 基础下的概率空间:
ωΩPr[ω|B]=ωΩPr[ωB]Pr[B]=ωBPr[ω]Pr[B]=Pr[B]Pr[B]=1Pr[|B]=0 sowie Pr[A¯|B]=1Pr[A|B]

定理16 乘法原理

若事件 A1,,An ,且 Pr[A1An]>0 ,那么

Pr[A1An]=Pr[A1]Pr[A2|A1]Pr[A3|A1A2]Pr[An|A1An1]

定理18 全概率公式

若事件 A1,,An ,两两互斥,且 BA1An 那么

Pr[B]=i=1nPr[B|Ai]Pr[Ai]
如果事件有无穷多个,那么:
Pr[B]=i=1Pr[B|Ai]Pr[Ai]

定理19 贝叶斯公式

事件 A1,,An 两两分离,且 Pr[Aj]>0 对于所有事件。 BA1An ,且 Pr[B]>0 ,那么

Pr[Ai|B]=Pr[AiB]Pr[B]=Pr[B|Ai]Pr[Ai]j=1nPr[B|Aj]Pr[Aj]
若事件有无穷多个,那么
Pr[Ai|B]=Pr[AiB]Pr[B]=Pr[B|Ai]Pr[Ai]j=1Pr[B|Aj]Pr[Aj]

独立性(独立性)

Pr[AB]=Pr[A]Pr[B] 也就是 若 Pr[A|B]=Pr[A] 那么,这两个事件是独立的(unabhängig)

对于两两不同的事件 A1,,An 独立,若对于所有的子集

I={i1,,ik}{1,,n}i1<i2<<ik

Pr[Ai1Aik]=Pr[Ai1]Pr[Aik]

定理 23

对于两两不同的事件 A1,,An 独立,若对于所有

(s1,,sn){0,1}n

Pr[A1s1Ansn]=Pr[A1s1]Pr[Ansn]
其中 Ai0=A¯iAi1=Ai

定理24

A,B,C 是独立事件,那么ABCABC 也独立

随机变量

定义25 随机变量

给定一个离散概率空间 Ω 一个映射

X:ΩR
是随机变量 (Zufallsvariable)

值域(Wertebereich)是

WX:=X(Ω)={xR;ωΩmitX(ω)=x}

扔硬币3次,结果集合是 Ω:={H,T}3 也就是正反的三元组。随机变量Y描述了出现正面的总数。 比如 Y(HTH)=2 出现正面2次, Y(HHH)=3 出现正面3次,值域 WY={0,1,2,3}

Ai:={ωΩ;X(ω)=xi}=X1(xi)

是逆映射,通常我们把 Pr[X1(xi)] 写作 Pr[X=xi]

定义27 概率密度函数和分布函数

  • 函数

fX:RxPr[X=x][0,1]

称作随机变量 X 的概率密度函数(Dichte)

  • 函数

FX:RxPr[Xx]=xWX:xxPr[X=x][0,1]

称作随机变量 X 的分布函数

求密度函数:从值域入手,把每个值都对应写出来。

求分布函数:先求密度函数,然后把密度函数累加

定义 29 期望

对于一个随机变量 X ,我们定义期望值(Erwartungswert) E[X] 为:

E[X]:=xWXxPr[X=x]=xWXxfX(x)
xWX|x|Pr[X=x] 收敛

计算期望

判断期望是否存在,要加绝对值算。

定理 32 期望的单调性

X,Y 是在离散概率空间 Ω 的随机变量,且满足 X(ω)Y(ω) 对于所有ωΩ, 那么 E[X]E[Y]

定理 33 期望的线性性

对于任意随机变量 X , a,bR

E[aX+b]=aE[X]+b

定理 34 期望计算公式

X 是随机变量且 WXN0 ,有

E[X]=i=1Pr[Xi]

定义 35 条件期望

X 是随机变量,且 A 是事件,且 Pr[A]>0 那么条件随机变量(bedingte Zufallsvariable)的密度是

fX|A(x):=Pr[X=x|A]=Pr[X=xA]Pr[A]
期望值是
E[X|A]=xWXxfX|A(x)

定理 36 条件期望计算期望

X 是随机变量,对于两两独立事件 A1,,An, 且 A1An=Ω 且 Pr[A1],,Pr[An]>0 ,有

E[X]=i=1nE[X|Ai]Pr[Ai]

定义 38 方差和标准差

对于随机变量 Xμ=E[X] ,我们定义(Varianz)方差 Var[X]

Var[X]:=E[(Xμ)2]=xWX(xμ)2Pr[X=x]
大小(Größe) σ:=Var[X]X 的标准差

定理 39 方差和期望

对于任意随机变量 X 有:

Var[X]=E[X2]E[X]2

定理 41 方差公式

对于任意随机变量 Xa,bR

Var[aX+b]=a2Var[X]

定义 42 矩

对于一个随机变量X 我们说 E[Xk] 是k-te Moment(k阶4矩) 且

E[(XE[X])k] 是 k-te zentrale Moment(k阶中心矩)

多变量

函数

fX,Y(x,y):=Pr[X=x,Y=y]
是随机变量 X,Y 的总密度(gemeinsame Dichte) ,其中
fX(x)=yWYfX,Y(x,y) bzw. fY(y)=xWXfX,Y(x,y)
函数 fXfY 是Randdichten

把其他变量的所有情况带入式子求和即可

随机变量的独立性

定义45 独立性

对随机变量 X1,,Xn 是相互独立的(unabhängig),若对于所有 (x1,,xn)WX1××WXn 满足:

Pr[X1=x1,,Xn=xn]=Pr[X1=x1]Pr[Xn=xn]
或者
fX1,,Xn(x1,,xn)=fX1(x1)fXn(xn)

定理46 独立性扩展1

X1,,Xn 是相互独立随机变量,且 S1,,Sn 是任意的集合 SiWXi,那么 ,,X1S1“, ...,,XnSn“ 都是独立的

定理47 独立性扩展2

f1,,fn 是实数函数 (fi:RR ,i=1,,n) . 当随机变量 X1,,Xn 相互独立,那么对于所有 f1(X1),,fn(Xn) 也相互独立。

组合随机变量

定理49 独立的随机变量加和

对于2个相互独立的随机变量 X,YZ:=X+Y ,那么满足

fZ(z)=xWXfX(x)fY(zx)

组合随机变量的矩

定理50 期望的线性性

对于随机变量 X1,,XnX:=a1X1++anXn , a1,,anR 满足

E[X]=a1E[X1]++anE[Xn]

Beispiel 51:

n个人随机到n 个床位,期望有多少个人在自己的床位上?

先拆解: Xi:={1 若第 i 个人正确 0 否则 

X:=X1++Xn

因为 E[Xi]=0Pr[Xi=0]+1Pr[Xi=1]=1n

所以 E[X]=i=1nE[Xi]=i=1n1n=1

定理52 期望的乘积性

对于相互独立的随机变量 X1,,Xn ,满足

E[X1Xn]=E[X1]E[Xn]

定义53 指示函数

对于一个事件 A ,随机变量

IA:={1 falls A eintritt 0 sonst 
是事件 A 的指示变量 Indikatorvariable

定理54 方差加和

对于相互独立的随机变量 X1,,XnX:=X1++Xn 满足:

Var[X]=Var[X1]++Var[Xn]

重要分布

伯努利分布

一个随机变量 XWX={0,1} 并且密度是

fX(x)={p für x=11p für x=0
是伯努利分布(Bernoulli-Verteilung)。参数 p 是成功概率(Erfolgswahrscheinlichkeit).

比如扔硬币是只有正或反,满足伯努利分布

二项分布

定义 55 二项分布

X:=X1++Xnn 个独立的伯努利分布随机变量的加和,并且他们有相同的成功概率 p. 那么X 就是二项分布,参数是 np. 符号是

XBin(n,p)

fX(x):=b(x;n,p)=(nx)px(1p)nx

E[X]=np ,Var[X]=npq

比如连续扔硬币n次,满足二项分布

定理 56 二项分布加和

XBin(nx,p)YBin(ny,p) 独立,那么满足 Z:=X+Y, 且 ZBin(nx+ny,p).

几何分布

定义57 几何分布

一个几何分布的(geometrisch verteilte) 随机变量 X ,参数 p(0,1]q:=1p 有密度函数

fX(i)=pqi1 für iN
对于它的期望和方差:
E[X]=1p und Var[X]=qp2

一个性质

成功概率和已经尝试的此数无关:

Pr[X>y+xX>x]=Pr[X>y]

比如一直扔硬币,知道正面出现。满足几何分布

求大于某个值的概率

Pr[X>x]=i=x+1(1p)i1p=(1p)xpi=0(1p)i=(1p)xp11(1p)=(1p)x

泊松分布

泊松分布(Poisson-Verteilung) 可以用于建模在给定时间段有固定变化率且独立的固定事件的个数。

一个泊松分布变量 X ,参数 λ0 有值域 WX=N0 并且有密度函数:

fX(i)=eλλii! für iN0
写作
XPo(λ)

而且方差和期望满足

E[X]=Var[X]=λ

定理59 泊松分布随机变量加和

XY 是独立的随机变量满足 XPo(λ)YPo(μ), 那么满足

Z:=X+YPo(λ+μ)

求解泊松分布常用到 ex 的幂级数展开式

ex=n=01n!xn=1+x+12!x2++1n!xn+,x(,+)

泊松分布与二项分布

n\infin 时,且 n 相对于 λ 足够大,二项分布与泊松分布近似

Po(λ)Bin(n,λ/n)

概率的估计

不等式

定理60 马尔可夫不等式

X 是随机变量,它只有非负值。那么对于所有 tRt>0 满足

Pr[Xt]E[X]t
或者:
Pr[XtE[X]]1/t

用于估计概率的上界 (Blatt6 H01)

定理 61 切比雪夫不等式

X 是随机变量, tRt>0 ,满足

Pr[|XE[X]|t]Var[X]t2
或者:
Pr[|XE[X]|tVar[X]]1/t2

用的时候可以用绝对值的性质拆开绝对值(Blatt6 H01), t=n/21

Pr[Xn/2]=Pr[XE[X]t]Pr[|XE[X]|t]

大数定律

定理 63 大数定律

给定一个随机变量, 若 ε,δ>0 是任意且固定的。那么对于所有 nVar[X]εδ2

X1,,Xn 独立随机变量且拥有和 X 相同的分布,且设

Z:=X1++Xnn
那么满足
Pr[|ZE[X]|δ]ε

切诺夫界

定理 64 切诺夫界 1

X1,,Xn 是独立的伯努利分布的随机变量,且Pr[Xi=1]=piPr[Xi=0]=1pi . 那么对于 X:=i=1nXi und μ:=E[X]=i=1npiδ>0 满足

Pr[X(1+δ)μ](eδ(1+δ)1+δ)μ

定理 66 切诺夫界 2

X1,,Xn 是独立的伯努利分布的随机变量,且Pr[Xi=1]=piPr[Xi=0]=1pi . 那么对于 X:=i=1nXi und μ:=E[X]=i=1npi0<δ<1 满足:

Pr[X(1δ)μ](eδ(1δ)1δ)μ

引理 67 切诺夫界扩展

对于 0<δ<1 满足

(1δ)1δeδ+δ2/2 und (1+δ)1+δeδ+δ2/3

推论 68 推论公式

X1,,Xn 是独立的伯努利分布的随机变量,且Pr[Xi=1]=piPr[Xi=0]=1pi . 那么对于 X:=i=1nXi und μ:=E[X]=i=1npi

  • Pr[X(1+δ)μ]eμδ2/3 für alle 0<δ1
  • Pr[X(1δ)μ]eμδ2/2 für alle 0<δ1
  • Pr[|Xμ|δμ]2eμδ2/3 für alle 0<δ1
  • Pr[X(1+δ)μ](e1+δ)(1+δ)μ
  • Pr[Xt]2t für t2eμ

概率生成函数

定义70 概率生成函数

对于一个随机变量 X , WXN0 那么概率生产函数 (wahrscheinlichkeits-)erzeugende Funktion为

GX(s):=k=0Pr[X=k]sk=E[sX]

定理71 函数的唯一性

一个随机变量X , WXN0 的密度和分布是通过它的生产函数唯一确定的.

伯努利分布

GX(s)=E[sX]=(1p)s0+ps1=1p+ps

均匀分布 {0,...,n}

X{0,..,n} 均匀分布,也就是对于 0knPr[X=k]=1/(n+1)

GX(s)=E[sX]=k=0n1n+1sk=sn+11(n+1)(s1)

二项分布

GX(s)=E[sX]=k=0n(nk)pk(1p)nksk=(1p+ps)n

几何分布

GX(s)=E[sX]=k=1p(1p)k1sk=psk=1((1p)s)k1=ps1(1p)s

泊松分布

GX(s)=E[sX]=k=0eλλkk!sk=eλ+λs=eλ(s1)

计算期望方差

GX(1)=k=1kPr[X=k]=E[X]

Var[X]=E[X2]E[X]2=E[X(X1)+X]E[X]2=GX(1)+GX(1)(GX(1))2

定义74 秩生成函数

对于一个随机变量 X ,秩生成函数 momenterzeugende Funktion 是

MX(s):=E[eXs]

MX(s)=GX(es)

随机变量加和

定理75 和的生成函数

对于独立随机变量 X1,,XnZ:=X1++Xn,那么满足

GZ(s)=GX1(s)GXn(s)
而且
MZ(s)=MX1(s)MXn(s)

随机和

我们考虑这样的情况: Z:=X1++XNN 是一个随机变量.

定理77 和的生成函数

X1,X2, 是独立,而且具有相同分布随机变量,生成函数是 GX(s) . N 是一个独立随机变量且有生成函数 GN(s). 那么随机变量 Z:=X1++XN有随机生成函数 GZ(s)=GN(GX(s)).

连续概率空间

连续随机变量

定义79 连续随机变量

一个连续的随机变量 X (kontinuierliche oder auch stetige Zufallsvariable )和它在的连续概率空间(kontinuierlicher (reeller) Wahrscheinlichkeitsraum)是由一个积分函数定义的 fX:RR0+ :

+fX(x)dx=1
可以通过对可数且分离的区间并集 A=kIk 构造出的集合 AR 叫事件(Ereignis). A 的概率是这样算的:
Pr[A]=AfX(x)dx=kIkfX(x)dx

根据性质计算参数 (Blatt7 T02)

Kolmogorov-Axiome和σ-代数

定义82 σ-代数

Ω 是个集合。AP(Ω) 是在集合Ω 上的 σ -代数(Algebra), 若下面的性质满足:

  • ΩA
  • AA, 那么 A¯A
  • 对于 nNAnA. 那么 n=1AnA

对于所有 AR 是一种 Borel集合.

判断集合是否是 σ-代数 (Blatt7 T01)

定义83 柯尔莫哥洛夫公理Kolmogorov-Axiome

Ω 是个集合。A 是是在集合Ω 上的 σ -代数. 映射

Pr[.]:A[0,1]
A 上的概率测度(Wahrscheinlichkeitsmaß) ,若满足:

  • Pr[Ω]=1

  • A1,A2, 是两两互斥的事件. 那么满足:

    Pr[i=1Ai]=i=1Pr[Ai]

对于一个事件 AA, Pr[A]A 的概率(Wahrscheinlichkeit). 一个概率空间是由元组 (Ω,A,Pr) 定义的.

引理84

(Ω,A,Pr) 是一个概率空间。对于事件 A,B,A1,A2, 满足:

  • Pr[]=0,Pr[Ω]=1

  • 0Pr[A]1

  • Pr[A¯]=1Pr[A]

  • AB,Pr[A]Pr[B]

  • (加法原理) 当事件 A1,,An 两两互斥,那么

    Pr[i=1nAi]=i=1nPr[Ai]

勒贝格积分

一个函数 f:RR 是可测量的(messbar). 若每个Borel波莱尔集合的原像(Urbild)还是一个Borel集合,

每个可测量的函数都可以积分,叫做勒贝格积分(Lebesgue-Integral).

  • 连续函数都是Borel波莱尔可测的(Borel-messbar)
  • 指示函数 IA:x{1 falls xA0 sonst  是Borel可测的
  • Borel可测的函数与Borel可测函数的和和积也是Borel可测的

判断一个函数是否是Borel可测 (Blatt7 T02)

计算连续随机变量

连续随机变量函数

Y:=g(X)g:RR . 那么 Y 的分布是

FY(y)=Pr[Yy]=Pr[g(X)y]=CfX(t)dt
这里 C:={tRg(t)y} 是所有实数满足 "Yy" 的.

求密度函数:先求分布再求导

求一个函数是否是分布函数:

  1. 非严格单调增
  2. 连续
  3. 在负无穷的极限是0,正无穷的极限是1

连续随机变量极限

X 是一个连续随机变量,我们可以从 X 里构造一个离散的随机变量。设 δ>0 ,那么

Xδ=nδX[nδ,(n+1)δ[ für nZ
对于 X 满足
Pr[Xδ=nδ]=FX((n+1)δ)FX(nδ)

期望和方差

定义88 期望和方差

对于一个连续随机变量 X ,方差如下定义:

E[X]=tfX(t)dt
只要 |t|fX(t)dt 是有限的.

对于方差是

Var[X]=E[(XE[X])2]=(tE[X])2fX(t)dt
E[(XE[X])2] 存在.

引理89 计算期望

X 是连续随机变量, 令

Y:=g(X)
那么
E[Y]=g(t)fX(t)dt

使用公式计算期望和方差 (Blatt07 T02)

重要连续分布

均匀分布

f(x)={1ba für x[a,b]0 sonst. F(x)=xf(t)dt={0 für x<axaba für axb1 für x>bE[X]=a+b2 und Var[X]=(ab)212

正态分布

定义 91 正态分布

f(x)=12πσexp((xμ)22σ2)=:φ(x;μ,σ)

记为 XN(μ,σ2)

分布函数

F(x)=12πσxexp((tμ)22σ2)dt=:Φ(x;μ,σ)
μ=0,σ=1 也叫标准正态分布,标准正态分布的分布函数也叫高斯Φ-函数。(一般可以查表看值)

高斯函数的性质

对于 x\R 满足

Φ(x)=1Φ(x)

引理 92 定义

I:=ex2/2dx=2π

定理 93 正态分布的线性变换

X 是一个正态分布的随机变量XN(μ,σ2). 那么对于任意的 aR{0}bR. Y=aX+b 也是正态分布YN(aμ+b,a2σ2)

定理 94 N(0,1) 期望方差

XN(0,1) 分布,那么

E[X]=0 und Var[X]=1

定理 95 N 期望方差

X 满足 N(μ,σ2) 分布, 那么

E[X]=μ und Var[X]=σ2

秩生成函数

YN(μ,σ2) 是正态分布

MY(t)=etμ+(tσ)2/2

指数分布

定义 96

一个随机变量 X 是以 λ>0 的指数分布. 若满足密度函数

f(x)={λeλx falls x00 sonst 
分布函数为
F(x)=0xλeλtdt=[eλt]0x=1eλx

[X]=, [X]=

定理 97 指数随机变量的缩放

一个随机变量 X 是以 λ>0 的指数分布. 对于 a>0 的随机变量 Y:=aX 也是一个指数分布的随机变量, 参数 λ/a.

定理 98 无思想性

一个连续随机变量 X 是指数的,当且仅当对于所有 x,y>0 满足

Pr[X>x+yX>y]=Pr[X>x]

指数分布与几何分布的极限

设一个几何分布的序列 Xn , 参数为 pn=λ/n . 当 n\infin 时, 可以用 Yn=1nXn , 是参数为 λ 的指数分布来逼近。

多个连续随机变量

多元密度函数

两个连续随机变量 X,Y 可以这样表示 fX,Y:R2R0+

fX,Y(x,y)dxdy=1
对于事件 A :
Pr[A]=AfX,Y(x,y)dxdy

定义 100 边缘分布Randverteilung

fX,Y 是随机变量X,Y 的密度函数. 那么 边缘分布Randverteilung 是

FX(x)=Pr[Xx]=x[fX,Y(u,v)dv]du
类似的
fX(x)=fX,Y(x,v)dv
X 的边缘密度函数Randdichte

定义 101 独立性

两个连续随机变量 X,Y 是独立的,若对于所有 x,yR 满足

Pr[Xx,Yy]=Pr[Xx]Pr[Yy]
类似的也有
FX,Y(x,y)=FX(x)FY(y)

fX,Y(x,y)=fX(x)fY(y)

多个事件的等待问题

定理 102 指数分布最小值

随机变量 X1,,Xn 是独立的且是以参数 λ1,,λn 指数分布. 那么 X:=min{X1,,Xn} 也是指数分布,以参数 λ1++λn.

泊松过程

对于给定 t>0, Ti 是独立的相同的指数分布的随机变量,每个参数为 λ

X(t):=max{nNT1++Tnt}
X(t) 是泊松分布的随机变量,参数为 tλ

定理 105 随机变量加和

X,Y 是独立的连续随机变量,对于 Z:=X+Y 满足

fZ(z)=fX(x)fY(zx)dx

定理 106 正太分布的加和

随机变量 X1,,Xn 是独立的且是以参数 μi,σi(1in) 正态分布. 那么

Z:=a1X1++anXn
也是正态分布,期望值为 μ=a1μ1++anμn 方差为 σ2=a12σ12++an2σn2

连续变量秩生成函数

连续随机变量和离散随机变量有相同的秩生成函数

MX(s)=E[eXs]

中心极限定理

定理108 中心极限值定理

随机变量 X1,,Xn 有相同的分布且都互独立. 且期望和方差都存在并且记为 μσ2.

随机变量 Yn 定义为 Yn:=X1++Xn . 那么

Zn:=Ynnμσn
是渐进的标准正太分布,也即是 ZnN(0,1) 对于 n

定理 109 de Moivre 棣莫弗—拉普拉斯定理

随机变量 X1,,Xn 是伯努利分布且都互独立,有相同的成功概率 p .那么

Hn:=X1++Xn

对于 n1 , 分布函数为

Hn:=Hnnpnp(1p)

n\infin 时, Hn 是渐进标准正态分布

定理 110 正太分布对于二项分布的极值

若 $H_{n} (n, p) .H_{n} / n$ 趋近于 N(p,p(1p)/n) 对于 n.

数理统计

定义 112 估计量

给定一个随机变量 X 密度函数 f(x;θ). 一个估计量(Schätzvariable,Schätzer)是参数 θ . 一个估计量U 是一个无偏估计(erwartungstreu)若

E[U]=θ
E[Uθ] 称作估计变量 U 的偏差(Bias).

定义 113 均方误差MSE

若估计变量 AB 有一个小MSE. 那么 A 就是比B 有效率 effizienter.

MSE:=E[(Uθ)2]

一个估计变量是在平方中部常数的. 若当nMSE0 .

MSE=Var[X¯]=Var[1ni=1nXi]=1n2i=1nVar[Xi]=1nVar[X]

定义 114 Stichprobenmittel 和 Stichprobenvarianz

样本均值和样本方差

X¯:=1ni=1nXi und S2:=1n1i=1n(XiX¯)2

最大似然估计

似然估计函数

L(x;θ):=i=1nf(xi;θ)

定义 115 最大似然估计值

估计值 θ^ 是对于分布 f(x;θ) 的参数的最大似然估计值

L(x;θ)L(x;θ^)

置信区间(Kondenzintervall)

我们要找2个估计量 U1,U2,使得.

Pr[U1θU2]1α
其中 1α 是Kondenzniveau置信水平.

X¯N(μ,σ2n) 得出

Z:=nX¯μσ
是标准正态分布. 然后变换成下面的式子
Pr[cZc]=Φ(c)Φ(c)=!1α
再根据查表和题目条件即可解题

定义 118 分位数

X 是随机变量,分布为 FX . 数 xγ 使得

FX(xγ)=γ
Xγ -Quantil

定义 119 正态分布的分位数

对于正态分布 zγ 是它的 γ -Quantil . 我们可以用这个来求置信区间

K=[X¯z(1α2)σn,X¯+z(1α2)σn]

假设检验

检验的定义

K:={xRn;x führt zurAblehnung der Hypothese }

K 是拒绝域.

K~R 是检验集合 T 中拒绝域中的检验,

H0 是我们要检验的假设Nullhypothese. H1 是另一个假设 Alternative.

检验的错误

1类错误

H0 满足却被拒绝了

 Fehlerwahrscheinlichkeit 1. Art =maxpH0Prp[TK]=maxpH0Prp[Tk]
计算是在H0 的概率里把所有在拒绝域的数量加起来

2类错误

H0 不满足却被接受了

 Fehlerwahrscheinlichkeit 2. Art =suppH1Prp[TK]=suppH1Prp[T>k]
计算就是把在接受区间里的 H1 的概率加起来

1类错误的数量用 α 来表示. 也叫显著性差异Signifikanzniveau.

二项检验

若是伯努利分布的随机变量,测试某个概率的大小

H0:pp0,H1:p<p0
然后构造测试量, 用正态分布逼近
T:=X1++Xn,T~:=Tnpnp(1p)

Z<zαZz1α

根据具体情况选择拒绝域的公式

高斯检验

Xi 服从正态分布

假设

  1. H0:μ=μ0 gegen H1:μμ0,
  2. H0:μμ0 gegen H1:μ<μ0,
  3. H0:μμ0 gegen H1:μ>μ0.

检验量

Z:=X¯μ0σn
判断拒绝

  1. |Z|>z1α/2,
  2. Z<zα
  3. Z>z1α.

2次t-检验

XiYi 是独立且服从正态分布的随机变量

假设:

  1. H0:μX=μYH1:μXμY,
  2. H0:μXμYH1:μX<μY
  3. H0:μXμYH1:μX>μY.

检验量

T:=n+m21m+1nX¯Y¯(m1)SX2+(n1)SY2
判断拒绝

  1. |T|>tm+n2,1α/2,
  2. T<tm+n2,α,
  3. T>tm+n2,1α.

卡方检验

χ2 -Anpassungstest是卡方检验

若: X1,...Xn 是独立且相同的随机变量 WXi=1,..,k 时可以使用

假设:

H0:Pr[X=i]=pi i=1,,k,H1:Pr[X=i]pi 至少存在 i{1,,k},
检验量:
T=i=1k(hinpi)2npi
判断拒绝
T>χk1,1α2

随机过程

离散时间处理

定义 123

一个在状态集合 S={0,,n1} 有限的马尔科夫链(Markov-Kette) 由一个无限的随机变量序列 (Xt)tN0 组成. 它的值域是 S, 开始分布Startverteilung 是 q0mitq0TRn . q0 的元素都是非负的且加和为1. 对于下标集合 I{0,,t1} 和任意状态 i,j,sk(kI) . 满足:

Pr[Xt+1=jXt=i,kI:Xk=sk]=Pr[Xt+1=jXt=i]
并且
pij:=Pr[Xt+1=jXt=i]

P=(pij)0i,j<n 是转移矩阵,例子

image-20200802214131922

pi,j(n) 是从ijn 步走到的概率

定义 126 步数

随机变量

Tij:=min{n0Xn=j, wenn X0=i}
i 走到 j 的步数. hij:=E[Tij] 是期望.
fij:=Pr[Tij<]
是从 i 走到 j 的概率.

定义 127 到自己的步数

Ti:=min{n1Xn=i, wenn X0=i}

是从 i 开始又走回来的步数. 同理

fi:=Pr[Ti<]
是走回来的概率

定理 129 状态转移方程

hij=1+kjpikhkj für alle i,jS,ijhj=1+kjpjkhkj

fij=pij+kjpikfkj für alle i,jS,ijfj=pjj+kjpjkfkj

定义 132 stationäre Verteilung稳定分布

这个分布满足

π=πP
同时 π 中加和是1 .

定理 134 irreduzibel不可简化的

一个马尔科夫链是不可简化的,若对于所有状态对 i,jS 存在 nN 使得 pij(n)>0.

也就是走几步一定可以到

定理 136 irreduzibel定理

一个不可简化的有限马尔科夫链只有1个稳定分布stationäre Verteilung, 并且满足 πj=1/hjj für alle jS

定义 137 Periode周期

一个状态 j 的 Periode 是最大的数 ξN , 使得

{nN0pjj(n)>0}{iξiN0}
一个状态的 ξ=1 就是非周期性aperiodisch的. 若所有状态是非周期性的aperiodisch,那么这个马尔科夫链是非周期性aperiodisch的

定理138 aperiodisch非周期性

一个状态 iS 是非周期性的aperiodisch, 当且仅当存在 n0N 使得对于所有 nN,nn0pii(n)>0 成立

定义 140 ergodisch可遍历的

不可简化的Irreduzibel 和非周期性 aperiodisch 的马尔科夫链是可遍历的ergodisch

定理 141 Fundamentalsatz für ergodische Markov-Ketten可遍历的马尔可夫链基本定理

对于所有有限的可遍历的ergodisch的马尔科夫链 (Xt)tN0 满足

limnqn=π
其中 π 是唯一的stationäre Verteilung.