Chapter5 分支过程
分支过程模型¶
分支过程描述的是一个系统中个体繁殖、消亡或分裂的随机演化过程,其常用于研究种群动态、传染病传播等领域,其核心假设如下:
- 每个个体独立地按照相同的概率分布产生后代
- 后代数量通常由一个随机变量(称之为后代分布)决定
下面我们简要介绍一下分支过程的模型:
我们设 \(\xi\) 是取值非负整数的随机变量,\(p(\xi = k)=p_k,k=0,1,\cdots\),这里 \(p_0<1\) (否则这个分支过程就过于平凡了),而第 \(k\) 代个体数我们记为 \(Z_k\),\(Z_0\) 是初始个体数(通常我们设为1,但是也可以为任意正整数)第一代个体数 \(Z_1\) 与 \(\xi\) 同分布,\(Z_1\) 个个体独立繁衍,方式和祖先一致,我们用 \(\xi_{1,j}\) 表示第1代第j个个体的后代数,则 \(\left\{\xi_1,j:j=1,2,\cdots\right\}\) 独立同分布,与 \(\xi\) 同分布,且与 \(Z_1\) 独立,第二代个体数为
令 \(Z_n\) 为第 \(n\) 代个体总数,用 \(\xi_{n,j}\) 表示第 \(n\) 代第 \(j\) 个个体的后代数,则 \(\left\{\xi_{n,j:1,2,\cdots}\right\}\) 独立同分布,与 \(\xi\) 同分布,且与 \((Z_1,\cdots,Z_n)\) 独立,第 \(n+1\) 代个体数为
所以若 \(\left\{Z_n;n\geq 0\right\}\) 是时齐的 Markov 链,状态空间为 \(\left\{0,1,\cdots\right\}\),则有
其中 \(\xi_1,\xi_2,\cdots\) 独立同分布且与 \(\xi\) 分布相同
Tip
其证明如下:
这是因为 \((\xi_{n,1}, \cdots, \xi_{n,i})\) 与 \((Z_0, \cdots, Z_n)\) 是相互独立的。
下面我们来看一些分支过程的例子:
1. 设 \(P(\xi = 1) = p\), \(P(\xi = 0) = 1 - p\),,\(0 < p < 1\),则 \(P(Z_n = 1) = p^n\),, \(P(Z_n = 0) = 1 - p^n\)
2. 设 \(\xi \sim B(n, p)\),则在 \(Z_n = i\) 条件下, \(Z_{n+1} = \sum_{l=1}^{i} \xi_{n,l} \sim B(ni, p)\),所以
Tip
用到了二项分布的可加性
3. 设\(\xi \sim \pi(\lambda)\),则在\(Z_n = i\)条件下,\(Z_{n+1} = \sum_{l=1}^{i} \xi_{n,l} \sim \pi(i\lambda)\)$,所以
4. 设 \(P(\xi = k) = (1 - p)^k p, k = 0, 1, \cdots\) 则
Tip
这个几何分布的情形可以这么理解,\(i\) 表示第 \(n\) 代的个体数,后代数 \(\xi_{n,l}\) 服从参数为 \(p\)的 几何分布,即以概率 \(p\) 停止繁殖,每次失败产生一个后代(概率为 \(1-p\) ),系数 \(C_{i-1}^{i+j-1}\) 表示将 \(j\) 个失败(后代)分配到 \(i\) 个成功(个体)的不同方式,等价于“在 \(i\) 个箱子中放入 \(j\) 个球”的组合数
5. 设\(p_0 = 0.2, p_1 = 0.3, p_2 = 0.2, p_3 = 0.2, p_4 = 0.1\),则有
下面我们考虑一下已知随机变量 \(\xi\) 的数字特征的时候, \(Z_n\) 的数字特征
设 \(E\xi=\mu,Var\xi=\sigma^2\),那么对于 \(n\geq 1\),则可以得到:
- \(E(Z_n)=\mu^n\)
- \(VarZ_n = \sigma^2\mu^{n-1}(1+\mu+\mu^2+\cdots+\mu^{n-1})\)
其证明如下:
显然 \(E(Z_1)=E\xi=\mu\),我们不妨使用数学归纳法进行证明,假设 \(E(Z_k)=\mu^k\),则 $$ E(Z_{k+1})=E(\sum_{j=1}^{Z_k}\xi_{k,j})=E[E(\sum_{j=1}^{Z_k}\xi_{k,j}|Z_k)]=E(Z_k\mu)=\mu\mu^{k}=\mu^{k+1} $$ 这里我们用到了全期望公式
对于 \(VarZ_n\),显然有 \(VaZ_1=Var\xi=\sigma^2\) 符合,下面我们也使用数学归纳法进行证明
设 \(VarZ_{k}=\sigma^2\mu^{k-1}(1+\mu+\mu^2+\cdots+\mu^{k-1})\),则对于 \(VarZ_{k+1}\),有
其中\(E((\sum_{j=1}^m\xi_{k,j})^2|Z_k=m)=E[(\sum_{j=1}^{m}\xi_{k,j})^2]=Var(\sum_{j=1}^m\xi_{k,j})+(E\sum_{j=1}^m\xi_{k,j})^2=m\sigma^2+m^2\mu^2\),故有
$$
E(Z_{k+1}^2)=E[(\sum_{j=1}^{Z_k}\xi_{k,j})^2]=Z_k\sigma^2+Z_k^2\mu^2
$$
所以
故上述结论对所有 \(n\geq1\) 均成立
Tip
- 当 \(\mu>1\) 时,平均人数几何级数增长
- 当 \(\mu=1\) 时,平均人数恒为1
- 当 \(\mu<1\) 时,平均人数几何级数递减
一般来说,\(Z_n\) 的分布律一般很难算,下面我们引入灭绝概率和 \(Z_n\) 的生成函数,用生成函数来简化 \(Z_n\) 分布律的计算
灭绝概率¶
对于分支过程来说,我们着重关注灭绝概率,也即数量变为0的概率。
灭绝概率是整个种族最终后代数为零的概率,我们设每个个体产生后代的概率分布为 \(p_k\)(产生 \(k\) 个后代的概率),则灭绝概率 \(q\)(灭绝概率 \(q\) 是所有可能情况的期望,产生 \(k\) 个后代的概率是 \(P_k\),在产生 \(k\) 个后代的情况下,种群灭绝的概率是 \(q^k\))满足以下方程: $$ q=\sum_{k=0}^{\infty}p_kq^k $$ 其中 \(q\) 是灭绝概率,解这个方程就可以得到灭绝概率,而我们惊人地发现 \(\sum_{k=0}^{\infty}p^kq^k\) 其实与生成函数非常地相像,所以在引入灭绝概率之前,我们再回顾一下生成函数的知识。
Tip
生成函数可以参考Chapter3 泊松过程的笔记
分支过程的生成函数¶
我们令 \(Z_n\) 的生成函数为 \(\phi_n(x)=E(x^{Z_n})\),它有一个很有趣的性质,我们记 \(\phi(x)=E(x^{\xi})\)(后代分布的生成函数),则在 \(Z_0=1\) 的假设下,有 \(\phi_0(x)=E(x^{Z_0})=x,\ \phi_1(x)=E(x^{Z_1})=\phi(x)\),而对于 \(n\geq1\),有 $$ \phi_{n+1}(x)=\phi_n(\phi(x))=\phi(\phi_n(x))=\cdots $$ 也即生成函数满足一个递归关系:第 \(n+1\) 代的生成函数可以通过第 \(n\) 代的生成函数和后代分布的生成函数 \(\phi(x)\) 来迭代,可以用数学归纳法进行证明:
\(\phi_0(x)=E(x^{Z_0})=E(s^1)=s\) 显然成立,\(\phi_1(x)=E(x^{Z_1})=E(x^\xi)=\phi(x)\),对 \(n\geq1\) 有
而有了 \(Z_n\) 的生成函数,我们也能够通过生成函数去考虑 \(Z_n\) 的期望和方差,可以自己推导一下,也是满足我们前面提到过的性质的,推导如下:
Tip
要是这里忘记补了记得提醒我
下面我们来看一些例子,如何计算 \(Z_n\) 的分布律
例 设 \(P(\xi = k)=\frac{1}{2^{k+1}},k=0,1,\cdots\),对 \(n\geq 1\),计算
- \(\phi_n(x)\)
- \(Z_n\) 的分布律
解 (1) 我们知道 \(\phi_n(x)\) 就等于 \(n\) 个 \(\phi(x)\) 的复合,所以我们不妨先计算 \(\phi(x)\),有 $$ \phi(x)=E(x^{\xi})=\sum_{k=0}^{\infty}x^k\frac{1}{2^{k+1}}=\frac{1}{2}\sum_{k=0}^{\infty}(\frac{x}{2})^k=\frac{1}{2}\times\frac{1}{1-\frac{x}{2}}=\frac{1}{2-x} $$ 所以有 \(\phi_1(x)=\frac{1}{2-x},\phi_2(x)=\phi(\phi_1(x))=\frac{1}{2-\phi_1(x)}=\frac{1}{2-\frac{1}{2-x}}=\frac{2-x}{3-2x}\)
不妨用数学归纳法,假设 \(\phi_n(x)=\frac{n-(n-1)x}{n+1-nx}\),则有 $$ \phi_{n+1}(x)=\phi(\phi_n(x))=\frac{1}{2-\phi_n(x)}=\frac{1}{2-\frac{n-(n-1)x}{n+1-nx}}=\frac{(n+1)-nx}{(n+2)-(n+1)x} $$ 故结论成立
(2) 我们用 Markov 链的方法来计算其实是比较困难的,现在我们已经计算出 \(Z_n\) 的生成函数,就可以使用分布函数来计算 \(Z_n\) 的分布律,
最后可以得到 $$ P(Z_n=0)=\frac{n}{n+1},\qquad P(Z_n=k)=\frac{n^{k-1}}{(n+1)^{k+1}},k \geq 1 $$
灭绝概率¶
设 \(0<p_0<1\),令 \(\alpha_n=P(Z_n=0)\),由于 \(0\) 是吸收态,所以有 \(\alpha_n\) 单调递增,这是因为 \(Z_n=0\Rightarrow Z_{n+1}=0\),我们令 $$ \tau:=\lim_{n\to \infty}P(Z_n=0),则有\tau=P(Z_n=0 \qquad for \ some \ n) $$ 那么我们的问题是,灭绝概率 \(\tau\) 是多少?
灭绝概率有以下理论:
- 灭绝概率 \(\tau\) 是方程 \(x=\phi(x)\) 的最小正解
- \(\tau = 1\) 当且仅当 \(\mu \leq 1\)
证明先不写在下面了,等有了时间再补,大概是4-22课程的末尾和4-29课程的最开始的部分
下面我们来看一些分支过程的例子:
例 设 \(P(\xi=k)=\frac{1}{2^{k+1}},k=0,1,\cdots\),则 \(\phi(x)=\frac{1}{2-x},\mu=\phi'(1)=1\),因此有 \(\tau=1\),又我们已经算得 \(\alpha_n=P(Z_n=0)=\frac{n}{n+1}\),我们记 \(T_0=\min\left\{n\geq1:Z_n=0\right\}\) 为首次灭绝的时刻,我们希望求得 \(T_0\) 的分布律,也即求 \(P(T_0)=n\) 的值 $$ P(T_0=n)=P(Z_n=0,Z_{n-1}\neq 0)=P(Z_n=0)-P(Z_{n-1}= 0)=\frac{n}{n+1}-\frac{n-1}{n}=\frac{1}{n(n+1)} $$ 例 设 \(P(\xi=k)=(1-p)^kp,k=0,1,\cdots\),则 \(\phi(x)=\frac{p}{1-(1-p)x},\mu=\phi'(1)=\frac{1-p}{p}\)
考虑灭绝概率 \(\tau\),我们知道灭绝概率 \(\tau\) 是方程 \(\phi(x)=x\) 的最小正解,也即有 $$ (1-p)x^2-x+p=0 \iff(x-1)((1-p)x-p)=0 $$ 所以有当 \(p\geq \frac{1}{2}\) 时有 \(\tau = 1\),当 \(p<\frac{1}{2}\) 时有 \(\tau = \frac{p}{1-p}\)