Chapter5 分支过程

分支过程模型¶

分支过程描述的是一个系统中个体繁殖、消亡或分裂的随机演化过程，其常用于研究种群动态、传染病传播等领域，其核心假设如下：

每个个体独立地按照相同的概率分布产生后代
后代数量通常由一个随机变量（称之为后代分布）决定

下面我们简要介绍一下分支过程的模型：

我们设 $\xi$ 是取值非负整数的随机变量，$p(\xi = k)=p_k,k=0,1,\cdots$，这里 $p_0<1$ （否则这个分支过程就过于平凡了），而第 $k$ 代个体数我们记为 $Z_k$，$Z_0$ 是初始个体数（通常我们设为1，但是也可以为任意正整数）第一代个体数 $Z_1$ 与 $\xi$ 同分布，$Z_1$ 个个体独立繁衍，方式和祖先一致，我们用 $\xi_{1,j}$ 表示第1代第j个个体的后代数，则 $\left\{\xi_1,j:j=1,2,\cdots\right\}$ 独立同分布，与 $\xi$ 同分布，且与 $Z_1$ 独立，第二代个体数为

\[ Z_2=\sum_{j=1}^{Z_1}\xi_{1,j} \]

令 $Z_n$ 为第 $n$ 代个体总数，用 $\xi_{n,j}$ 表示第 $n$ 代第 $j$ 个个体的后代数，则 $\left\{\xi_{n,j:1,2,\cdots}\right\}$ 独立同分布，与 $\xi$ 同分布，且与 $(Z_1,\cdots,Z_n)$ 独立，第 $n+1$ 代个体数为

\[ Z_{n+1}=\sum_{j=1}^{Z_n}\xi_{n,j} \]

所以若 $\left\{Z_n;n\geq 0\right\}$ 是时齐的 Markov 链，状态空间为 $\left\{0,1,\cdots\right\}$，则有

\[ p_{ij}=P(\sum_{l=1}^i \xi_l=j),i,j\geq 0 \]

其中 $\xi_1,\xi_2,\cdots$ 独立同分布且与 $\xi$ 分布相同

Tip

其证明如下：

\[ \begin{aligned} &P(Z_{n+1} = j \mid Z_0 = 1, Z_1 = i_1, \cdots, Z_{n-1} = i_{n-1}, Z_n = i) \\ =& P\left( \sum_{k=1}^i \xi_{n,k} = j \;\middle|\; Z_0 = 1, Z_1 = i_1, \cdots, Z_{n-1} = i_{n-1}, Z_n = i \right) \\ =& P\left( \sum_{k=1}^i \xi_{n,k} = j \right) \end{aligned} \]

这是因为 $(\xi_{n,1}, \cdots, \xi_{n,i})$ 与 $(Z_0, \cdots, Z_n)$ 是相互独立的。

下面我们来看一些分支过程的例子：

1. 设 $P(\xi = 1) = p$， $P(\xi = 0) = 1 - p$,，$0 < p < 1$，则 $P(Z_n = 1) = p^n$,， $P(Z_n = 0) = 1 - p^n$

2. 设 $\xi \sim B(n, p)$，则在 $Z_n = i$ 条件下， $Z_{n+1} = \sum_{l=1}^{i} \xi_{n,l} \sim B(ni, p)$，所以

\[p_{ij} = \binom{ni}{j} p^j (1-p)^{ni-j}, j = 0, 1, \cdots, ni\]

Tip

用到了二项分布的可加性

3. 设$\xi \sim \pi(\lambda)$，则在$Z_n = i$条件下，$Z_{n+1} = \sum_{l=1}^{i} \xi_{n,l} \sim \pi(i\lambda)$$，所以

\[p_{ij} = e^{-i\lambda} \frac{(i\lambda)^j}{j!}, j = 0, 1, \cdots\]

4. 设 $P(\xi = k) = (1 - p)^k p, k = 0, 1, \cdots$ 则

\[ p_{ij} = P\left(\sum_{l=1}^{i} \xi_{n,l} = j\right) = \binom{i+j-1}{i-1} (1-p)^j p^i \]

Tip

这个几何分布的情形可以这么理解，$i$ 表示第 $n$ 代的个体数，后代数 $\xi_{n,l}$ 服从参数为 $p$的几何分布，即以概率 $p$ 停止繁殖，每次失败产生一个后代（概率为 $1-p$ ），系数 $C_{i-1}^{i+j-1}$ 表示将 $j$ 个失败（后代）分配到 $i$ 个成功（个体）的不同方式，等价于“在 $i$ 个箱子中放入 $j$ 个球”的组合数

5. 设$p_0 = 0.2, p_1 = 0.3, p_2 = 0.2, p_3 = 0.2, p_4 = 0.1$，则有

\[\begin{aligned} P(Z_2 = 0) &= \sum_{k=0}^{4} P(Z_2 = 0 | Z_1 = k)P(Z_1=k)\\&=p_0\times 1+p_1\times p_0+p_2\times (p_0)^2+p_3\times (p_0)^3+p_4 \times (p_0)^4\\&=0.2\times 1+0.3 \times0.2+0.2\times (0.2)^2+0.2\times (0.2)^3+ 0.1\times (0.2)^4=0.26976\\ \\ \end{aligned}\]

\[\begin{aligned} P(Z_2 = 1) &=\sum_{k=0}^4P(Z_2=1|Z_1=k)P(Z_1=k)=\sum_{k=0}^4p_kC_k^1p_1p_0^{k-1}=\sum_{k=0}^4p_kkp_1p_0^{k-1}\\&=0.3\times 1 \times 0.3\times 0.2^0+0.2\times 2\times0.3\times0.2^1+0.2\times 3\times 0.3\times 0.2^2+0.1\times 4\times 0.3\times 0.2^3=0.12216 \end{aligned}\]

下面我们考虑一下已知随机变量 $\xi$ 的数字特征的时候， $Z_n$ 的数字特征

设 $E\xi=\mu,Var\xi=\sigma^2$，那么对于 $n\geq 1$，则可以得到：

$E(Z_n)=\mu^n$
$VarZ_n = \sigma^2\mu^{n-1}(1+\mu+\mu^2+\cdots+\mu^{n-1})$

其证明如下：

显然 $E(Z_1)=E\xi=\mu$，我们不妨使用数学归纳法进行证明，假设 $E(Z_k)=\mu^k$，则 $$ E(Z_{k+1})=E(\sum_{j=1}^{Z_k}\xi_{k,j})=E[E(\sum_{j=1}^{Z_k}\xi_{k,j}|Z_k)]=E(Z_k\mu)=\mu\mu^{k}=\mu^{k+1} $$ 这里我们用到了全期望公式

对于 $VarZ_n$，显然有 $VaZ_1=Var\xi=\sigma^2$ 符合，下面我们也使用数学归纳法进行证明

设 $VarZ_{k}=\sigma^2\mu^{k-1}(1+\mu+\mu^2+\cdots+\mu^{k-1})$，则对于 $VarZ_{k+1}$，有

\[ VarZ_{k+1}=E(Z_{k+1}^2)-(EZ_{k+1})^2=E(Z_{k+1}^2)-(\mu^{k+1})^2 \]

其中$E((\sum_{j=1}^m\xi_{k,j})^2|Z_k=m)=E[(\sum_{j=1}^{m}\xi_{k,j})^2]=Var(\sum_{j=1}^m\xi_{k,j})+(E\sum_{j=1}^m\xi_{k,j})^2=m\sigma^2+m^2\mu^2$，故有 $$
E(Z_{k+1}^2)=E[(\sum_{j=1}^{Z_k}\xi_{k,j})^2]=Z_k\sigma^2+Z_k^2\mu^2 $$ 所以

\[\begin{aligned} VarZ_{k+1}&=E(Z_k)\sigma^2+E(Z_k^2)\mu^2-\mu^{2k+2}=\mu^k\sigma^2-\mu^{2k+2}+\mu^2(VarZ_k+(EZ_k)^2)\\&=\mu^k\sigma^2-\mu^{2k+2}+\mu^2(\sigma^2\mu^{k-1}(1+\mu+\mu^2+\cdots+\mu^{k-1})+\mu^{2k})\\&=\mu^k\sigma^2-\mu^{2k+2}+\sigma^2\mu^{k+1}(1+\mu+\mu^2+\cdots+\mu^{k-1})+\mu^{2k+2}=\mu^k\sigma^2(1+\mu+\mu^2+\cdots+\mu^k) \end{aligned}\]

故上述结论对所有 $n\geq1$ 均成立

Tip

当 $\mu>1$ 时，平均人数几何级数增长
当 $\mu=1$ 时，平均人数恒为1
当 $\mu<1$ 时，平均人数几何级数递减

一般来说，$Z_n$ 的分布律一般很难算，下面我们引入灭绝概率和 $Z_n$ 的生成函数，用生成函数来简化 $Z_n$ 分布律的计算

灭绝概率¶

对于分支过程来说，我们着重关注灭绝概率，也即数量变为0的概率。

灭绝概率是整个种族最终后代数为零的概率，我们设每个个体产生后代的概率分布为 $p_k$（产生 $k$ 个后代的概率），则灭绝概率 $q$（灭绝概率 $q$ 是所有可能情况的期望，产生 $k$ 个后代的概率是 $P_k$，在产生 $k$ 个后代的情况下，种群灭绝的概率是 $q^k$）满足以下方程： $$ q=\sum_{k=0}^{\infty}p_kq^k $$ 其中 $q$ 是灭绝概率，解这个方程就可以得到灭绝概率，而我们惊人地发现 $\sum_{k=0}^{\infty}p^kq^k$ 其实与生成函数非常地相像，所以在引入灭绝概率之前，我们再回顾一下生成函数的知识。

Tip

生成函数可以参考Chapter3 泊松过程的笔记

分支过程的生成函数¶

我们令 $Z_n$ 的生成函数为 $\phi_n(x)=E(x^{Z_n})$，它有一个很有趣的性质，我们记 $\phi(x)=E(x^{\xi})$（后代分布的生成函数），则在 $Z_0=1$ 的假设下，有 $\phi_0(x)=E(x^{Z_0})=x,\ \phi_1(x)=E(x^{Z_1})=\phi(x)$，而对于 $n\geq1$，有 $$ \phi_{n+1}(x)=\phi_n(\phi(x))=\phi(\phi_n(x))=\cdots $$ 也即生成函数满足一个递归关系：第 $n+1$ 代的生成函数可以通过第 $n$ 代的生成函数和后代分布的生成函数 $\phi(x)$ 来迭代，可以用数学归纳法进行证明：

$\phi_0(x)=E(x^{Z_0})=E(s^1)=s$ 显然成立，$\phi_1(x)=E(x^{Z_1})=E(x^\xi)=\phi(x)$，对 $n\geq1$ 有

\[\begin{aligned} \phi_{n+1}(x)&=E(x^{Z_{n+1}})=E[E(x^{\sum_{j=1}^{Z_n}\xi_{n,j}}|Z_n)]=E(\phi(x)^{Z_n})=\phi_n(\phi(x))\\&=\phi(\phi\cdots\phi(s))=\phi[\phi(\phi\cdots\phi(x))]=\phi[\phi_n(x)] \end{aligned}\]

而有了 $Z_n$ 的生成函数，我们也能够通过生成函数去考虑 $Z_n$ 的期望和方差，可以自己推导一下，也是满足我们前面提到过的性质的，推导如下：

Tip

要是这里忘记补了记得提醒我

下面我们来看一些例子，如何计算 $Z_n$ 的分布律

例设 $P(\xi = k)=\frac{1}{2^{k+1}},k=0,1,\cdots$，对 $n\geq 1$，计算

$\phi_n(x)$
$Z_n$ 的分布律

解 (1) 我们知道 $\phi_n(x)$ 就等于 $n$ 个 $\phi(x)$ 的复合，所以我们不妨先计算 $\phi(x)$，有 $$ \phi(x)=E(x^{\xi})=\sum_{k=0}^{\infty}x^k\frac{1}{2^{k+1}}=\frac{1}{2}\sum_{k=0}^{\infty}(\frac{x}{2})^k=\frac{1}{2}\times\frac{1}{1-\frac{x}{2}}=\frac{1}{2-x} $$ 所以有 $\phi_1(x)=\frac{1}{2-x},\phi_2(x)=\phi(\phi_1(x))=\frac{1}{2-\phi_1(x)}=\frac{1}{2-\frac{1}{2-x}}=\frac{2-x}{3-2x}$

不妨用数学归纳法，假设 $\phi_n(x)=\frac{n-(n-1)x}{n+1-nx}$，则有 $$ \phi_{n+1}(x)=\phi(\phi_n(x))=\frac{1}{2-\phi_n(x)}=\frac{1}{2-\frac{n-(n-1)x}{n+1-nx}}=\frac{(n+1)-nx}{(n+2)-(n+1)x} $$ 故结论成立

(2) 我们用 Markov 链的方法来计算其实是比较困难的，现在我们已经计算出 $Z_n$ 的生成函数，就可以使用分布函数来计算 $Z_n$ 的分布律，

最后可以得到 $$ P(Z_n=0)=\frac{n}{n+1},\qquad P(Z_n=k)=\frac{n^{k-1}}{(n+1)^{k+1}},k \geq 1 $$

灭绝概率¶

设 $0<p_0<1$，令 $\alpha_n=P(Z_n=0)$，由于 $0$ 是吸收态，所以有 $\alpha_n$ 单调递增，这是因为 $Z_n=0\Rightarrow Z_{n+1}=0$，我们令 $$ \tau:=\lim_{n\to \infty}P(Z_n=0)，则有\tau=P(Z_n=0 \qquad for \ some \ n) $$ 那么我们的问题是，灭绝概率 $\tau$ 是多少？

灭绝概率有以下理论：

灭绝概率 $\tau$ 是方程 $x=\phi(x)$ 的最小正解
$\tau = 1$ 当且仅当 $\mu \leq 1$

证明先不写在下面了，等有了时间再补，大概是4-22课程的末尾和4-29课程的最开始的部分

下面我们来看一些分支过程的例子：

例设 $P(\xi=k)=\frac{1}{2^{k+1}},k=0,1,\cdots$，则 $\phi(x)=\frac{1}{2-x},\mu=\phi'(1)=1$，因此有 $\tau=1$，又我们已经算得 $\alpha_n=P(Z_n=0)=\frac{n}{n+1}$，我们记 $T_0=\min\left\{n\geq1:Z_n=0\right\}$ 为首次灭绝的时刻，我们希望求得 $T_0$ 的分布律，也即求 $P(T_0)=n$ 的值 $$ P(T_0=n)=P(Z_n=0,Z_{n-1}\neq 0)=P(Z_n=0)-P(Z_{n-1}= 0)=\frac{n}{n+1}-\frac{n-1}{n}=\frac{1}{n(n+1)} $$ 例设 $P(\xi=k)=(1-p)^kp,k=0,1,\cdots$，则 $\phi(x)=\frac{p}{1-(1-p)x},\mu=\phi'(1)=\frac{1-p}{p}$

考虑灭绝概率 $\tau$，我们知道灭绝概率 $\tau$ 是方程 $\phi(x)=x$ 的最小正解，也即有 $$ (1-p)x^2-x+p=0 \iff(x-1)((1-p)x-p)=0 $$ 所以有当 $p\geq \frac{1}{2}$ 时有 $\tau = 1$，当 $p<\frac{1}{2}$ 时有 $\tau = \frac{p}{1-p}$

Chapter5 分支过程

分支过程模型¶

灭绝概率¶

分支过程的生成函数¶

灭绝概率¶

评论