Fisher Information

科技2025-06-23 58

Fisher Information

来自https://math.stackexchange.com/questions/265917/intuitive-explanation-of-a-definition-of-the-fisher-information

最大似然估计

fisher information 似然函数（likelihood）， $L(\bm{X};\theta)=\prod^{n}_{i=1}f(X_i;\theta)$ 。其中 $\{\bm{X}\}$ 是独立同分布的一组随机量， $X_1,X_2,\cdots,X_n$ ， $\theta$ 是需要估计的参数。

根据最大似然估计（MLE，Maximum Likelihood Estimation），求得score function $S(\bm{X};\theta)=\sum^{n}_{i=1}\frac{\partial\log f(X_i,;\theta)}{\partial \theta} \tag{1}$

score function 期望为0

score的期望为零，因为 $\int\cdots \int f(\bm{X};\theta)d\bm{X} =1 \tag{2}$ 所以 $\frac{\partial}{\partial \theta} \int \cdots \int f (\bm{X};\theta)d\bm{X} =0 \tag{3}$ 该式左侧， $\begin{aligned} \frac{\partial}{\partial \theta}\int \cdots \int f(\bm{X};\theta ) d \bm{X} = & \int \cdots \int \frac{\partial f (\bm{X};\theta)}{\partial \theta}d \bm{X}\\ = & \int \cdots \int \frac{\frac{\partial f (\bm{X};\theta)}{\partial \theta}}{f(\bm{X};\theta)} f(\bm{X};\theta) d \bm{X} \\ = & \int \cdots \int \frac{\partial \log f (\bm{X};\theta)}{\partial \theta}f (\bm{X};\theta) d \bm{X}\\ = & \mathbb{E} \left[ S(\bm{X};\theta)\right] \end{aligned} \tag{4}$ 得证。

Fisher Information 定义

Fisher Information： $\mathbb{V}[S(\bm{X};\theta)]= \mathbb{V}\left[ \frac{\partial L (\bm{X};\theta)}{\partial \theta}\right] \tag{5}$

Fisher Information 和Score function的关系

由于Score function的期望为0，假设S关于 $\theta$ 二阶可导。对（5）左右两侧继续求导，有 $\frac{\partial}{\partial \theta}\int \cdots \int \frac{\partial L(\bm{X};\theta)}{\partial \theta} f(\bm{X};\theta) d\bm{X} =0.\,\,\,\,\, \tag{6}$ (6)的左侧展开： $\int \cdots \int \frac{\partial ^2 L(\bm{X};\theta)}{\partial \theta ^2}f(\bm{X};\theta)d\bm{X} + \underbrace{\int \cdots \int \frac{\partial L(\bm{X};\theta)}{\partial \theta}\frac{\partial f (\bm{X};\theta)}{\partial \theta}d\bm{X}}_{(8)}=0\\ \tag{7}$ $\begin{aligned} (8)=&\int \cdots \int \frac{\partial L (\bm{X};\theta)}{\partial \theta} \frac{\frac{\partial f (\bm{X};\theta)}{\partial \theta}}{f(\bm{X};\theta)} f(\bm{X};\theta)d\bm{X}\\ =&\int \cdots \int \left(\frac{\partial L(\bm{X};\theta)}{\partial \theta}\right)^2 f (\bm{X};\theta)d\bm{X}\\ =&\mathbb{V}\left[\frac{\partial L (\bm{X};\theta)}{\partial \theta}\right]\\ & \tag{9} \end{aligned}$ 结合（7）和（9）可以得到 $\begin{aligned} \mathbb {V}[S(\bm{X};\theta)] =&\mathbb{V}\left[\frac{\partial L (\bm{X};\theta)}{\partial \theta}\right]\\ =& - \int \cdots \int \frac{\partial ^2 L(\bm{X};\theta)}{\partial \theta ^2}f(\bm{X};\theta)d\bm{X} \\ =& - \mathbb{E}\left[\frac{\partial ^2 L(\bm{X};\theta)}{\partial \theta ^2} \right] \end{aligned}$

Processed: 0.024, SQL: 10

Fisher Information

目录

Fisher Information

最大似然估计

score function 期望为0

Fisher Information 定义

Fisher Information 和Score function的关系