百科定义:在点估计的基础上,给出总体参数估计的一个范围,通常由样本统计量加减估计误差。
区间估计中,可以根据样本统计量的抽样分布,对样本统计量与总体参数的接近程度给出一个概率度量
个人理解:给出总体参数在当前给定区间的概率。
解释:
点估计未知参数θ的估计量θ^是一个随机变量,随着样本选取的不同,得到的值也不同的,所以在此基础上,我们就希望能够找到一个区间,使得总体参数落到这个区间上的概率尽可能大(这个概率其实也就是可信度(置信水平)),而这个区间就是区间估计的解。
目标:区间越小越好,概率越大越好(其实两者在一定程度上是矛盾的)
P { θ 1 ^ ≤ θ ≤ θ 2 ^ } = 1 − α θ : 总 体 未 知 参 数 θ ^ 1 、 θ ^ 2 : 置 信 下 限 和 置 信 上 限 1 − α : 置 信 水 平 P\{\hat{\theta_1}\le\theta\le\hat{\theta_2}\}=1-\alpha\\ \theta:总体未知参数\\ \hat\theta_1、\hat\theta_2:置信下限和置信上限\\ 1-\alpha:置信水平 P{θ1^≤θ≤θ2^}=1−αθ:总体未知参数θ^1、θ^2:置信下限和置信上限1−α:置信水平
转化: P { g ( θ 1 ) ^ ≤ T ( x ) ≤ g ( θ 2 ) ^ } = 1 − α T ( x ) : ( 关 键 ) 需 要 构 造 的 统 计 量 , 通 常 是 正 态 、 卡 方 、 t 、 F 分 布 , 这 样 才 能 写 成 分 位 数 形 式 P\{\hat{g(\theta_1)}\le{T(x)}\le{\hat{g(\theta_2)}}\}=1-\alpha\\ T(x):(关键)需要构造的统计量,通常是正态、卡方、t、F分布,这样才能写成分位数形式 P{g(θ1)^≤T(x)≤g(θ2)^}=1−αT(x):(关键)需要构造的统计量,通常是正态、卡方、t、F分布,这样才能写成分位数形式
例:总体服从X~N(μ,σ2),现有样本统计量(X1、X2、X3…Xn)求μ和σ2的置信度为1-α的区间
估计μ
情况一:σ2已知,(正态分布求解)根 据 总 体 分 布 可 得 到 样 本 分 布 : X ˉ − N ( μ , σ 2 n ) 构 造 统 计 量 : ( X ˉ − μ ) σ n − N ( 0 , 1 ) P { − μ ( 1 − α 2 ) ≤ ( X ˉ − μ ) σ n ≤ μ ( 1 − α 2 ) } = 1 − α p { X ˉ − σ n μ ( 1 − α 2 ) ≤ μ ≤ X ˉ + σ n μ ( 1 − α 2 ) } 于 是 估 计 区 间 为 : [ X ˉ − σ n μ ( 1 − α 2 ) , X ˉ + σ n μ ( 1 − α 2 ) ] 注 : 其 中 μ ( 1 − α 2 ) 需 查 表 , σ 、 X ˉ 为 已 知 值 根据总体分布可得到样本分布:\bar{X}-N(\mu,\frac{\sigma^2}{n})\\ 构造统计量:\frac{(\bar{X}-\mu)}{\frac{\sigma}{\sqrt{n}}}-N(0,1)\\ P\{-\mu_{(1-\frac{\alpha}{2})}\le\frac{(\bar{X}-\mu)}{\frac{\sigma}{\sqrt{n}}}\le\mu_{(1-\frac{\alpha}{2})}\}=1-\alpha\\ p\{\bar{X}-\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})}\le\mu\le\bar{X}+\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})}\}\\ 于是估计区间为:[\bar{X}-\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})},\bar{X}+\frac{\sigma}{\sqrt{n}}\mu_{(1-\frac{\alpha}{2})}]\\ 注:其中\mu_{(1-\frac{\alpha}{2})}需查表,\sigma、\bar{X}为已知值 根据总体分布可得到样本分布:Xˉ−N(μ,nσ2)构造统计量:n σ(Xˉ−μ)−N(0,1)P{−μ(1−2α)≤n σ(Xˉ−μ)≤μ(1−2α)}=1−αp{Xˉ−n σμ(1−2α)≤μ≤Xˉ+n σμ(1−2α)}于是估计区间为:[Xˉ−n σμ(1−2α),Xˉ+n σμ(1−2α)]注:其中μ(1−2α)需查表,σ、Xˉ为已知值
情况二:σ2未知,(t分布求解)X ˉ − μ S n − 1 − t ( n − 1 ) 详 情 可 见 P 25 页 P { − t ( 1 − α 2 ) ( n − 1 ) ≤ ( X ˉ − μ ) S n − 1 ≤ t ( 1 − α 2 ) ( n − 1 ) } = 1 − α 于 是 估 计 区 间 为 : [ X ˉ − S n − 1 t ( 1 − α 2 ) ( n − 1 ) , X ˉ + S n − 1 t ( 1 − α 2 ) ( n − 1 ) ] \frac{\bar{X}-\mu}{\frac{S}{\sqrt{n-1}}}-t(n-1)~~~~~~详情可见P_{25}页\\ P\{-t_{(1-\frac{\alpha}{2})}(n-1)\le\frac{(\bar{X}-\mu)}{\frac{S}{\sqrt{n-1}}}\le{t}_{(1-\frac{\alpha}{2})}(n-1)\}=1-\alpha\\ 于是估计区间为:[\bar{X}-\frac{S}{\sqrt{n-1}}t_{(1-\frac{\alpha}{2})}(n-1),\bar{X}+\frac{S}{\sqrt{n-1}}t_{(1-\frac{\alpha}{2})}(n-1)] n−1 SXˉ−μ−t(n−1) 详情可见P25页P{−t(1−2α)(n−1)≤n−1 S(Xˉ−μ)≤t(1−2α)(n−1)}=1−α于是估计区间为:[Xˉ−n−1 St(1−2α)(n−1),Xˉ+n−1 St(1−2α)(n−1)]
估计σ2
此时只有一种情况,(卡方分布求解)n S 2 σ 2 − χ 2 ( n − 1 ) 或 : ( n − 1 ) S ∗ 2 σ 2 − χ 2 ( n − 1 ) p { χ σ 2 2 ( n − 1 ) ≤ n S 2 σ 2 ≤ χ 1 − σ 2 2 ( n − 1 ) } = 1 − α p { n S 2 χ 1 − σ 2 2 ( n − 1 ) ≤ σ 2 ≤ n S 2 χ σ 2 2 ( n − 1 ) } = 1 − α 于 是 , 估 计 区 间 为 : [ n S 2 χ 1 − σ 2 2 ( n − 1 ) , n S 2 χ σ 2 2 ( n − 1 ) ] , 或 [ ( n − 1 ) S ∗ 2 χ 1 − σ 2 2 ( n − 1 ) , ( n − 1 ) S ∗ 2 χ σ 2 2 ( n − 1 ) ] 注 : 当 求 标 准 差 的 估 计 区 间 时 , 只 需 要 对 应 的 开 方 即 可 \frac{nS^2}{\sigma^2}-\chi^2(n-1)\\ 或:\frac{(n-1)S_*^2}{\sigma^2}-\chi^2(n-1)\\ p\{\chi^2_{\frac{\sigma}{2}}(n-1)\le\frac{nS^2}{\sigma^2}\le\chi^2_{1-\frac{\sigma}{2}}(n-1)\}=1-\alpha\\ p\{\frac{nS^2}{\chi^2_{1-\frac{\sigma}{2}}(n-1)}\le{\sigma^2}\le\frac{nS^2}{\chi^2_{\frac{\sigma}{2}}(n-1)}\}=1-\alpha\\ 于是,估计区间为:[\frac{nS^2}{\chi^2_{1-\frac{\sigma}{2}}(n-1)},\frac{nS^2}{\chi^2_{\frac{\sigma}{2}}(n-1)}],或[\frac{(n-1)S_*^2}{\chi^2_{1-\frac{\sigma}{2}}(n-1)},\frac{(n-1)S_*^2}{\chi^2_{\frac{\sigma}{2}}(n-1)}]\\ 注:当求标准差的估计区间时,只需要对应的开方即可 σ2nS2−χ2(n−1)或:σ2(n−1)S∗2−χ2(n−1)p{χ2σ2(n−1)≤σ2nS2≤χ1−2σ2(n−1)}=1−αp{χ1−2σ2(n−1)nS2≤σ2≤χ2σ2(n−1)nS2}=1−α于是,估计区间为:[χ1−2σ2(n−1)nS2,χ2σ2(n−1)nS2],或[χ1−2σ2(n−1)(n−1)S∗2,χ2σ2(n−1)(n−1)S∗2]注:当求标准差的估计区间时,只需要对应的开方即可
注:需要先求σ~1~^2^/σ~2~^2^的估计区间,如果其包含1,则认为σ~1~^2^=σ~2~^2^(方差齐性),在利用t分布求解μ~1~-μ~2~的估计区间
估计σ12/σ22的区间 n 1 ( n 2 − 1 ) S 1 2 / σ 1 2 n 2 ( n 1 − 1 ) S 2 2 / σ 2 2 − F ( n 1 − 1 , n 2 − 1 ) p { F σ 2 ( n 1 − 1 , n 2 − 1 ) ≤ n 1 ( n 2 − 1 ) S 1 2 / σ 1 2 n 2 ( n 1 − 1 ) S 2 2 / σ 2 2 ≤ F 1 − σ 2 ( n 1 − 1 , n 2 − 1 ) } = 1 − α p { n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F σ 2 ( n 2 − 1 , n 1 − 1 ) ≤ σ 1 2 σ 2 2 ≤ n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F 1 − σ 2 ( n 2 − 1 , n 1 − 1 ) } = 1 − α 于 是 估 计 区 间 为 : [ n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F σ 2 ( n 2 − 1 , n 1 − 1 ) , n 1 ( n 2 − 1 ) S 1 2 n 2 ( n 1 − 1 ) S 2 2 F 1 − σ 2 ( n 2 − 1 , n 1 − 1 ) ] 或 者 [ S ∗ 1 2 S ∗ 2 2 F σ 2 ( n 2 − 1 , n 1 − 1 ) , S ∗ 1 2 S ∗ 2 2 F 1 − σ 2 ( n 2 − 1 , n 1 − 1 ) ] \frac{n_1(n_2-1)S_1^2/\sigma_1^2}{n_2(n_1-1)S_2^2/\sigma_2^2}-F(n_1-1,n_2-1)\\ p\{F_{\frac{\sigma}{2}}(n_1-1,n_2-1)\le\frac{n_1(n_2-1)S_1^2/\sigma_1^2}{n_2(n_1-1)S_2^2/\sigma_2^2}\le F_{1-\frac{\sigma}{2}}(n_1-1,n_2-1)\}=1-\alpha\\ p\{\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2}F_{\frac{\sigma}{2}}(n_2-1,n_1-1)\le\frac{\sigma_1^2}{\sigma_2^2}\le\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2} F_{1-\frac{\sigma}{2}}(n_2-1,n_1-1)\}=1-\alpha\\ 于是估计区间为:[\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2}F_{\frac{\sigma}{2}}(n_2-1,n_1-1),\frac{n_1(n_2-1)S_1^2}{n_2(n_1-1)S_2^2} F_{1-\frac{\sigma}{2}}(n_2-1,n_1-1)]\\ 或者[\frac{S_{*1}^2}{S_{*2}^2}F_{\frac{\sigma}{2}}(n_2-1,n_1-1),\frac{S_{*1}^2}{S_{*2}^2} F_{1-\frac{\sigma}{2}}(n_2-1,n_1-1)] n2(n1−1)S22/σ22n1(n2−1)S12/σ12−F(n1−1,n2−1)p{F2σ(n1−1,n2−1)≤n2(n1−1)S22/σ22n1(n2−1)S12/σ12≤F1−2σ(n1−1,n2−1)}=1−αp{n2(n1−1)S22n1(n2−1)S12F2σ(n2−1,n1−1)≤σ22σ12≤n2(n1−1)S22n1(n2−1)S12F1−2σ(n2−1,n1−1)}=1−α于是估计区间为:[n2(n1−1)S22n1(n2−1)S12F2σ(n2−1,n1−1),n2(n1−1)S22n1(n2−1)S12F1−2σ(n2−1,n1−1)]或者[S∗22S∗12F2σ(n2−1,n1−1),S∗22S∗12F1−2σ(n2−1,n1−1)] 估计μ1-μ2的区间
情况一:σ12和σ22已知,(正态分布求解)( X ˉ − Y ˉ ) − N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 − N ( 0 , 1 ) P { − μ 1 − α 2 ≤ ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ≤ μ 1 − α 2 } = 1 − α 于 是 估 计 区 间 为 : [ ( X ˉ − Y ˉ ) − μ 1 − α 2 σ 1 2 n 1 + σ 2 2 n 2 , ( X ˉ − Y ˉ ) + μ 1 − α 2 σ 1 2 n 1 + σ 2 2 n 2 ] (\bar{X}-\bar{Y})-N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})\\ \frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}-N(0,1)\\ P\{-\mu_{1-\frac{\alpha}{2}}\le\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\le\mu_{1-\frac{\alpha}{2}}\}=1-\alpha\\ 于是估计区间为:[(\bar{X}-\bar{Y})-\mu_{1-\frac{\alpha}{2}}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}},(\bar{X}-\bar{Y})+\mu_{1-\frac{\alpha}{2}}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}] (Xˉ−Yˉ)−N(μ1−μ2,n1σ12+n2σ22)n1σ12+n2σ22 (Xˉ−Yˉ)−(μ1−μ2)−N(0,1)P{−μ1−2α≤n1σ12+n2σ22 (Xˉ−Yˉ)−(μ1−μ2)≤μ1−2α}=1−α于是估计区间为:[(Xˉ−Yˉ)−μ1−2αn1σ12+n2σ22 ,(Xˉ−Yˉ)+μ1−2αn1σ12+n2σ22 ]
情况二:σ12和σ22未知,(t分布求解)M ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) n 1 n 2 ( n 1 + n 2 − 2 ) n 1 + n 2 − t ( n 1 + n 2 − 2 ) 其 中 : M = n 1 n 2 ( n 1 + n 2 − 2 ) n 1 + n 2 可 得 估 计 区 间 为 : [ X ˉ − Y ˉ − t 1 − α 2 ( n 1 + n 2 − 2 ) M n 1 S 1 2 + n 2 S 2 2 , X ˉ − Y ˉ + t 1 − α 2 ( n 1 + n 2 − 2 ) M n 1 S 1 2 + n 2 S 2 2 ] M\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{n_1n_2(n_1+n_2-2)}{n_1+n_2}}}-t(n_1+n_2-2)\\ 其中:M=\sqrt{\frac{n_1n_2(n_1+n_2-2)}{n_1+n_2}}\\ 可得估计区间为:[\bar{X}-\bar{Y}-\frac{t_{1-\frac{\alpha}{2}}(n_1+n_2-2)}{M}\sqrt{n_1S_1^2+n_2S_2^2},\bar{X}-\bar{Y}+\frac{t_{1-\frac{\alpha}{2}}(n_1+n_2-2)}{M}\sqrt{n_1S_1^2+n_2S_2^2}] Mn1+n2n1n2(n1+n2−2) (Xˉ−Yˉ)−(μ1−μ2)−t(n1+n2−2)其中:M=n1+n2n1n2(n1+n2−2) 可得估计区间为:[Xˉ−Yˉ−Mt1−2α(n1+n2−2)n1S12+n2S22 ,Xˉ−Yˉ+Mt1−2α(n1+n2−2)n1S12+n2S22 ]
以上为个人总结,难免有疏漏之处,请见谅,若任有疑问可加QQ:1372931501