参数估计

  • 矩估计

    • EX=XEX=\overline{X}
    • EX2=1ni=1nXi2EX^2=\frac{1}{n}\sum\limits_{i=1}^nX_i^2
  • 最大似然估计,设 x1,x2,...,xnx_1,x_2,...,x_n 为观测样本值(题目没设需要自己设)

    似然函数:L(p)=i=1nP{Xi=xi}L(p) = \prod\limits_{i=1}^nP\left\{X_i=x_i\right\}

    使得似然函数取得最大值的p就是最大似然估计

  • 估计量评价

    • 无偏性:如果是无偏,则Ep^=pE\hat{p} = p
    • 有效性:如果有两个估计量,则方差更小的更有效
    • 相合性(一致性):估计量依概率收敛于p ϵ>0\forall \epsilon > 0 均有 limnP{p^pϵ}=0\lim\limits_{n\rightarrow\infty}P\left\{\left|\hat{p} - p \right|\geq \epsilon\right\} = 0

前置知识

 首先,我们应该在前面看到过这几个公式:

X1,X2,,Xn来自正态分布N(μ,σ2)的样本,有:(1)样本均值与方差独立(2)n(Xμ)σN(0,1)Zα(3)n(Xμ)St(n1)tα(4)i=1n(Xiμσ)2χ2(n)χα(5)(n1)S2σ2=i=1n(XiXσ)2χ2(n1)χαX_1,X_2,\cdots,X_n来自正态分布N(\mu,\sigma^2)的样本,有:\\ (1)\quad 样本均值与方差独立\\ (2)\quad \frac{\sqrt{n}(\overline{X}-\mu)}{\sigma} \sim N(0,1)\qquad Z_{\alpha} \\ (3)\quad \frac{\sqrt{n}(\overline{X}-\mu)}{S} \sim t(n-1) \qquad t_{\alpha} \\ (4)\quad \sum\limits_{i=1}^n \left(\frac{X_i - \mu}{\sigma}\right)^2 \sim \chi^2(n)\quad\chi_\alpha\\ (5)\quad \frac{(n-1)S^2}{\sigma^2} = \sum\limits_{i=1}^n\left(\frac{X_i-\overline{X}}{\sigma}\right)^2 \sim \chi^2(n-1)\quad \chi_\alpha

 其次是,上分位点定义 ,如果 P(X>μα)=αP(X>\mu_\alpha) = \alphaμα\mu_\alpha 称为上分位点

 然后是:样本与整体,样本是 已知 的,其是变量,整体是 未知 的,其是常量。

 最后是,不管是区间估计还是假设检验,都是用已知的来推算位置的。

区间估计

基本概念

  • 区间估计:样本 直接 计算整体 的取值范围
  • 取值范围内的叫做 置信区间,概率称为 置信度 (开区间)
  • 取到范围外的叫做 非置信区间 (闭区间)

具体情况

 假设置信度为 1α1-\alpha

  • 通用方法:

    找到一个变量 M,为 XiμXσS2X_i、\mu、\overline{X}、\sigma、S^2 量的组合,使其服从mm 分布

    上面的 m 分布可以是:N(0,1)zχ2χ2ttFFN(0,1)\rightarrow z、\chi^2\rightarrow \chi^2、t\rightarrow t、F\rightarrow F 这四种分布,一般看题目给了哪些数据,八九不离十

    P{M>mα/2}=α/2P\left\{M>m_{\alpha/2}\right\} = \alpha/2 代入运算,得到 P{mα/2<M<mα/2}=1αP\left\{-m_{\alpha/2}<M<m_{\alpha/2}\right\} = 1-\alpha 就能得到结果了

    那么置信区间 :概率为1α1-\alpha 的区间,即 mα/2<M<mα/2-m_{\alpha/2}<M<m_{\alpha/2} 解出你的估计的值即可

  • 样本方差 已知

P{n(Xμ)σ>Zα/2(n)}=α/2P{XσZα/2(n)n<μ<X+σZα/2(n)n}=1αP\left\{ \frac{\sqrt{n}(\overline{X}-\mu)}{\sigma} > Z_{\alpha/2}(n) \right\} = \alpha/2 \\ P\left\{ \overline{X} - \frac{\sigma Z_{\alpha/2}(n)}{\sqrt{n}} <\mu<\overline{X} + \frac{\sigma Z_{\alpha/2}(n)}{\sqrt{n}} \right\} = 1-\alpha

  • 样本方差 未知

P{n(Xμ)S>tα/2(n1)}=α/2P{XStα/2(n1)n<μ<X+Stα/2(n1)n}=1αP\left\{ \frac{\sqrt{n}(\overline{X}-\mu)}{S} > t_{\alpha/2}(n-1) \right\} = \alpha/2 \\ P\left\{ \overline{X} - \frac{S t_{\alpha/2}(n-1)}{\sqrt{n}} <\mu<\overline{X} + \frac{S t_{\alpha/2}(n-1)}{\sqrt{n}} \right\} = 1-\alpha

假设检验

基本概念

  • 假设检验:用 样本 来检验 猜测的整体 ,接受或者拒绝
  • 接收域:能够接受的区间(开区间)
  • 拒绝域:不能够接受的区间(闭区间)
  • 拒绝的概率:称为 显著性水平 ,同样,这个也等于 弃真 的概率

具体情况

 假设显著性水平为 α\alpha

  • 正太整体通用方法

    找到一个变量 M,为 XiμXσS2X_i、\mu、\overline{X}、\sigma、S^2 量的组合,使其服从mm 分布

    上面的 m 分布可以是:N(0,1)zχ2χ2ttFFN(0,1)\rightarrow z、\chi^2\rightarrow \chi^2、t\rightarrow t、F\rightarrow F 这四种分布,一般看题目给了哪些数据,八九不离十

    双边检验P{M>mα/2}=α/2P\left\{M>m_{\alpha/2}\right\} = \alpha/2 代入运算,得到 P{mα/2<M<mα/2}=1αP\left\{-m_{\alpha/2}<M<m_{\alpha/2}\right\} = 1-\alpha

    单边检验P{M>mα}=αP\left\{M>m_{\alpha}\right\} = \alpha 代入运算,得出 P{Mmα}=1αP\left\{M\leq m_{\alpha}\right\} = 1 - \alpha

    接收域 :概率为1α1-\alpha 的区间,即 mα/2<M<mα/2-m_{\alpha/2} < M < m_{\alpha/2} 或者 M>mαM>m_{\alpha} 解出你要估计的值即可

  • 正太整体通用方法(考的概率几乎为0)

    与单正太整体几乎相同,也是找到一个M,让其是两个变量的量组合,服从 m 分布,后面都是一样的

    Sω2=(n11)S12+(n21)S2n1+n22S_{\overline{\omega}}^2 = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S^2}{n_1+n_2-2}}

    σ1=σ2时,T=XYSω1n1+1n2t(n1+n22)\sigma_1=\sigma_2时,\quad T=\frac{\overline{X}-\overline{Y}}{S_{\overline{\omega}}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2)

    F=S12S22F(n11,n21)F=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1)

就不举例情况了

两类错误

  • 第一类错误:弃真

    α=P{拒绝H0H0为真}\alpha = P\left\{ 拒绝H_0 | H_0为真\right\}

    也就是显著性水平

  • 第二类错误:取伪

    β=P{接受H0H0为假}\beta = P\left\{接受H_0|H_0为假\right\}