参数估计
-
矩估计
- 令EX=X
- 令EX2=n1i=1∑nXi2
-
最大似然估计,设 x1,x2,...,xn 为观测样本值(题目没设需要自己设)
似然函数:L(p)=i=1∏nP{Xi=xi}
使得似然函数取得最大值的p就是最大似然估计
-
估计量评价
- 无偏性:如果是无偏,则Ep^=p
- 有效性:如果有两个估计量,则方差更小的更有效
- 相合性(一致性):估计量依概率收敛于p ∀ϵ>0 均有 n→∞limP{∣p^−p∣≥ϵ}=0
前置知识
首先,我们应该在前面看到过这几个公式:
X1,X2,⋯,Xn来自正态分布N(μ,σ2)的样本,有:(1)样本均值与方差独立(2)σn(X−μ)∼N(0,1)Zα(3)Sn(X−μ)∼t(n−1)tα(4)i=1∑n(σXi−μ)2∼χ2(n)χα(5)σ2(n−1)S2=i=1∑n(σXi−X)2∼χ2(n−1)χα
其次是,上分位点定义 ,如果 P(X>μα)=α ,μα 称为上分位点
然后是:样本与整体,样本是 已知 的,其是变量,整体是 未知 的,其是常量。
最后是,不管是区间估计还是假设检验,都是用已知的来推算位置的。
区间估计
基本概念
- 区间估计:样本 直接 计算 出 整体 的取值范围
- 取值范围内的叫做 置信区间,概率称为 置信度 (开区间)
- 取到范围外的叫做 非置信区间 (闭区间)
具体情况
假设置信度为 1−α
-
通用方法:
找到一个变量 M,为 Xi、μ、X、σ、S2 量的组合,使其服从m 分布
上面的 m 分布可以是:N(0,1)→z、χ2→χ2、t→t、F→F 这四种分布,一般看题目给了哪些数据,八九不离十
P{M>mα/2}=α/2 代入运算,得到 P{−mα/2<M<mα/2}=1−α 就能得到结果了
那么置信区间 :概率为1−α 的区间,即 −mα/2<M<mα/2 解出你的估计的值即可
-
样本方差 已知
P{σn(X−μ)>Zα/2(n)}=α/2P{X−nσZα/2(n)<μ<X+nσZα/2(n)}=1−α
P{Sn(X−μ)>tα/2(n−1)}=α/2P{X−nStα/2(n−1)<μ<X+nStα/2(n−1)}=1−α
假设检验
基本概念
- 假设检验:用 样本 来检验 猜测的整体 ,接受或者拒绝
- 接收域:能够接受的区间(开区间)
- 拒绝域:不能够接受的区间(闭区间)
- 拒绝的概率:称为 显著性水平 ,同样,这个也等于 弃真 的概率
具体情况
假设显著性水平为 α
-
单 正太整体通用方法
找到一个变量 M,为 Xi、μ、X、σ、S2 量的组合,使其服从m 分布
上面的 m 分布可以是:N(0,1)→z、χ2→χ2、t→t、F→F 这四种分布,一般看题目给了哪些数据,八九不离十
双边检验 :P{M>mα/2}=α/2 代入运算,得到 P{−mα/2<M<mα/2}=1−α
单边检验 :P{M>mα}=α 代入运算,得出 P{M≤mα}=1−α
接收域 :概率为1−α 的区间,即 −mα/2<M<mα/2 或者 M>mα 解出你要估计的值即可
-
双 正太整体通用方法(考的概率几乎为0)
与单正太整体几乎相同,也是找到一个M,让其是两个变量的量组合,服从 m 分布,后面都是一样的
Sω2=n1+n2−2(n1−1)S12+(n2−1)S2
σ1=σ2时,T=Sωn11+n21X−Y∼t(n1+n2−2)
F=S22S12∼F(n1−1,n2−1)
就不举例情况了
两类错误
-
第一类错误:弃真
α=P{拒绝H0∣H0为真}
也就是显著性水平
-
第二类错误:取伪
β=P{接受H0∣H0为假}