Доверительное оценивание
Доверительная область
Во многих случаях, помимо точечных оценок неизвестных параметров распределения, желательно указать область, в которой истинные значения этих параметров содержатся с заданной вероятностью. Такая область называется доверительной.
Дадим точное определение. Пусть выборка $\mathbf{x}=(x_1,\dots,x_I)$ подчиняется функция распределения $F(x|\mathbf{p})$, т.е.
$$x_i \sim F(x | \mathbf{p})$$
которая известна с точностью до значений параметров $\mathbf{p} = (p_1,\dots,p_M)$. Статистика $P(\mathbf{x}) ∈ R^M$ называется доверительной областью, соответствующей доверительной вероятности $\gamma$, если:
$$\mathrm{Pr} \{ \mathbf{p} ∈ P(\mathbf{x})\} ≥ \gamma $$
Доверительный интервал
Часто для каждого параметра $p_m$ строится своя одномерная область – доверительный интервал.
Границы доверительного интервала – это две статистики $p^–(\mathbf{x})$ и $p^+(\mathbf{x})$, такие, что
$$\mathrm{Pr}\{ p^–(\mathbf{x}) ≤ p ≤ p^+(\mathbf{x}) \} ≥ \gamma$$
Для односторонних доверительных интервалов соответствующая граница заменяется на $–\infty$, $0$, или $+\infty$.
В большинстве практических случаев доверительные интервалы строятся для (асимптотически) нормальных выборок с помощью соотношений, приведенных в разделе 5.5.
Пример построения интервала
Приведем пример построения доверительного интервала.
Пусть имеется выборка $\mathbf{x}=(x_1,\dots,x_I)$ из нормального распределения $N(\mu, \sigma^2)$ с известной дисперсией $\sigma^2$. Построим доверительный интервал для параметра $\mu$ – математического ожидания.
Из раздела 5.5 следует, что
$$ \mathrm{Pr}\bigg\{ \Phi^{-1}(1-\alpha_1) ≤ \frac{\bar{x} - \mu}{\sigma}\sqrt{I} ≤ \Phi^{-1}(1-\alpha_2) \bigg\} = \alpha_1 + \alpha_2 - 1 $$
где $\Phi^{–1}$ – квантиль стандартного нормального распределения, поэтому
$$ \mathrm{Pr}\bigg\{ \bar{x} - \frac{\sigma}{\sqrt{I}}\Phi^{-1}(\alpha_2) ≤ \mu ≤ \bar{x} + \frac{\sigma}{\sqrt{I}}\Phi^{-1}(\alpha_1) \bigg\} = \alpha_1 + \alpha_2 - 1 $$
Для построения симметричного доверительного интервала с доверительной вероятностью $\gamma$, положим $\alpha_1 = \alpha_2 = 0.5 (1 + \gamma)$. Для построения односторонних доверительных интервалов, положим $\alpha_1 = 1$, $α_2 = \gamma$, или $α_1 = \gamma, \alpha_2 = 1$.
Интервалы для нормального распределения
Используя соотношения, приведенные в разделе 5.5, можно построить доверительный интервал для параметров нормального распределения $N(\mu, \sigma^2)$.
Пусть имеются оценки $\bar{x}$, $s^2$, $s_m^2$, тогда выполняются следующие утверждения.
Доверительный интервал для среднего значения $\mu$ при неизвестной дисперсии $\sigma^21 имеет вид:
$$ \mathrm{Pr}\bigg\{ \bar{x} - \frac{s}{\sqrt{I}}T^{-1}(\alpha_2 | I - 1) ≤ \mu ≤ \bar{x} + \frac{s}{\sqrt{I}}T^{-1}(\alpha_1 | I - 1) \bigg\} = \alpha_1 + \alpha_2 - 1 $$
где $T^{–1}(\alpha | I–1)$ – квантиль распределения Стьюдента с $I–1$ степенями свободы.
Доверительный интервал для дисперсии $\sigma^2$ при известном среднем значении $\mu$ имеет вид:
$$ \mathrm{Pr}\bigg\{ I\frac{s_m^2}{\chi^{-2}(\alpha_2|I)} ≤ \sigma^2 ≤ I\frac{s_m^2}{\chi^{-2}(\alpha_1|I)} ≤ \bigg\} = \alpha_1 + \alpha_2 - 1 $$
где $\chi^{–2}(\alpha | I)$ – квантиль распределения хи-квадрат с $I$ степенями свободы.
Доверительный интервал для дисперсии $\sigma^2$ при неизвестном среднем значении $\mu$ имеет вид:
$$ \mathrm{Pr}\bigg\{ I\frac{s^2}{\chi^{-2}(\alpha_2|I-1)} ≤ \sigma^2 ≤ I\frac{s^2}{\chi^{-2}(\alpha_1|I-1)} ≤ \bigg\} = \alpha_1 + \alpha_2 - 1 $$
где $\chi^{–2}(\alpha | I–1)$ – квантиль распределения хи-квадрат с $I–1$ степенями свободы.