Доверительное оценивание

Доверительная область

Во многих случаях, помимо точечных оценок неизвестных параметров распределения, желательно указать область, в которой истинные значения этих параметров содержатся с заданной вероятностью. Такая область называется доверительной.

Дадим точное определение. Пусть выборка $\mathbf{x}=(x_1,\dots,x_I)$ подчиняется функция распределения $F(x|\mathbf{p})$, т.е.

$$x_i \sim F(x | \mathbf{p})$$

которая известна с точностью до значений параметров $\mathbf{p} = (p_1,\dots,p_M)$. Статистика $P(\mathbf{x}) ∈ R^M$ называется доверительной областью, соответствующей доверительной вероятности $\gamma$, если:

$$\mathrm{Pr} \{ \mathbf{p} ∈ P(\mathbf{x})\} ≥ \gamma $$

Доверительный интервал

Часто для каждого параметра $p_m$ строится своя одномерная область – доверительный интервал.

Границы доверительного интервала – это две статистики $p^–(\mathbf{x})$ и $p^+(\mathbf{x})$, такие, что

$$\mathrm{Pr}\{ p^–(\mathbf{x}) ≤ p ≤ p^+(\mathbf{x}) \} ≥ \gamma$$

Для односторонних доверительных интервалов соответствующая граница заменяется на $–\infty$, $0$, или $+\infty$.

В большинстве практических случаев доверительные интервалы строятся для (асимптотически) нормальных выборок с помощью соотношений, приведенных в разделе 5.5.

Пример построения интервала

Приведем пример построения доверительного интервала.

Пусть имеется выборка $\mathbf{x}=(x_1,\dots,x_I)$ из нормального распределения $N(\mu, \sigma^2)$ с известной дисперсией $\sigma^2$. Построим доверительный интервал для параметра $\mu$ – математического ожидания.

Из раздела 5.5 следует, что

$$ \mathrm{Pr}\bigg\{ \Phi^{-1}(1-\alpha_1) ≤ \frac{\bar{x} - \mu}{\sigma}\sqrt{I} ≤ \Phi^{-1}(1-\alpha_2) \bigg\} = \alpha_1 + \alpha_2 - 1 $$

где $\Phi^{–1}$ – квантиль стандартного нормального распределения, поэтому

$$ \mathrm{Pr}\bigg\{ \bar{x} - \frac{\sigma}{\sqrt{I}}\Phi^{-1}(\alpha_2) ≤ \mu ≤ \bar{x} + \frac{\sigma}{\sqrt{I}}\Phi^{-1}(\alpha_1) \bigg\} = \alpha_1 + \alpha_2 - 1 $$

Для построения симметричного доверительного интервала с доверительной вероятностью $\gamma$, положим $\alpha_1 = \alpha_2 = 0.5 (1 + \gamma)$. Для построения односторонних доверительных интервалов, положим $\alpha_1 = 1$, $α_2 = \gamma$, или $α_1 = \gamma, \alpha_2 = 1$.

Интервалы для нормального распределения

Используя соотношения, приведенные в разделе 5.5, можно построить доверительный интервал для параметров нормального распределения $N(\mu, \sigma^2)$.

Пусть имеются оценки $\bar{x}$, $s^2$, $s_m^2$, тогда выполняются следующие утверждения.

Доверительный интервал для среднего значения $\mu$ при неизвестной дисперсии $\sigma^21 имеет вид:

$$ \mathrm{Pr}\bigg\{ \bar{x} - \frac{s}{\sqrt{I}}T^{-1}(\alpha_2 | I - 1) ≤ \mu ≤ \bar{x} + \frac{s}{\sqrt{I}}T^{-1}(\alpha_1 | I - 1) \bigg\} = \alpha_1 + \alpha_2 - 1 $$

где $T^{–1}(\alpha | I–1)$ – квантиль распределения Стьюдента с $I–1$ степенями свободы.

Доверительный интервал для дисперсии $\sigma^2$ при известном среднем значении $\mu$ имеет вид:

$$ \mathrm{Pr}\bigg\{ I\frac{s_m^2}{\chi^{-2}(\alpha_2|I)} ≤ \sigma^2 ≤ I\frac{s_m^2}{\chi^{-2}(\alpha_1|I)} ≤ \bigg\} = \alpha_1 + \alpha_2 - 1 $$

где $\chi^{–2}(\alpha | I)$ – квантиль распределения хи-квадрат с $I$ степенями свободы.

Доверительный интервал для дисперсии $\sigma^2$ при неизвестном среднем значении $\mu$ имеет вид:

$$ \mathrm{Pr}\bigg\{ I\frac{s^2}{\chi^{-2}(\alpha_2|I-1)} ≤ \sigma^2 ≤ I\frac{s^2}{\chi^{-2}(\alpha_1|I-1)} ≤ \bigg\} = \alpha_1 + \alpha_2 - 1 $$

где $\chi^{–2}(\alpha | I–1)$ – квантиль распределения хи-квадрат с $I–1$ степенями свободы.