К-во элементов смеси |
Expectation maximization |
Событие | Вероятность |
---|---|
\(x_1\in M_1\) | \(P(x_1)=\frac{1}{2}\) |
\(x_2\in M_2\) | \(P(x_2)=u\) |
\(x_3\in M_3\) | \(P(x_3)=2u\) |
\(x_4\in M_4\) | \(P(x_4)=\frac{1}{2}-3u\) |
Событие | Наблюдаемое явление |
---|---|
\(x_1\in M_1\) | \(a\) |
\(x_2\in M_2\) | \(b\) |
\(x_3\in M_3\) | \(c\) |
\(x_4\in M_4\) | \(d\) |
Событие | Наблюдаемое явление |
---|---|
\(x_1,x_2\in \{M_1 || M_2\}\) | \(h\) |
\(x_3\in M_3\) | \(c\) |
\(x_4\in M_4\) | \(d\) |
E-шаг: Опираясь на предыдущую оценку \(u\), вычислим скрытую переменную \(b\) \[ b^{(k)}=\frac{u^{(k-1)}}{\frac{1}{2}+u^{(k-1)}}h. \]
М-шаг: Теперь, учитывая полученную оценку \(b\), найдем оценку максимального правдоподобия параметра \(u\): \[ u^{(k)}=\frac{b^{(k)}+c}{6(b^{(k)}+c+d)}. \] Приведем иллюстрацию ЕМ-алгоритма.
Графическая интерпретация одной итерации EМ-алгоритма.
Тогда \[ p\left( {x|\theta _i } \right) = p(x)P\left( {\left. {\theta _i } \right|x} \right) = \omega _i p_i (x). \] Апостериорную вероятность \(P\left( {\left. {\theta _i } \right|x} \right)\) того, что наблюдение \(x_j\) получено из i-й компоненты смеси, обозначим через \(g_{i,j}\). Из формулы полной вероятности выпишем условие нормировки \[ \sum_{i = 1}^k {g_{i,j} = 1,j = 1,...,n.} \] Тогда при известных \(\omega _i \) и \(p_i (x_j )\) из теоремы Байеса легко получить \[ g_{i,j} = \frac{\omega _i p_i (x_j )}{\sum\nolimits_{\nu = 1}^k {\omega _\nu p_\nu (x_j )} },i = 1,...k,j = 1,...,n. \] Функция \[ F\left( \Theta \right) = \prod_{j = 1}^n {p(x_j |\theta _i )} \] называется функцией правдоподобия от \(\Theta = \left\{ {\left( {\omega _i ,\theta _i } \right)} \right\}_{i = 1}^k \) по выборке \(X = \left\{ {x_1,...,x_n } \right\}\).
Начальное приближение.
Результат первой итерации.
Что получилось после шестой итерации.
Результат применения двадцати итераций
x | 0 | 1 | 2 | 3 | 3 | 3 | 6 | 10 | 4 | 0 |
---|---|---|---|---|---|---|---|---|---|---|
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
g_0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
---|---|---|---|---|---|---|---|---|---|---|
g_1 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
P | 0.005283916006 | 0.05934794968 | 0.2421790495 | 0.3593770365 | 0.2338353195 | 0.2082958290 | 0.9337804754 | 0.7809344621 | 0.3384793202 | 0.03707425040 |
---|---|---|---|---|---|---|---|---|---|---|
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
g_0 | 0.9999999994 | 0.9999999158 | 0.9999901639 | 0.9990458670 | 0.9284007156 | 0.1618314989 | 0.003445026 | 0.0000744 | 0.00000193 | 0.00000006 |
---|---|---|---|---|---|---|---|---|---|---|
g_1 | 0.0000000006 | 0.0000000842 | 0.00000983 | 0.0009541 | 0.07159928445 | 0.8381685009 | 0.9965549736 | 0.9999255828 | 0.9999980734 | 0.9999999401 |
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
К-во элементов смеси |
В качестве примера, приведем определение, при заданной относительной точности, количества сегментов для примера, рассмотренного выше.