СЕМАНТИКА БАЙЕСОВСКИХ СЕТЕЙ

В предыдущем разделе описано, какой должна быть байесовская сеть, но не указано, что означает эта сеть. Существуют два способа, позволяющих понять семантику байесовских сетей. Первый из них состоит в том, что сеть следует считать одним из представлений совместного распределения вероятностей, а второй — в том, что она должна рассматриваться как описание совокупности утверждений об условной независимости. Эти две трактовки являются эквивалентными, но первая оказалась более полезной при определении способа составления сетей, а вторая — более применимой при проектировании процедур вероятностного вывода.
Представление полного совместного распределения
Любая байесовская сеть представляет собой полное описание рассматриваемой проблемной области. Каждый элемент в полном совместном распределении вероятностей (которое ниже будет сокращенно именоваться "совместным распределением") может быть рассчитан на основании информации, представленной в этой сети. Универсальным элементом в совместном распределении является вероятность конъюнкции конкретных присваиваний значений каждой переменной, такой как P(Xi=xi л ... л хп=хп). В качестве сокращенного обозначения для такой конъюнкции будет использоваться выражение P(xlf..., хп). Значение этого элемента задается следующей формулой:
п
P(xi, хп) = Y\ P(xi\parents(Xi) ) (14.1)
i = l
где parents(ХО обозначает конкретные значения переменных в множестве вершин Parents (Xi). Поэтому каждый элемент в совместном распределении представлен в виде произведения соответствующих элементов в таблицах условных вероятностей (Conditional Probability Table — СРТ) байесовской сети. Таким образом, таблицы СРТ обеспечивают декомпонованное представление совместного распределения.
Для иллюстрации описанных выше понятий рассчитаем вероятность того, что прозвучал тревожный сигнал, но не произошли ни взлом, ни землетрясение, а позвонили и Мэри, и Джон. Мы будем использовать однобуквенные имена для этих переменных (см. рис. 14.2):
P{j л m л а л -ib л -ie)
= P{j\a) P{m\a) P{a\-ib л -ie) P(-ib) P(-.e)
= 0.90 x 0.70 x 0.001 x 0.999 x 0.998 = 0.00062
В разделе 13.4 было описано, как можно использовать полное совместное распределение для получения ответа на любой запрос о данной проблемной области. А если байесовская сеть служит представлением совместного распределения, то может также применяться для получения ответа на любой запрос путем суммирования соответствующих элементов совместного распределения. В разделе 14.4 показано, как найти ответ с помощью такого способа, а также описаны методы, которые являются гораздо более эффективными.
Метод составления байесовских сетей
В уравнении 14.1 показано, что означает данная конкретная байесовская сеть. Но это уравнение не позволяет определить, как следует составлять байесовскую сеть таким образом, чтобы результирующее совместное распределение служило адекватным представлением данной проблемной области. Тем не менее в этом разделе будет показано, что из уравнения 14.1 следуют определенные отношения условной независимости, которые могут использоваться инженером по знаниям в качестве руководящих указаний при составлении топологии сети. Вначале перезапишем это совместное распределение в терминах условных вероятностей с использование правила произведения (см. главу 13):
P(Xi, Хп) = Р(ХП|ХП_1, Xi)P(xn-l, Xi)
Затем повторим этот процесс, приводя каждую конъюнктивную вероятность к условной вероятности и меньшей конъюнкции. В конечном итоге будет получено одно большое произведение:
P(Xi, Хп) = Р(Хп|хп-1, Xi) Р(хп-1 |хп-2, Xi)... Р (Х2 | Xi) Р (Xi)
п
= y\ p(xi i Xi-i> xi)
i = l
Это тождество справедливо для любого множества случайных переменных и называется цепным правилом (chain rule). Сравнивая его с уравнением 14.1, можно обнаружить, что данная спецификация совместного распределения эквивалентна общему утверждению, что для каждой переменной Xi в сети верно следующее:
PUi|Xi-i, Xi) = P(Xi I Parents (Xi) ) (14.2)
при условии, что Parents{XL) с { Xi_lf ...,X1 }. Это последнее условие можно выполнить, разметив вершины графа в любом порядке, совместимом с частичным упорядочением, неявно заданным в структуре графа.
Фактически уравнение 14.2 свидетельствует о том, что байесовская сеть служит правильным представлением проблемной области, только если каждая вершина в ней условно независима от ее предшественников в конкретном упорядочении вершин, после того как заданы ее родительские вершины. Поэтому, для того чтобы составить байесовскую сеть с правильной структурой для рассматриваемой проблемной области, необходимо выбрать для каждой вершины родительские вершины так, чтобы соблюдалось это свойство. Интуитивно ясно, что множество родительских вершин вершины Xi должно включать все такие вершины из множества xlf..., х.ъ которые zw=* непосредственно влияют на Xi. Например, предположим, что мы полностью составили сеть, показанную на рис. 14.2, и осталось только выбрать родительские вершины для MaryCalls. Безусловно, на вершину MaryCalls оказывает влияние то, произошло ли событие Burglary или Earthquake, но это — не непосредственное влияние. Очевидно, что наши знания в этой проблемной области говорят о том, что эти события влияют на поведение Мэри, касающееся звонков, только через свое воздействие на тревожный сигнал. Кроме того, если речь идет о наличии тревожного сигнала, то звонок Джона не влияет на звонок Мэри. Формально говоря, составляя эту сеть, мы уверены в том, что справедливо следующее утверждение об условной независимости:
Р [MaryCalls] JohnCalls, Alarm, Earthquake, Burglary) -P {MaryCalls | Alarm)







Материалы

Яндекс.Метрика