ПРАВИЛО БАЙЕСА И ЕГО ИСПОЛЬЗОВАНИЕ

На с. 632 определено правило произведения и указано, что оно может быть записано в двух следующих формах благодаря коммутативности конъюнкции:
Р(а л Ъ) = P(a\b)P(b) Р(а л b) = P{b\a) Р(а)
Приравняв две правые части стороны и разделив их на Р(<а), получим такое уравнение:
P(a\b)P(b)
Р(Ь1а) = Рй) (13'9)
Это уравнение известно под названием правила Байеса (а также закона Байеса, или теоремы Байеса)9. Это простое уравнение лежит в основе всех современных систем искусственного интеллекта для вероятностного вывода. Более общий случай многозначных переменных может быть записан в системе обозначений Р следующим образом:
Это уравнение также следует рассматривать как представляющее множество уравнений, в каждом из которых рассматриваются конкретные значения переменных. Время от времени нам также придется использовать более общую версию, которая обусловлена некоторым фоновым свидетельством е:
Применение правила Байеса: простой случай
На первый взгляд правило Байеса не кажется очень полезным. В нем требуются три терма (одна условная вероятность и две безусловных вероятности) только для вычисления одной условной вероятности.
Но правило Байеса находит очень широкое практическое применение, поскольку во многих случаях имеются хорошие оценки вероятностей для этих трех термов и нужно вычислить четвертый. В такой задаче, как медицинская диагностика, часто известны условные вероятности причинных связей и требуется определить диагноз. Врач знает, что такое заболевание, как менингит, очень часто вызывает у пациента симптом, характеризующийся снижением подвижности шеи; предположим, что этот симптом наблюдается в 50% случаев. Кроме того, врачу известны некоторые безусловные факты: априорная вероятность того, что некоторый пациент имеет менингит, равна 1/50 ООО, а априорная вероятность того, что некоторый пациент имеет неподвижную шею, равна 1/20. Предположив, что s — высказывание, согласно которому пациент имеет неподвижную шею, а т — высказывание, что пациент имеет менингит, получим следующее:
P(s\m) = 0.5 P(m) = 1/50000 P(s) = 1/20
P(s\m)P(m) 0.5 x 1/50000
P(m\s) = jj = 520 = 0.0002
Итак, следует предполагать, что 1 из 500 0 пациентов с неподвижной шеей имеет менингит. Следует отметить, что даже если неподвижная шея является весьма надежным показателем наличия менингита (с вероятностью 0,5), сама вероятность наличия менингита у пациента остается низкой. Это связано с тем, что априорная вероятность наличия симптома неподвижной шеи намного выше по сравнению с вероятностью менингита.
В разделе 13.4 показан процесс, с помощью которого можно избежать необходимости оценки вероятности свидетельства (в данном случае P(s)), вместо этого вычислив апостериорную вероятность для каждого значения переменной запроса (в данном случае т и —im), а затем нормализовав результаты. Тот же процесс можно применить при использовании правила Байеса. Таким образом, мы имеем:
P(M|s) = a
Итак, чтобы воспользоваться этим подходом, необходимо вместо P(s) вычислить значение P{s\-im). Осуществление такого подхода требует определенных затрат; иногда эти затраты не столь велики, а иногда становятся довольно значительными. Общая форма правила Байеса с нормализацией является таковой:
P{Y\X) = a P{X\Y)P{Y) (13.11)
где ос — константа нормализации, необходимая для того, чтобы записи в распределении р (Y\x) в сумме составляли 1.
Один из очевидных вопросов, касающихся правила Байеса, состоит в том, почему может оказаться доступной условная вероятность, реализуемая в одном направлении, но не в другом. В проблемной области лечения менингита, возможно, врач знает, что из симптома неподвижной шеи следует наличие менингита в 1 из 5000 случаев; это означает, что врач имеет количественную информацию в диагностическом направлении, от симптомов к причинам. Для такого врача не требуется использование правила Байеса. К сожалению, диагностические знания часто встречаются намного реже по сравнению с причинными знаниями. Если внезапно возникает эпидемия менингита, то безусловная вероятность менингита, Р(т), повышается. Врач, который вывел диагностическую вероятность P(m\s) непосредственно из статистических наблюдений за пациентами перед эпидемией, не будет иметь представления о том, как обновить это значение, а врач, который вычисляет Р (т \ s) из других трех значений, обнаружит, что значение Р(т \ s) должно увеличиваться пропорционально Р{т). Еще более важно то, что причинная информация p(s\m) остается незатронутой данной эпидемией, поскольку она просто показывает, в чем выражается действие менингита. Использование такого рода прямых причинных знаний, или знаний, основанных на модели, позволяет достичь надежности, которая крайне важна при создании вероятностных систем, применимых в реальном мире.







Материалы

Яндекс.Метрика