Условная вероятность

После того как агент получает определенное свидетельство, касающееся ранее неизвестных случайных переменных, составляющих рассматриваемую проблемную область, априорные вероятности становятся больше не применимыми. Вместо этого должны использоваться условные, или апостериорные, вероятности. При этом используется обозначение5 Р(а\Ь), где а и Ь — любые высказывания. Это обозначение читается как "вероятность а, при условии, что все, что нам известно, — это Ь". Например, следующее выражение:
Р(cavity\ toothache) = 0.8
показывает, что если наблюдается пациент, имеющий зубную боль, и еще не получена какая-либо иная информация, то вероятность наличия у этого пациента дупла в зубе составляет 0,8. Априорная вероятность, такая как Р (cavity), может рассматриваться как частный случай условной вероятности, P{cavi ty \ ), где условием вероятности является отсутствие свидетельства.
Условные вероятности могут быть определены в терминах безусловных вероятностей. Таким определяющим уравнением является следующее, которое остается истинным, если Р(Ь) > 0:
Р(а л Ь)
Р(а\Ь) = р[Ъ) (13.1)
Это уравнение может быть также записано следующим образом и в таком виде называется правилом произведения:
Р(а л b) = P(a\b)P(b)
По-видимому, правило произведения запомнить проще; оно основано на таком факте: для того чтобы а и Ь были истинными, необходимо, чтобы Ь было истинным,

а также необходимо, чтобы а было истинным, если дано Ь. Такое же утверждение можно выразить иначе:
Р(а л Ь) = Р(Ь\а)Р(а)
В некоторых случаях проще формировать рассуждения в терминах априорных вероятностей конъюнкций, но чаще всего мы в качестве своего основного инструмента для вероятностного логического вывода будем использовать условные вероятности.
Кроме того, для условных распределений может использоваться обозначение Р. Выражение Р (x\ У) задает значения выражения P(X=Xi | У=у) для каждой возможной комбинации i, j. В качестве примера того, что с помощью векторного обозначения можно добиться сокращения размеров формул, рассмотрим, как применяется правило произведения к каждому случаю, когда высказывания а и Ь, соответственно, подтверждают конкретные значения переменных X и У. При этом будут получены следующие уравнения:
Р(Х = х1 л Y = yi) = Р(Х = xi | Y = у!)Р(У = yi) Р(Х = х1 л У = у2) = Р(Х = xi\y = у2)Р(У = у2)
Все эти уравнения можно объединить в такое единственное уравнение:
Р(Х, У) = Р(Х| У) Р ( У)
Следует учитывать, что это уравнение обозначает множество уравнений, которые связывают между собой соответствующие отдельные записи в таблицах распределения вероятностей, а не выражает матричное умножение этих таблиц.
Было бы соблазнительно, но неправильно рассматривать условные вероятности как логические следствия с оценкой неопределенности. Например, высказывание Р( а | Ь) = 0 . 8 нельзя интерпретировать в том смысле, что "если Ь истинно, из этого следует вывод, что вероятность Р(а) равна 0,8". Такая интерпретация была бы неправильной в двух отношениях: во-первых, р (а) всегда обозначает априорную вероятность а, но не апостериорную вероятность, полученную с учетом некоторого свидетельства; во-вторых, само утверждение Р(а\Ь) = 0.8 непосредственно относится к делу, только если Ь — единственное доступное свидетельство. Как только становится доступной дополнительная информация с, степень уверенности в истинности а становится равной Р(а\Ь л с), а это значение может быть почти не связанным со значением Р{а\Ь). Например, в высказывании с может быть непосредственно указано, является ли а истинным или ложным. Если врач обследует пациента, который жалуется на зубную боль, и обнаруживает дупло, то получает дополнительное свидетельство cavi tyn составляет логический вывод (тривиальный), что Р( cavi ty\ toothache л cavity) =1.0.







Материалы

Яндекс.Метрика