АКСИОМЫ ВЕРОЯТНОСТЕЙ

До сих пор в этой главе был определен синтаксис для высказываний, а также для априорных и условных вероятностных утверждений об этих высказываниях. Теперь необходимо определить своего рода семантику для вероятностных утверждений. Начнем с базовых аксиом, которые служат для определения шкалы вероятностей и ее конечных точек, как описано ниже.
1. Все вероятности находятся в пределах от 0 до 1; для любого высказывания а справедливо следующее:
О < Р(а) < 1
2. Безусловно истинные (т.е. выполнимые) высказывания имеют вероятность 1,
а безусловно ложные (т.е. невыполнимые) высказывания имеют вероятность 0:
P(true) = 1 Р(false) = 0
Кроме того, требуется аксиома, которая соединяет вероятности логически взаимосвязанных высказываний. Такую аксиому можно проще всего составить, определив вероятность дизъюнкции, как показано ниже.
3. Вероятность дизъюнкции задается следующей формулой:
Р(а v Ь) = Р(а) + P(b) - Р(а л Ь)
Это правило можно легко запомнить, отметив, что те случаи, когда высказывание а является истинным, вместе с теми случаями, когда Ь является истинным, безусловно, охватывают все те случаи, когда истинно высказывание a v Ь; но в сумме двух множеств случаев их пересечение встречается дважды, поэтому необходимо вычесть Р(а л Ь).
Эти три аксиомы часто называют аксиомами Колмогорова в честь советского математика Андрея Колмогорова, который показал, как построить остальную часть теории вероятностей на этом простом фундаменте. Обратите внимание на то, что в этих аксиомах речь идет только об априорных вероятностях, а не об условных; это связано с тем, что последние уже были определены в терминах первых в уравнении 13.1.
Использование аксиом вероятностей
Из этих основных аксиом можно вывести целый ряд полезных фактов. Например, знакомое правило отрицания следует из подстановки -на вместо Ь в аксиому 3, что приводит к получению следующего выражения:

P{a v —ia) = Р(а) + Р(—<а) - Р(а л —ia) (согласно аксиоме 3 с Ъ = -па)
P(fcrue) = Р(а) + Р(—ia) - Р(false) согласно правилу логической
эквивалентности)
1 = Р(а) + P(-ia) согласно аксиоме 2)
Р(—i«a) = 1 - Р(а) (согласно алгебраическому
определению)
Третья строка этого логического вывода сама является полезным фактом и может быть распространена с данного булева случая на общий дискретный случай. Допустим, что дискретная переменная D имеет область определения . Тогда можно легко показать (упр. 13.2), что справедлива следующая формула:
п
P(D=di) = 1
i = l
Это означает, что любое вероятностное распределение по одной переменной должно в сумме6 составлять 1. Справедливо также утверждение, что любое совместное распределение вероятностей по любому множеству переменных должно в сумме составлять 1; в этом можно убедиться, создав одну мегапеременную, областью определения которой является перекрестное произведение областей определения первоначальных переменных.
Напомним, что любое высказывание а эквивалентно дизъюнкции всех атомарных событий, в которых а является истинным; назовем эту дизъюнкцию множеством событий е (а). Напомним также, что атомарные события являются взаимно исключающими, поэтому вероятность любой конъюнкции атомарных событий равна нулю, согласно аксиоме 2. Таким образом, из аксиомы 3 можно вывести следующее простое соотношение: вероятность любого высказывания равна сумме вероятностей атомарных событий, в которых оно является истинным; т.е. вывести такое уравнение:
Р(а) = ]Г P(ei) (13.2)
Это уравнение предоставляет простой метод вычисления вероятности любого высказывания при наличии полного совместного распределения, которое задает вероятности всех атомарных событий (см. раздел 13.4.) В следующих разделах будут выведены дополнительные правила для манипулирования вероятностями. Но вначале исследуем теоретические основы самих этих аксиом.







Материалы

Яндекс.Метрика