УПРАЖНЕНИЯ

13.1. Докажите на основании основных принципов, что Р(а\Ь А а) = 1.
13.2. С использованием аксиом вероятностей докажите, что любое распределение вероятностей дискретной случайной переменной должно в сумме составлять 1.
13.3. Было бы рациональным для агента придерживаться трех убеждений — Р(А) - 0.4, Р(В) = 0.3иР(А v В) = 0 . 5? Если это так, то какой диапазон вероятностей был бы рациональным для агента применительно к А л Б? Составьте таблицу, подобную приведенной в табл. 13.1, и покажите, подтверждает ли она ваши доводы в отношении рациональности. Затем составьте еще одну версию этой таблицы, в которой Р(А V В) =0.7. Объясните, почему рационально иметь уверенность в наличии этой вероятности, даже несмотря на то, что таблица показывает один случай, который соответствует проигрышу, и три случая, в которых достигается ничья. (Подсказка. Какие обязательства взял на себя агент 1 применительно к вероятности каждого из четырех случаев, в частности, того случая, когда имеет место проигрыш?)
13.4. Этот вопрос касается свойств атомарных событий, как описано на с. 629.
а) Докажите, что дизъюнкция всех возможных атомарных событий логиче-
ски эквивалентна значению true. (Подсказка. Используйте доказатель-
ство по индукции, которое распространяется на произвольное количест-
во случайных переменных.)
б) Докажите, что любое высказывание логически эквивалентно дизъ-
юнкции атомарных событий, из которых следует истинность этого
высказывания.
13.5. Рассмотрите проблемную область, в которой речь идет о раздаче в покере на
руки по 5 карт из стандартной колоды в 52 карты, на основе предположения,
что раздача проводится честно.
а) Каково количество атомарных событий в совместном распределении ве-
роятностей (т.е. каково количество различных раздач по 5 карт)?
б) Какова вероятность каждого атомарного события?
в) Какова вероятность получения королевского флеша стрит? Четырех ко-
ролей?
13.6. Исходя из полного совместного распределения, приведенного в табл. 13.2,
вычислите следующее:
а) Р( toothache)
б) Р (С a vi ty)
в) Р ( Toothache \ cavi ty)
г) Р ( Cavi ty I toothache v catch)
13.7. Покажите, что три формы описания свойства независимости, приведенные в уравнении 13.8, являются эквивалентными.
13.8. После ежегодного медицинского осмотра некоторого пациента у врача есть плохая новость и хорошая новость. Плохая новость состоит в том, что оказалась положительной проверка на наличие серьезного заболевания и что точность результатов проверки составляет 99% (это означает, что вероятность получения положительного результата проверки, если пациент имеет это заболевание, равна 0,99, и такова же вероятность получения отрицательных результатов проверки, если пациент не имеет этого заболевания). Хорошая новость состоит в том, что это заболевание — редкое и поражает только 1 из 10 ООО людей того возраста, в котором находится пациент. Почему новость, что это заболевание редкое, названа хорошей? Каковы шансы на то, что пациент действительно имеет данное заболевание?
13.9. Очень часто бывает полезно рассмотреть результаты некоторых конкретных высказываний в контексте определенного общего фонового свидетельства, которое остается неизменным, а не действовать в условиях полного отсутствия информации. В приведенных ниже вопросах предлагается доказать более общие версии правила произведения и правила Байеса применительно к некоторому фоновому свидетельству е.
а) Докажите версию общего правила произведения с условными вероятно-
стями:
Р(Х, У|е) = Р(х|у, е) Р(У|е)
б) Докажите версию правила Байеса из уравнения 13.10 с условными веро-
ятностями.
13.10. Покажите, что утверждение
Р(А,В\С) = Р(А|С) Р(В|С)
эквивалентно любому из следующих утверждений:
Р(Л|В,С) = Р(А|С) И Р(В|Л,С) = Р(В|С)
13.11. Допустим, что вам вручили мешок, содержащий п подлинных монет, и сообщили, что п-1 из этих монет являются нормальными, такими, что с одной
стороны имеется орел, с другой — решка, а одна монета — фальшивая, и с
обеих ее сторон имеется орел.
а) Предположим, что вы открыли мешок, случайным образом выбрали мо-
нету, не пытаясь определить ее свойства, подбросили ее, после чего вы-
пал орел. Какова (условная) вероятность того, что выбранная вами моне-
та является фальшивой?
б) Предположим, что вы продолжаете подбрасывать монету всего к раз по-
сле того, как ее выбрали, и обнаруживаете к выпадений орла. Какова те-
перь условная вероятность того, что вы выбрали фальшивую монету?
в) Предположим, что вы хотите принять решение в отношении того, явля-
ется ли выбранная монета фальшивой, подбросив ее к раз. Процедура
принятия решения возвращает FAKE (Фальшивая), если все к бросков приводят к выпадению орла, а в противном случае возвращает NORMAL (Нормальная). Какова (безусловная) вероятность того, что эта процедура допускает ошибку?
13.12. В этом упражнении предлагается выполнить вычисление коэффициента нормализации для примера с менингитом. Вначале выберите подходящее значение для P{S\-iM) и примените его для вычисления ненормализованных значений Р(м\ S) и р(-лМ\ S) (т.е. игнорируя терм P(S) в выражении правила Байеса). Теперь нормализуйте эти значения таким образом, чтобы они в сумме составляли 1.
13.13. В этом упражнении исследуется то, как влияют соотношения, касающиеся условной независимости на количество информации, требуемой для вероятностных вычислений.
а) Предположим, что необходимо рассчитать значение P(h\ elf е2), а ин-
формация об условной независимости отсутствует. Какие из следующих
множеств чисел являются достаточными для такого вычисления?
1. V{E1,E2)9V(H),V(E1\H),V(E2\H)
2. P(ElfE2) ,Р(Н) yP(EltE2\H)
3. В(Н) (ЕН) ,-Р(Е2\Н)
б) Предположим, известно, что Р (ЕХ \ н, Е2) =Р (ЕХ \ Н) для всех значений я,
Е1? Е2. Какое из этих трех множеств значений теперь будет достаточным?
13.14. Допустим, что X, Y, z — булевы случайные переменные. Обозначьте восемь элементов в совместном распределении Р (X, Y, Z) буквами алфавита от а до п. Выразите утверждение, что Хи у являются условно независимыми, если дано Z, в виде множества уравнений, связывающих элементы от а до п. Сколько среди них неизбыточных уравнений?
13.15. (Адаптировано из [1191].) Предположим, что вы — свидетель ночного наезда на пешехода в Афинах с участием такси, виновник которого уехал с места происшествия. Все такси в Афинах покрашены в синий или зеленый цвет. Вы поклялись под присягой, что такси было синим, а результаты широких экспериментов показывают, что в условиях плохого освещения надежность распознавания синего и зеленого цветов составляет 75%. Возможно ли рассчитать наиболее вероятный цвет этого такси? (Подсказка. Тщательно проведите различие между высказыванием, что такси — синего цвета, и высказыванием, что оно внешне казалось синим.)
А что можно сказать, получив информацию о том, что в Афинах 9 из 10 такси имеют зеленый цвет?
13.16. (Адаптировано из [1191].) Три заключенных, А, в и С, заперты в своих камерах.
Всем известно, что один из них завтра будет казнен, а другие помилованы.
Но только губернатор знает, кто именно будет казнен. Заключенный А просит ох-
ранника об одолжении: "Пожалуйста, узнайте у губернатора, кто будет казнен,
а затем передайте сообщение одному из моих друзей, в или С, чтобы он знал, что
утром будет помилован". Охранник соглашается, а после возвращения говорит за-
ключенному А, что передал сообщение о помиловании заключенному в.
Каковы шансы заключенного А на то, что он будет казнен, при наличии этой информации? (Ответьте на этот вопрос с помощью математики, а не энергичной жестикуляции.)
13.17. Напишите общий алгоритм получения ответов на запросы в форме Р (Cause|е) с использованием наивного байесовского распределения. Вы должны исходить из предположения, что свидетельство е может присваивать значения любому подмножеству переменных результата.
13.18. Категоризацией текста называется задача присваивания данному конкретному документу одной из фиксированного множества категорий на основе анализа содержащегося в нем текста. Для решения этой задачи часто используются наивные байесовские модели. В этих моделях переменной запроса является категория документа, а в качестве переменных "результата" рассматривается наличие или отсутствие каждого слова из языка документа; основное предположение состоит в том, что слова в документах встречаются независимо друг от друга, а их частоты определяются категорией документа.
а) Объясните точно, как можно сформировать такую модель, получив в ка-
честве "обучающих данных" множество документов, которые были рас-
пределены по категориям.
б) Объясните точно, как следует определять категорию нового документа.
в) Является ли указанное предположение о независимости обоснованным?
Обсудите этот вопрос.
13.19. В проведенном в данной главе анализе мира вампуса использовался тот факт,
что каждый квадрат содержит яму с вероятностью 0,2, независимо от содер-
жимого других квадратов. Вместо этого примите предположение, что точно
N/5 ям разбросаны равномерно случайным образом среди N квадратов, от-
личных от [1,1]. Остаются ли переменные Pi(j и ркД все еще независимы-
ми? Каково теперь совместное распределение P(P1j1,...,p4(4)? Снова прове-
дите вычисления вероятностей наличия ям в квадратах [1,3] и [2,2].







Материалы

Яндекс.Метрика