Формула полной вероятности и формулы Байеса
Формула Байеса: теория
Следствием правила умножения и формулы полной вероятности является формула Байеса, называемая также формулой гипотез.
Представим себе следующую ситуацию. До опыта о его услових можно было сделать ряд гипотез (в литературе можно также встретить их обозначение не буквой B, а буквой H), несовместных и образующих полную группу.
Вероятности гипотез до опыта (называемые также априорными вероятностями) заданы и равны
.
Теперь предположим, что опыт произведён и в его результате появилось событие A.
Как нужно пересмотреть вероятности гипотез с учётом этого факта?
Формула Байеса позволяет найти вероятность каждой из гипотез о том, в результате какого из событий, образующих полную систему, наступило событие A (или как часто говорят, найти апостериорные вероятности).
Поэтому формула Байеса представляет собой отношение произведения вероятности одного из событий системы на условную вероятность этого события относительно соответствующего события системы к полной вероятности наступления события A с учётом всех событий системы.
То есть, по формуле Байеса вероятность, как и в самых простых случаях, вычисляется как отношение "одного ко всем":
.
Видим, что знаменатель в этой формуле - ничто иное, как полная вероятность события A, а числители для каждого отдельного случая равны первому, второму, и так далее до n-го слагаемому суммы, находящейся в знаменателе.
|
|
Формула Байеса может быть также записана в виде
.
Формула Байеса: примеры решения задач
Пример 1. Имеются три урны; в первой 3 белых шара и 1 чёрный, во второй - 2 белых шара и 3 чёрных, в третьей - три белых шара. Некто подходит наугад к одной из урн и вынимает из неё один шар. Этот шар оказался белым. Найти послеопытные (апостериорные) вероятности того, что этот шар вынут из первой, второй, третьей урны.
Решение. Гипотезы:
- выбрана первая урна;
- выбрана вторая урна;
- выбрана третья урна.
Так как урна выбирается наугад, то априорные вероятности гипотез раны:
.
В результате опыта появилось событие A - из выбранной урны вынут белый шар.
Условные вероятности события A относительно каждой из гипотез:
, , .
Применяя формулу Байеса, находим апостериорные вероятности гипотез:
;
;
.
Пример 2. Пример с теми же лампочками, что и в примере 2. Пусть количество и качество электролампочек, поставляемых в магазины некоторого района, определены условиями примера 2. Купленная лампочка оказалась стандартной. Пользуясь формулой Байеса, найти вероятности гипотез о том, что лампочка была изготовлена на первом заводе, на втором, на третьем.
|
|
Решение. Итак, для каждой из гипотез в числителе должно быть произведение вероятности одного из событий системы на условную вероятность этого события относительно соответствующего события системы, а в знаменателе - полная вероятность собыия A.
Вероятность того, что купленная лампочка изготовлена на первом заводе и стандартна:
.
Вероятность того, что купленная лампочка изготовлена на втором заводе и стандартна:
.
Вероятность того, что купленная лампочка изготовлена на третьем заводе и стандартна:
.
Вычисляя по формуле Байеса, получаем:
- вероятность того, что купленная стандартная лампочка изготовлена на первом заводе
;
- вероятность того, что купленная стандартная лампочка изготовлена на втором заводе
;
- вероятность того, что купленная стандартная лампочка изготовлена на третьем заводе
.
Пример 3. До опыта об его условиях можно было сделать четыре гипотезы: , , , с вероятностями, равными, соответственно
;
;
;
.
В результате опыта появилось событие A, которое невозможно при гипотезах , и достоверно при гипотезах , . Найти апостериорные вероятности гипотез.
Решение. Условные вероятности гипотез:
;
.
По формуле Байеса получаем:
|
|
;
;
.
Пример 4. Расследуются причины авиационной катастрофы, о которых можно сделать четыре гипотезы: , , , . Согласно статистике вероятности гипотез составляют
;
;
;
.
Осмотр места катастрофы выявляет, что в её ходе произошло событие A - воспламенение горючего. Условные вероятности события A при гипотезах , , , , согласно той же статистике равны
;
;
;
.
Найти апостериорные вероятности гипотез.
Решение. По формуле Байеса получаем:
.
;
;
.
Пример 5. В учреждении три чиновника готовят копии документов. Первый чиновник ( ) обрабатывает 40% всех форм, второй ( ) – 35%, третий ( ) – 25%. У первого чиновника удельный вес ошибок составляет 0,04, у второго – 0,06, у третьего – 0,03. В конце дня, выбрав случайно один из подготовленных документов, руководитель констатировал, что в нём есть ошибка (событие A). Пользуясь формулой Байеса, выяснить, какова вероятность, что ошибку допустил первый чиновник, второй, третий.
Решение. Обозначим события и их вероятности:
: {документ подготовил первый чиновник}
: {документ подготовил второй чиновник}
: {документ подготовил третий чиновник}
A: {в документе допущена ошибка}
Событие | ||||
0,40 | 0,04 | 0,0160 | 0,36 | |
0,35 | 0,06 | 0,0210 | 0,47 | |
0,25 | 0,03 | 0,0075 | 0,17 | |
Всего | 1,00 | - | 0,0445 | 1,00 |
По формуле Байеса находим:
|
|
Итак, вероятность того, что ошибку допустил первый чиновник, составляет 0,36, второй – 0,47, третий – 0,17.
Формула полной вероятности и формулы Байеса
Задача 5
На склад поступило 2 партии изделий: первая – 4000 штук, вторая – 6000 штук. Средний процент нестандартных изделий в первой партии составляет 20%, а во второй – 10%. Наудачу взятое со склада изделие оказалось стандартным. Найти вероятность того, что оно: а) из первой партии, б) из второй партии.
Первая часть решения состоит в использовании формулы полной вероятности. Иными словами, вычисления проводятся в предположении, что испытание ещё не произведено и событие «изделие оказалось стандартным» пока не наступило.
Рассмотрим две гипотезы:
– наудачу взятое изделие будет из 1-й партии;
– наудачу взятое изделие будет из 2-й партии.
Всего: 4000 + 6000 = 10000 изделий на складе. По классическому определению:
.
Контроль:
Рассмотрим зависимое событие: – наудачу взятое со склада изделие будет стандартным.
В первой партии 100% – 20% = 80% стандартных изделий, поэтому: – вероятность того, что наудачу взятое на складе изделие будет стандартным при условии, что оно принадлежит 1-й партии.
Аналогично, во второй партии 100% – 10% = 90% стандартных изделий и – вероятность того, что наудачу взятое на складе изделие будет стандартным при условии, что оно принадлежит 2-й партии.
По формуле полной вероятности:
– вероятность того, что наудачу взятое на складе изделие будет стандартным.
Часть вторая. Пусть наудачу взятое со склада изделие оказалось стандартным. Эта фраза прямо прописана в условии, и она констатирует тот факт, что событие произошло.
По формулам Байеса:
а) – вероятность того, что выбранное стандартное изделие принадлежит 1-й партии;
б) – вероятность того, что выбранное стандартное изделие принадлежит 2-й партии.
После переоценки гипотезы , разумеется, по-прежнему образуют полную группу:
(проверка ;-))
Ответ:
Задача 6
На склад поступило 2 партии изделий: первая – 4000 штук, вторая – 6000 штук. Средний процент нестандартных изделий в первой партии 20%, во второй – 10%. Наудачу взятое со склада изделие оказалось нестандартным. Найти вероятность того, что оно: а) из первой партии, б) из второй партии.
Условие отличатся двумя буквами, которые я выделил жирным шрифтом. Задачу можно решить с «чистого листа», или воспользоваться результатами предыдущих вычислений. В образце я провёл полное решение, но чтобы не возникло формальной накладки с Задачей №5, событие «наудачу взятое со склада изделие будет нестандартным» обозначено через .
Байесовская схема переоценки вероятностей встречается повсеместно, причём её активно эксплуатируют и различного рода мошенники. Рассмотрим ставшее нарицательным АО на три буквы, которое привлекает вклады населения, якобы куда-то их инвестирует, исправно выплачивает дивиденды и т.д. Что происходит? Проходит день за днём, месяц за месяцем и всё новые и новые факты, донесённые путём рекламы и «сарафанным радио», только повышают уровень доверия к финансовой пирамиде (апостериорная байесовская переоценка в связи с произошедшими событиями!). То есть, в глазах вкладчиков происходит постоянное увеличение вероятности того, что «это серьёзная контора»; при этом вероятность противоположной гипотезы («это очередные кидалы»), само собой, уменьшается и уменьшается. Дальнейшее, думаю, понятно. Примечательно, что заработанная репутация даёт организаторам время успешно скрыться от Ивана Васильевича, который остался не только без партии болтов, но и без штанов.
К не менее любопытным примерам мы вернёмся чуть позже, а пока на очереди, пожалуй, самый распространенный случай с тремя гипотезами:
Задача 7
Электролампы изготавливаются на трех заводах. 1-й завод производит 30% общего количества ламп, 2-й – 55%, а 3-й – остальную часть. Продукция 1-го завода содержит 1% бракованных ламп, 2-го – 1,5%, 3-го – 2%. В магазин поступает продукция всех трех заводов. Купленная лампа оказалась с браком. Какова вероятность того, что она произведена 2-м заводом?
Заметьте, что в задачах на формулы Байеса в условии обязательно фигурирует некое произошедшее событие, в данном случае – покупка лампы.
Событий прибавилось, и решение удобнее оформить в «быстром» стиле.
Алгоритм точно такой же: на первом шаге находим вероятность того, что купленная лампа вообще окажется бракованной.
Пользуясь исходными данными, переводим проценты в вероятности:
– вероятности того, что лампа произведена 1-м, 2-м и 3-м заводами соответственно.
Контроль:
Аналогично: – вероятности изготовления бракованной лампы для соответствующих заводов.
По формуле полной вероятности:
– вероятность того, что купленная лампа окажется с браком.
Шаг второй. Пусть купленная лампа оказалась бракованной (событие произошло)
По формуле Байеса:
– вероятность того, что купленная бракованная лампа изготовлена вторым заводом
Ответ:
Почему изначальная вероятность 2-й гипотезы после переоценки увеличилась ? Ведь второй завод производит средние по качеству лампы (первый – лучше, третий – хуже). Так почему же возросла апостериорная вероятность, что бракованная лампа именно со 2-го завода? Это объясняется уже не «репутацией», а размером. Так как завод №2 выпустил самое большое количество ламп, то на него (по меньшей мере, субъективно) и пеняют: «скорее всего, эта бракованная лампа именно оттуда».
Интересно заметить, что вероятности 1-й и 3-й гипотез, переоценились в ожидаемых направлениях и сравнялись:
Контроль: , что и требовалось проверить.
К слову, о заниженных и завышенных оценках:
Задача 8
В студенческой группе 3 человека имеют высокий уровень подготовки, 19 человек – средний и 3 – низкий. Вероятности успешной сдачи экзамена для данных студентов соответственно равны: 0,95; 0,7 и 0,4. Известно, что некоторый студент сдал экзамен. Какова вероятность того, что:
а) он был подготовлен очень хорошо;
б) был подготовлен средне;
в) был подготовлен плохо.
Проведите вычисления и проанализируйте результаты переоценки гипотез.
Задача приближена к реальности и особенно правдоподобна для группы студентов-заочников, где преподаватель практически не знает способностей того или иного студента. При этом результат может послужить причиной довольно-таки неожиданных последствий (особенно это касается экзаменов в 1-м семестре). Если плохо подготовленному студенту посчастливилось с билетом, то преподаватель с большой вероятностью сочтёт его хорошо успевающим или даже сильным студентом, что принесёт неплохие дивиденды в будущем (естественно, нужно «поднимать планку» и поддерживать свой имидж). Если же студент 7 дней и 7 ночей учил, зубрил, повторял, но ему просто не повезло, то дальнейшие события могут развиваться в самом скверном ключе – с многочисленными пересдачами и балансировкой на грани вылета.
Дата добавления: 2021-05-18; просмотров: 1739; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!