Формула полной вероятности и формулы Байеса

Формула Байеса: теория

Следствием правила умножения и формулы полной вероятности является формула Байеса, называемая также формулой гипотез.

Представим себе следующую ситуацию. До опыта о его услових можно было сделать ряд гипотез (в литературе можно также встретить их обозначение не буквой B, а буквой H), несовместных и образующих полную группу.

Вероятности гипотез до опыта (называемые также априорными вероятностями) заданы и равны

.

Теперь предположим, что опыт произведён и в его результате появилось событие A.

Как нужно пересмотреть вероятности гипотез с учётом этого факта?

Формула Байеса позволяет найти вероятность каждой из гипотез о том, в результате какого из событий, образующих полную систему, наступило событие A (или как часто говорят, найти апостериорные вероятности).

Поэтому формула Байеса представляет собой отношение произведения вероятности одного из событий системы на условную вероятность этого события относительно соответствующего события системы к полной вероятности наступления события A с учётом всех событий системы.

То есть, по формуле Байеса вероятность, как и в самых простых случаях, вычисляется как отношение "одного ко всем":

.

Видим, что знаменатель в этой формуле - ничто иное, как полная вероятность события A, а числители для каждого отдельного случая равны первому, второму, и так далее до n-го слагаемому суммы, находящейся в знаменателе.

Формула Байеса может быть также записана в виде

.

Формула Байеса: примеры решения задач

Пример 1. Имеются три урны; в первой 3 белых шара и 1 чёрный, во второй - 2 белых шара и 3 чёрных, в третьей - три белых шара. Некто подходит наугад к одной из урн и вынимает из неё один шар. Этот шар оказался белым. Найти послеопытные (апостериорные) вероятности того, что этот шар вынут из первой, второй, третьей урны.

Решение. Гипотезы:

- выбрана первая урна;

- выбрана вторая урна;

- выбрана третья урна.

Так как урна выбирается наугад, то априорные вероятности гипотез раны:

.

В результате опыта появилось событие A - из выбранной урны вынут белый шар.

Условные вероятности события A относительно каждой из гипотез:

, , .

Применяя формулу Байеса, находим апостериорные вероятности гипотез:

;

;

.

Пример 2. Пример с теми же лампочками, что и в примере 2. Пусть количество и качество электролампочек, поставляемых в магазины некоторого района, определены условиями примера 2. Купленная лампочка оказалась стандартной. Пользуясь формулой Байеса, найти вероятности гипотез о том, что лампочка была изготовлена на первом заводе, на втором, на третьем.

Решение. Итак, для каждой из гипотез в числителе должно быть произведение вероятности одного из событий системы на условную вероятность этого события относительно соответствующего события системы, а в знаменателе - полная вероятность собыия A.

Вероятность того, что купленная лампочка изготовлена на первом заводе и стандартна:
.

Вероятность того, что купленная лампочка изготовлена на втором заводе и стандартна:
.

Вероятность того, что купленная лампочка изготовлена на третьем заводе и стандартна:
.

Вычисляя по формуле Байеса, получаем:

- вероятность того, что купленная стандартная лампочка изготовлена на первом заводе
;

- вероятность того, что купленная стандартная лампочка изготовлена на втором заводе
;

- вероятность того, что купленная стандартная лампочка изготовлена на третьем заводе
.

Пример 3. До опыта об его условиях можно было сделать четыре гипотезы: , , , с вероятностями, равными, соответственно

;

;

;

.

В результате опыта появилось событие A, которое невозможно при гипотезах , и достоверно при гипотезах , . Найти апостериорные вероятности гипотез.

Решение. Условные вероятности гипотез:

;

.

По формуле Байеса получаем:

;

;

.

Пример 4. Расследуются причины авиационной катастрофы, о которых можно сделать четыре гипотезы: , , , . Согласно статистике вероятности гипотез составляют

;

;

;

.

Осмотр места катастрофы выявляет, что в её ходе произошло событие A - воспламенение горючего. Условные вероятности события A при гипотезах , , , , согласно той же статистике равны

;

;

;

.

Найти апостериорные вероятности гипотез.

Решение. По формуле Байеса получаем:

.

;

;

.

Пример 5. В учреждении три чиновника готовят копии документов. Первый чиновник ( ) обрабатывает 40% всех форм, второй ( ) – 35%, третий ( ) – 25%. У первого чиновника удельный вес ошибок составляет 0,04, у второго – 0,06, у третьего – 0,03. В конце дня, выбрав случайно один из подготовленных документов, руководитель констатировал, что в нём есть ошибка (событие A). Пользуясь формулой Байеса, выяснить, какова вероятность, что ошибку допустил первый чиновник, второй, третий.
Решение. Обозначим события и их вероятности:
: {документ подготовил первый чиновник}
: {документ подготовил второй чиновник}
: {документ подготовил третий чиновник}
A: {в документе допущена ошибка}

Событие
0,40 0,04 0,0160 0,36
0,35 0,06 0,0210 0,47
0,25 0,03 0,0075 0,17
Всего 1,00 - 0,0445 1,00

По формуле Байеса находим:

Итак, вероятность того, что ошибку допустил первый чиновник, составляет 0,36, второй – 0,47, третий – 0,17.

 

Формула полной вероятности и формулы Байеса

Задача 5

На склад поступило 2 партии изделий: первая – 4000 штук, вторая – 6000 штук. Средний процент нестандартных изделий в первой партии составляет 20%, а во второй – 10%. Наудачу взятое со склада изделие оказалось стандартным. Найти вероятность того, что оно: а) из первой партии, б) из второй партии.

Первая часть решения состоит в использовании формулы полной вероятности. Иными словами, вычисления проводятся в предположении, что испытание ещё не произведено и событие «изделие оказалось стандартным» пока не наступило.

Рассмотрим две гипотезы:
– наудачу взятое изделие будет из 1-й партии;
– наудачу взятое изделие будет из 2-й партии.

Всего: 4000 + 6000 = 10000 изделий на складе. По классическому определению:
.

Контроль:

Рассмотрим зависимое событие: – наудачу взятое со склада изделие будет стандартным.

В первой партии 100% – 20% = 80% стандартных изделий, поэтому: – вероятность того, что наудачу взятое на складе изделие будет стандартным при условии, что оно принадлежит 1-й партии.

Аналогично, во второй партии 100% – 10% = 90% стандартных изделий и – вероятность того, что наудачу взятое на складе изделие будет стандартным при условии, что оно принадлежит 2-й партии.

По формуле полной вероятности:
– вероятность того, что наудачу взятое на складе изделие будет стандартным.

Часть вторая. Пусть наудачу взятое со склада изделие оказалось стандартным. Эта фраза прямо прописана в условии, и она констатирует тот факт, что событие произошло.

По формулам Байеса:

а) – вероятность того, что выбранное стандартное изделие принадлежит 1-й партии;

б) – вероятность того, что выбранное стандартное изделие принадлежит 2-й партии.

После переоценки гипотезы , разумеется, по-прежнему образуют полную группу:
(проверка ;-))

Ответ:

Задача 6

На склад поступило 2 партии изделий: первая – 4000 штук, вторая – 6000 штук. Средний процент нестандартных изделий в первой партии 20%, во второй – 10%. Наудачу взятое со склада изделие оказалось нестандартным. Найти вероятность того, что оно: а) из первой партии, б) из второй партии.

Условие отличатся двумя буквами, которые я выделил жирным шрифтом. Задачу можно решить с «чистого листа», или воспользоваться результатами предыдущих вычислений. В образце я провёл полное решение, но чтобы не возникло формальной накладки с Задачей №5, событие «наудачу взятое со склада изделие будет нестандартным» обозначено через .

Байесовская схема переоценки вероятностей встречается повсеместно, причём её активно эксплуатируют и различного рода мошенники. Рассмотрим ставшее нарицательным АО на три буквы, которое привлекает вклады населения, якобы куда-то их инвестирует, исправно выплачивает дивиденды и т.д. Что происходит? Проходит день за днём, месяц за месяцем и всё новые и новые факты, донесённые путём рекламы и «сарафанным радио», только повышают уровень доверия к финансовой пирамиде (апостериорная байесовская переоценка в связи с произошедшими событиями!). То есть, в глазах вкладчиков происходит постоянное увеличение вероятности того, что «это серьёзная контора»; при этом вероятность противоположной гипотезы («это очередные кидалы»), само собой, уменьшается и уменьшается. Дальнейшее, думаю, понятно. Примечательно, что заработанная репутация даёт организаторам время успешно скрыться от Ивана Васильевича, который остался не только без партии болтов, но и без штанов.

К не менее любопытным примерам мы вернёмся чуть позже, а пока на очереди, пожалуй, самый распространенный случай с тремя гипотезами:

Задача 7

Электролампы изготавливаются на трех заводах. 1-й завод производит 30% общего количества ламп, 2-й – 55%, а 3-й – остальную часть. Продукция 1-го завода содержит 1% бракованных ламп, 2-го – 1,5%, 3-го – 2%. В магазин поступает продукция всех трех заводов. Купленная лампа оказалась с браком. Какова вероятность того, что она произведена 2-м заводом?

Заметьте, что в задачах на формулы Байеса в условии обязательно фигурирует некое произошедшее событие, в данном случае – покупка лампы.

Событий прибавилось, и решение удобнее оформить в «быстром» стиле.

Алгоритм точно такой же: на первом шаге находим вероятность того, что купленная лампа вообще окажется бракованной.

Пользуясь исходными данными, переводим проценты в вероятности:
– вероятности того, что лампа произведена 1-м, 2-м и 3-м заводами соответственно.
Контроль:

Аналогично: – вероятности изготовления бракованной лампы для соответствующих заводов.

По формуле полной вероятности:

– вероятность того, что купленная лампа окажется с браком.

Шаг второй. Пусть купленная лампа оказалась бракованной (событие произошло)

По формуле Байеса:
– вероятность того, что купленная бракованная лампа изготовлена вторым заводом

Ответ:

Почему изначальная вероятность 2-й гипотезы после переоценки увеличилась ? Ведь второй завод производит средние по качеству лампы (первый – лучше, третий – хуже). Так почему же возросла апостериорная вероятность, что бракованная лампа именно со 2-го завода? Это объясняется уже не «репутацией», а размером. Так как завод №2 выпустил самое большое количество ламп, то на него (по меньшей мере, субъективно) и пеняют: «скорее всего, эта бракованная лампа именно оттуда».

Интересно заметить, что вероятности 1-й и 3-й гипотез, переоценились в ожидаемых направлениях и сравнялись:

Контроль: , что и требовалось проверить.

К слову, о заниженных и завышенных оценках:

Задача 8

В студенческой группе 3 человека имеют высокий уровень подготовки, 19 человек – средний и 3 – низкий. Вероятности успешной сдачи экзамена для данных студентов соответственно равны: 0,95; 0,7 и 0,4. Известно, что некоторый студент сдал экзамен. Какова вероятность того, что:

а) он был подготовлен очень хорошо;
б) был подготовлен средне;
в) был подготовлен плохо.

Проведите вычисления и проанализируйте результаты переоценки гипотез.

Задача приближена к реальности и особенно правдоподобна для группы студентов-заочников, где преподаватель практически не знает способностей того или иного студента. При этом результат может послужить причиной довольно-таки неожиданных последствий (особенно это касается экзаменов в 1-м семестре). Если плохо подготовленному студенту посчастливилось с билетом, то преподаватель с большой вероятностью сочтёт его хорошо успевающим или даже сильным студентом, что принесёт неплохие дивиденды в будущем (естественно, нужно «поднимать планку» и поддерживать свой имидж). Если же студент 7 дней и 7 ночей учил, зубрил, повторял, но ему просто не повезло, то дальнейшие события могут развиваться в самом скверном ключе – с многочисленными пересдачами и балансировкой на грани вылета.

 


Дата добавления: 2021-05-18; просмотров: 1739; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!