Равновозможности и их исчерпание



Во Введении говорилось, что для применения ТВ необходима некая аксиома, связывающая понятие вероятности с реалиями мира. Первой такой аксиомой явилась старинная идея равновозможности: априорная вероятность, работающая в играх, определяется отношением числа благоприятных исходов к числу всех возможных исходов, а исходы мыслятся как равновозможные – даже там, где нет внешне заметной равновозможности. Эта идея фактически лежит в основе ТВ.

Выше приведена цитата из Бернулли: "Я предполагаю, что все случаи одинаково возможны... Иначе необходимо уравнять их и вместо каждого легче встречающегося случая считать столько других, насколько он легче имеет место, чем прочие". Именно данное понимание равновозможности позволило применить априорное понимание вероятности ко всем возможным случайным явлениям. Тем самым, мы подошли к самой сердцевине вероятностной проблематики.

Принято считать, что априорное понимание малополезно по двум причинам: во-первых, тут вероятность искомого события определяется через равные вероятности элементарных событий, т.е. налицо порочный круг, а во-вторых, нигде, кроме простейших примеров вроде салонных игр, равновозможностей не бывает. Венгерский математик Альфред Реньи писал: <<В действительности же недостаток этого определения состоит не в том, что ему свойствен порочный круг (как утверждают иногда и теперь), а в том, что оно не является определением. На вопрос, что такое вероятность, оно не отвечает, дает лишь метод ее вычисления в простейших случаях (по современной терминологии, в случае "классических вероятностных полей")>> [Реньи, 1970, c. 81].

Не буду спорить, пока не выяснено, что такое "классическое вероятностное поле". Если оно относится только к азартным играм, то Реньи прав, но если нет – нет. Так вот, бернуллиева процедура уравнивания вводит "классическое вероятностное поле" в качестве универсального понятия, годного для любой вероятностной задачи.

Правильная кость падает на каждую грань с равной частотой, которую можно отождествить с вероятностью. Это пишут во всех учебниках, но можно пойти дальше: если кость несимметрична, ее можно заменить на симметричную, у которой число граней больше: если на разные грани кость падает с частотами p1, p2,..., pN, то надо привести эти дроби к общему знаменателю Q, изготовить симметричную Q-гранную кость (это может быть, например, длинная симметричная Q-гранная призма) и приписать каждый номер (от 1 до N) стольким граням, какова доля соответствующей грани исходной кости в величине Q. Новая симметричная кость будет демонстрировать номера 1, 2,..., N с теми же вероятностями, что и исходная кость. Это значит, что принцип равновозможности исходов работает далеко за пределами внешне симметричных генераторов случайности. См. Добавление 1.

 

Частота и вероятность – от Граунта к Мизесу

Паскаль и Ферма, по-моему, не имели вероятностных интересов (хотя Хакинг считал о Паскале иначе [Hacking, 1975, c. 23]) и, получив удовольствие от решения чисто комбинаторных игровых задач, больше к данной тематике не возвращались. Вскоре вероятностные идеи овладели людьми, которых, наоборот, вообще не занимали азартные игры, а вероятность была для них лишь одной из средних величин (средней частотой).

Люди давно обратили внимание: статистика благоприятных исходов вполне работает не только в азартных играх, но и во многих массовых процессах. Прежде всего это стало ясно из статистики населения.

Первый шаг к математике случайного в статистике сделал упомянутый выше Граунт – в 1662 г. он открыл, что в массовых единообразных записях смертности лондонских жителей имеет место устойчивость частот. Разумеется, сам по себе этот факт был давно известен (например, банкирам), но только Граунт сделал его достоянием науки и широкой публики. Этим он породил ТВ как основу статистики, но математическое осмысление феномена началось всерьез лишь через двести лет, когда появилось само понятие устойчивости частоты. См. об этом главу 4.

Граунт вычислил, что на 14 мальчиков в среднем рождается примерно 13 девочек, и придал этому факту особый смысл: Бог-де предусмотрел повышенную смертность мужчин в войнах, путешествиях, "от руки правосудия" и т.п. Он не был ни математиком, ни философом ("homme sans geometrie" [Gouraud, 1848, c. 16]), но тем не менее оказался одним из основателей ТВ. Дело в том, что известно два способа ее построения – когда первично понятие вероятности и когда первично понятие средней величины, а вероятность вводится как средняя частота [Уиттл, 1982]. В наше время общепринят первый способ, однако метод средних исторически старше, он идет от Христиана Гюйгенса.

Его книга "О расчете в азартных играх" (1657 г.) – первая специальная публикация по ТВ. В ней исходным является понятие среднего, и если бы наука пошла тогда за Гюйгенсом, то математика случайного называлась бы, вернее всего, не ТВ, а теорией средних, и трудности у нее сейчас были бы иные. Прежде всего, было бы общим местом то, что исходная для исследования случайности процедура (прямо вытекающая из идеи баланса) – усреднение, а вовсе не подсчет исходов и их комбинаций. Усреднительный подход к ТВ стал обычным только начиная с работ Чебышева [Колмогоров, 1956, c. 266; Ширяев, 1989, c. 13], но и после них роль средних была осознана преимущественно в связи с предельными теоремами, тогда как нас будут больше интересовать текущие значения величин (см. гл. 7). В этом отношении мы последуем за Гюйгенсом и Граунтом.

Граунт вычислил вероятность лишь однажды, как бы делая уступку обывателю. Я приводил это место в п. 1: "вероятность умереть" означала у него то, что ныне именуют статистической вероятностью.

Прочтя Граунта, Гюйгенс занялся задачами, по форме игровыми, а по сути статистическими. Вот одна из них: "Мужчина 56 лет женится на женщине 16 лет, сколько времени они могут жить вместе, до смерти одного из них? Если мне обещали 100 франков в конце года, который проживут они оба, за сколько было бы справедливо выкупить это обязательство?" [Майстров, 1980, с. 73]. Под справедливой платой здесь понималось ожидаемое (среднее) значение, т.е. игровые задачи ставились там, где не видно равновозможных вариантов.

Решение Гюйгенса основано на составленной его братом таблице смертности, которая основывалась на данных Граунта. В таблице приводилось число переживших и умерших для каждого возраста по десятилетиям: 6, 16, 26 и т.д. до 86 лет (когда умер последний из выборки). Гюйгенс положил, что каждый член воображаемой супружеской пары каждые 10 лет играет в лотерею, билеты которой делятся на выигрышные и проигрышные соответственно упомянутой таблице [Hald, 1990, c. 108-110].

Так, в таблице значилось: в возрасте16 лет умерло 15 и пережило 40 лиц, поэтому в лотерее 16-летнему игроку полагается как бы тянуть билет из урны, в которой 40 выигрышных и 15 проигрышных билетов. По этому принципу Гюйгенс вычислил, что ожидаемая предстоящая жизнь двух супругов, вступивших в брак в 16 лет, равна 29,22 лет. Хальд резюмировал: "Это хороший пример раннего применения того фундаментального принципа, что ожидание ET может быть найдено как ожидание условного ожидания ET/Tx".

Для нашей же темы самое важное – понять, насколько мысли Гюйгенса повлияли на современников. Его расчеты не были опубликованы, но, по словам Хальда, витали в воздухе. Хальд обратил внимание на то, что сам Гюйгенс не стал решать задачу для 56-летнего и 16-летней, тогда как Я. Бернулли вскоре (1686 г.) решил именно ее. Из этого можно сделать вывод, что он мог знать о письме Гюйгенса брату, где эта задача поставлена (письма ученых друг другу тогда ходили по рукам, выполняя роль научной периодики), и это нам еще понадобится (см. гл. 3).

Что касается прогресса понимания вероятности как частоты, то он начался лишь через полтораста лет после выхода "Ars conjectandi". Первым, кто стал анализировать частоты как таковые, был английский логик Джон Венн (1866 г.). В те годы английская наука была охвачена энтузиазмом освоения нового миропонимания – статистического, о чем у нас пойдет речь в главе 5. От старомодной статистики как способа суждения ученые быстро переходили к статистике как сути самих природных процессов, к статистике в смысле Максвелла и Дарвина. Эту-то статистику Венн и ввел в обиход вероятностных рассуждений.

Венну наука обязана четким пониманием роли и возможностей ТВ. Он первым осознал, что понятие вероятности относится не ко всякой повторяющейся случайности, а лишь к хорошо организованной. Он счел, что слова the randomness и at random, которые всегда фигурируют, когда речь идет о вероятности, описывают некую действующую силу (agency): "Эта сила предполагается фиксированной и детерминированной вне определенных рамок, внутри же них предполагается распределенной равномерно" [Venn, 1876, c. 64]. Что, например, значит "стрелять беспорядочно (at random)"? Задана ли при этом плоскость стрельбы или сектор? А если задан сектор, то равновозможны ли углы в его пределах? В науке, по Венну, понятие равномерного распределения дается через идеализацию понятия беспорядочности (randomness): например, говоря, что человек взял наугад книгу с полки, мы делаем весьма сомнительное допущение, что все углы были для его руки равноценны.

Здесь Венн сделал первую попытку преодолеть господствовавший до тех пор в обосновании ТВ прием, известный как принцип индифферентности Лапласа  – он гласит, что при отсутствии каких-либо сведений о предпочтительности исходов, эти исходы надо полагать равновероятными. Принцип оказывается совершенно непригодным для использования [Кайберг, 1978, c. 47, 82]. Взамен этого принципа Венн и призвал определять вероятности из опыта; более того, именно он положил считать вероятностью предел частоты в однородной бесконечной серии испытаний. Существует ли такой предел и каким математическим аппаратом его можно исследовать, было тогда неясно. Через полвека (1919 г.) призыв Венна начал получать воплощение в работах немецкого математика и физика Рихарда Мизеса.

Нам теперь очевидно, что Мизес вел речь только об одной из форм вероятности – статистической (апостериорной), однако сам н простодушно заявил, что никакой другой вероятности, кроме предела частоты, быть не может. Этим он грубо смешал понятия, но все-таки именно он сделал первый серьезный шаг к пониманию вероятности через случайность, а не наоборот. Вот основные положения Мизеса.

<<1. О вероятности можно говорить только в том случае, если налицо имеется твердо определенный и точно отграниченный коллектив.

2. Коллектив есть массовое или повторное явление, удовлетворяющее следующим двум требованиям: относительные частоты отдельных признаков должны обладать определенными предельными значениями, и эти последние должны оставаться неизменными, если отобрать часть элементов совокупности произвольным выбором нумеров.

3. Выполнение последнего требования мы называем также принципом иррегулярности или принципом невозможности системы игры.

4. Нечувствительное к выбору нумеров предельное значение относительной частоты, с которой появляется определенный признак, мы называем "вероятностью" появления этого признака в пределах рассматриваемого коллектива>> [Мизес, 1930, c. 37].

Легко видна ошибка: надо ограничить произвол в выборе номеров, дописав в конце тезиса 2 слова: "не зависящим от значения выбираемого символа" (иначе можно, например, выбрать последовательность из одних нулей). Из-за этой оплошности многие отказались от анализа схемы Мизеса, не заметив главного новшества – требования иррегулярности в качестве исходного свойства. (К сожалению, у математиков широко принято отказываться от обсуждения нежелательной темы, ссылаясь на любую встреченную ошибку, даже не имеющую отношения к сути дела.)

Такое отношение сохранилось поныне, и даже новейшее исследование его идей, вдумчивое и благожелательное, кончено цитатой из книги В.Н. Тутубалина, которая аттестовала вероятностную концепцию Мизеса как "мертвый язык" [Григорян, 1999, c. 219]. Не могу согласиться – Колмогоров не раз говорил, что многим обязан Мизесу. Именно идеи Мизеса привели Колмогорова к его обеим аксиоматикам, о чем у А.А. Григоряна нет ни слова. С тем же правом можно назвать мертвым языком любую старую концепцию, которая подверглась изменениям.

До Мизеса был известен, кроме принципа индифферентности, только один (да и то никем явно не сформулированный) прием обоснования ТВ – принцип исчерпания равновозможностей (см. выше), когда каждое возможное элементарное событие берется ровно один раз. Благодаря этому принципу, ТВ не столько решает проблему случайности, сколько обходит ее. Для тех, кого интересует природа случайности, именно такая ТВ (а вовсе не попытка Мизеса) является "мертвым языком".

Мизес впервые предложил конкретную альтернативу исчерпанию равновозможностей: положения 2 и 3 означали, что вводится конкретная аксиома, призванная "оживить" науку о случайном. Эту аксиому позже назвали аксиомой случайности (см. ниже, п. 9). Закончу цитатой из классического курса: Феллер писал про нерегулярность, из-за которой нельзя предсказать исход будущего испытания, как про "фундаментальное свойство случайности, которое присуще наглядному представлению о вероятности. Значение этого свойства усиленно подчеркивалось Мизесом" [Феллер, 1964, c. 209]. Поэтому к Мизесу мы еще не раз обратимся.

 

Вероятность как тенденция

В 1933 г. Колмогоров писал, что он в вопросах "приложимости теории вероятностей к миру действительных событий... в значительной мере следует выводам Мизеса". А именно: "Можно практически быть уверенным, что если комплекс условий S будет повторен большое число n раз и если при этом через m обозначить число случаев, при которых событие A наступило, то отношение m/n будет мало отличаться о P(A)", т.е. от вероятности наступления A [Колмогоров, 1998, c. 5]. Тут впервые позиция Мизеса изложена без упоминания предела, и это оказалось решающим.

Впоследстиии Колмогоров пояснил: "Если освободить Мизеса от излишнего предельного перехода (что и было предложено в... моей книге), то можно сказать, что Мизес правильно описывает способ проявления вероятностных закономерностей при повторных испытаниях. Но принципиальная ошибка Мизеса заключалась в запрещении... ставить вопрос о том, почему в природе так часто выполняются условия, введенные им в понятие коллектива" [Колмогоров, 1952, c. 5]. Ответа на данный вопрос у самого Колмогорова тогда еще не было, зато тему отсутствия предела он вскоре уточнил: "Повидимому, с чисто формальной стороны о вероятности нельзя сказать ничего больше следующего: вероятность P(A/S) есть число, вокруг которого, при условиях S и при предусмотренных этими условиями способах формирования серий, имеют тенденцию группироваться частоты" [Колмогоров, 1956, c. 275].

Вот и найдено нужное слово – тенденция(*) . И Колмогоров объяснил, как ее понимать: "при возрастании численности этих серий в разумных пределах, не нарушающих однородности условий, эта тенденция проявляется со все большей отчетливостью и точностью, достигая достаточных в данной конкретной обстановке надежности и точности при достижимых численностях серий". Заметьте: достаточной точности, но не предела. Итак, вероятность – не предел частоты, а тенденция частот группироваться в небольшой области.

Говоря строго, Колмогоров был неправ, когда утверждал, что "с чисто формальной стороны о вероятности нельзя сказать ничего", кроме как о "тенденции" – как раз с чисто формальной стороны и как раз по Колмогорову вероятность есть мера. В основном тексте данной статьи речи о мере вообще нет, а в параграфе "Дополнительные замечания об основных понятиях теории вероятностей" о ней сказано лишь, что теоретикомерная аксиоматика "избавляет от соблазна" определять вероятность "способами, претендующими на соединение их непосредственной естественно-научной убедительности с приспособленностью к построению на их основе формально строгой математической теории".

Тезис известный, но вот что удивительно: в цитируемой программной и парадной статье (1956 г.) Колмогоров построил ТВ не "по Колмогорову", а как раз "по Мизесу", подправив одиозного в те годы немецкого математика лишь в одном – заменив предел на тенденцию. Дело в том, что "избавиться от соблазна" самому Колмогорову не удалось: вскоре он начал исследование алгоритмической ТВ, где одним из понятий является ныне "случайность по Мизесу – Колмогорову" [Успенский, Семенов, 1987, c. 203]. Имя Мизеса перестало быть одиозным [Lamblagen, 1987], и можно лишь сожалеть, что наши историки и философы науки этого до сих пор не замечают.

Однако вопрос о вероятности как тенденции решен тогда не был. Казалось, что частотное понимание вероятности ущербно по-существу и его следует заменить на иное – например, считать вероятность понятием субъективным [Mellor, 1971, c. 50].

 

Тенденция при падении монеты

В 1970 г. английский математик Питер Уиттл писал в своем учебнике (в методическом плане он нравится мне больше других): "Очевидно, здесь (бросая монету – Ю.Ч.) мы не имеем дела с пределом в обычном математическом смысле, так как нельзя гарантировать, начиная с некоторого достаточно большого n, что флуктуации p(n) будут меньше некоторого фиксированного уровня", хотя частота и проявляет "тенденцию стремиться к некоторому предельному значению". Он прямо поставил вопрос, можно ли тут в принципе "избавиться от разнообразия", т.е. получить предел, и честно признал: "Этот философский вопрос лежит в основе детерминизма, но если он разрешим вообще, то не в простых терминах. В теории вероятностей мы исходим из той предпосылки, что существует определенное разнообразие, которое мы не можем объяснить, но должны принять" [Уиттл, 1982, c. 10, 12]. Ныне, спустя 30 лет, полного объяснения все еще нет, но кое-что объяснить уже можно.

Опыт действительно говорит об устойчивости частот, но он не говорит о пределе. Есть ли какой-то конкретный предел у частоты, из опыта не узнать. Попытки показать сходимость частоты к вероятности путем многотысячных бросаний монеты привели к невразумительным результатам: внешне симметричная монета падала на одну из сторон с частотой около 0,5005-0,5077 [Майстров, 1980, c. 98]. Существенно, что последний результат, демонстрирующий наибольшее отклонение от 1/2, получен для самой длинной серии испытаний (более 80 тыс бросаний). Значит ли это, что следует искать в монетах, служивших для подобных опытов, незаметную неправильность формы или же монеты симметричны, а уклонения случайны?

Типичный ответ таков: «предположение о равновозможности герба и решки... кажется вполне удовлетворительным, однако... вполне возможен вывод, что выпадение герба и решки в отдельных случаях не одинаково вероятно» [Колмогоров и др., 1982, c. 28]. Он столь же невразумителен. Попробуем разобраться.

Сто лет назад Карл Пирсон, бросив монету 24 тыс. раз, в самом деле получил частоту герба, очень близкую к 1/2, а именно, 0,5005 (ошибка 0,1 %). Его упрекали в подтасовке, но, быть может, ему досталась самая симметричная монета? Или ему просто повезло?

Увы, дело проще: Пирсон простодушно прекратил опыт в тот момент, когда частота максимально приблизилась к 1/2. Вот как изложил дело Тутубалин: "Пирсон реабилитирован ... на самом деле было так: сначала Пирсон бросил монету 6000 раз, но результат ему не понравился. Тогда он бросил ее еще 6000 раз и опять не понравилось. Пришлось бросить монету еще 12000 раз, и результат (всех бросаний) оказался замечательным" [Тутубалин, 1992, c. 119].

Добавлю: если бы Пирсон бросил монету еще столько же раз, итог был бы почти наверняка много дальше от 1/2 (на то есть известный "закон арксинуса" [Феллер, 1984, c. 470], которого Пирсон еще не знал), так что уместен вопрос: что же именно мерил Пирсон и чему так рад Тутубалин? Ведь очевидно, что "замечательный результат" – вовсе не предел частоты, а специально подобранное (путем выбора момента окончания опыта) число. Если результат "замечателен" тем, что очень близок к 1/2, т.е. к априорной вероятности для симметричной монеты, то замечу, что монета Пирсона вовсе не была симметрична – у нее на одной стороне выдавлен герб, а на другой цифра.

Как раз для «идеальной монеты» (компьютерная серия независимых испытаний) получается вовсе не такой "замечательный" результат: [Феллер, 1964, c. 32]: при 10 тыс. испытаний ошибка составляет 0,4 % и не проявляет, после первой тысячи, единой тенденции к снижению. Зато, выбирая для окончания опыта нужную тысячу испытаний, можно извлечь из таблицы Феллера еще лучший результат, чем у Пирсона: 0, 5001 по первым восьми тысячам. Однако Феллер делать этого не стал, причем был прав – точное совпадение частоты с 1/2 (иными словами, возврат в начальную точку при случайном блуждании на прямой) достигается и при слегка несимметричной монете.

Вариацией момента окончания опыта с симметричной монетой можно получить отнюдь не любую частоту, а лишь число, близкое к 1/2. Это значит, что есть некоторая небольшая финальная область, из которой Пирсон и мог выбрать свой "замечательный" результат. Финальными областями мы займемся в главе 6.

 

Вероятность как мера

Как сказано во Введении, еще Ламберт отметил, что знаки (цифры) иррационального десятичного числа могут быть статистически независимы и служить аналогом серии бросаний симметричной десятигранной кости. Будем называть данное свойство чисел случайностью по Ламберту. Очевидно, что это – чисто математический феномен, не имеющий отношения к каким бы то ни было случайным испытаниям. От него тянется линия в ТВ, трактующая данную дисциплину как чисто математическую.

Долгое время считалось, что факт случайности следования цифр в иррациональном числе имеет место в силу какой-то несоизмеримости (стороны и диагонали квадрата, окружности и ее диаметра и т.д.), и только Борель заметил, что цифры статистически независимы в почти всяком действительном числе [Borel, 1909], т.е. что случайность тут имеет общий характер. В главе 4 мы остановимся на смысле этой классической работы подробнее. А пока ограничимся замечанием, что этим он заложил основу понимания вероятности как меры. Наиболее простая мера – это обобщение понятия длины, и вероятность при этом понимается как суммарная длина тех кусочков единичного отрезка, попадание на которые считается благоприятным исходом.

Колмогоров в 1933 г. завершил усилия Бореля и его коллег, создав то, что известно как первая аксиоматика Колмогорова. Она явилась изящным обобщением бернуллиевой схемы на бесконечное число испытаний. А именно, исходом именуется здесь указание на определенную точку – точнее, на бесконечно малую часть единичного отрезка, а вероятностью события называется суммарная длина тех бесконечно малых частей, какие благоприятны для этого события. Подробнее см. рассказ о рулетке Пуанкаре и мере в главах 4 и 6. Мера, а с тем и вероятность, существует не для всякой случайностной схемы – мы узнаем это в главе 7.

Данная аксиоматика (она излагается в любом учебнике ТВ) удобна для построения теории, но остается неясно, к каким явлениям полученная теория приложима. Этим вопросом мы займемся далее, здесь же надо отметить: приложимость очевидна лишь для вероятностей, определяемых априорно, поэтому то и дело совершаются попытки свести остальные понимания вероятности к априорному. Так, по Чендову [1974, c. 212], вероятность как степень возможности (модификация "степени достоверности" Бернулли) может быть выражена в терминах меры (впрочем, конкретно это им не показано). Наоборот, вероятности как степени уверенности или правдоподобности он в такой выразимости отказал, назвав их субъективным, т.е. "самым низшим пониманием вероятности" [Чендов, 1974, c. 192]. Для нашей темы тут важно одно – признание того, что различные понимания вероятности несводимы друг к другу и что теоретикомерное представление возможно не для всех пониманий вероятности.

 


Дата добавления: 2019-02-22; просмотров: 255; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!