Организующая роль случайности



Независимо от того, считать ли случайность реальным феноменом или способом говорить о непонятном, нельзя отрицать, что она играет организующую роль. Достаточно вспомнить, что неподвижно растущее растение не может иначе распространять свои семена, как предоставив их на волю случая. У опыляемых ветром и опыляемых насекомыми эти случайности достаточно разноплановы, но они есть всегда. Да и сознательно действующий человек не мог бы эффективно размножаться, вовсе исключив из этого процесса случайность. Говоря шире, случайность необходима для действия в разнообразном мире.

Организующая роль случайности хорошо выявлена в ряде физических работ – см., например, пункт "Конструктивная роль динамической неустойчивости движения" статьи [Климонтович, 1996], где отмечено, что разбегание траекторий при динамическом хаосе обеспечивает физическую и информационную целостность системы; и пункт "Тепловой шум в биосистемах – необходимый компонент их работы" статьи [Иваницкий и др., 1998], где сказано: "Тепловой шум в биосистемах... выполняет две полезные функции – поиск партнеров при молекулярных взаимодействиях и адаптационную изменчивость". (Последняя, замечу, далеко выходит за рамки шума, что мы увидим ниже, в п. 5.2.) Недаром с древности важной частью многих социальных действий является жеребьевка, а в наше время в науке и технике распространены методы случайного поиска.

Рассмотрим кратко автоматные модели. Триггер (логическая схема с двумя действиями, чередующимися в зависимости от внешнего сигнала) обладает некоторой разумностью по сравнению с чисто случайным "поведением" бросаемой монеты, что видно из следующего. Пусть среда может действовать на объект двумя способами – штрафом и поощрением, причем первое действие объекта штрафуется с вероятностью p1, а второе – с вероятностью р2. Если объект – триггер, меняющий действие при штрафе и не меняющий при поощрении, то, как легко вычислить [Цетлин, 1969, с. 25], его средний выигрыш больше, чем выигрыш объекта, меняющего действие чисто случайно. Улучшить его поведение (получить больший средний выигрыш) можно, сделав триггер инерционным, т. е. меняющим действие не при первом штрафе. Для этого он должен уметь считать время, т. е. иметь цепочку внутренних состояний, которые меняются одно за другим без изменения действия (невидимо для внешней среды). Таков автомат с линейной тактикой (АЛТ), предложенный М. Л. Цетлиным в 1961 г.

Вообще, конечным автоматом называется объект, имеющий n состояний и заданное правило перехода из одного состояния в другое. Состояния объединяются в k групп, именуемых действиями автомата; автомат, выполняющий действие i, штрафуется внешней средой с вероятностью pi (поощряется с вероятностью 1- pi), не зависящей от номера состояний внутри группы. Правило смены состояний для АЛТ таково: если в момент t было поощрение, то в момент t+1 номер состояния увеличивается на 1 или (если он уже был равен максимальному числу d – глубине памяти АЛТ) не меняется; если же в момент t был штраф, то номер состояния уменьшается на 1 или (если он уже был равен 1) происходит смена действия на следующее (действия образуют кольцо), и в нем автомат занимает тоже номер 1. Автомат задается двумя графами: один – поведение при поощрении, другой при штрафе (рис. 14а).

При d=1 АЛТ становится триггером, а при d, стремящемся к бесконечности, он оптимален, т. е. реализует практически только то действие, штраф за которое минимален (но, замечу для математиков, теряет эргодичность). Для приемлемой разумности d должно заметно превышать k–1, а вероятности pi – достаточно различаться.

Если переход от одного действия к другому происходит случайно (рис. 14б), то мы получаем автомат, моделирующий точковый мутагенез, о котором см. п. 9-4.2.

Идеология асимптотически оптимальных автоматов основана на идеалах третьей (статистической) ПМ со всеми ее недостатками: благом признан средний выигрыш, хотя с ростом глубины памяти автомат реагирует всё медленнее, а в пределе вообще не реагирует, так что такая оптимальность практически ничего не значит. Поэтому интерес представляет не асимптотическая оптимальность, а оптимальность при данном d. Такой автомат описал А.А. Милютин [1965]. Это – автомат со сравнивающей тактикой (АСТ).

Разумность данного автомата достигается не столько за счет инерционности (хотя и она необходима), сколько за счет регулярной смены действий. Если АЛТ считает штрафы и поощрения, сохраняя одно и то же действие, то ACT – меняя их. Автомат оказался вероятностным: в каждом действии есть одно состояние, попав в которое, он никогда не меняет действие при поощрении и редко – при штрафе. Милютин предложил и детерминированный автомат, ведущий себя очень сходно и, следовательно, получающий почти тот же средний выигрыш (но все-таки неоптимальный). Принципиально, что в неслучайной среде детерминированный АСТ вообще не может функционировать. Налицо организующая роль случайности.

АСТ замечателен тем, что ведет себя антиинтуитивно. На рис. 14в он изображен для k = 2, d = 8. Он состоит из двух подсистем, каждая из которых почти или вовсе лишена целесообразности – в верхних четверках состояний смена действия обязательна, независимо от штрафа, а в нижней четверке он при штрафе вовсе не считает время, так что сама по себе нижняя четверка не лучше триггера. Переход от нее к верхней четверке возможен только после трех поощрений подряд, а затем штрафа. И все же легко видеть, что если первое действие чаще штрафуется, a второе – чаще поощряется, то автомат быстро попадает в нижнюю четверку справа, откуда выходит редко и ненадолго. В главе 9 мы увидим, что это помогает понять генетический поиск.

Такая ситуация достаточно типична: существует множество объектов, которые без случайностного компонента распадись бы на отдельные бессмысленные состояния или движения. В главе 9 мы убедимся на примере коллектива автоматов, как введение случайности в акт поведения радикально упрощает поиск и повышает надежность работы организма.

 

Случайность в игре

Теперь надо рассмотреть организующую роль случайности в игровых ситуациях. Если рассуждать в рамках вероятностей и оптимальных стратегий, то встает вопрос, какими минимальными возможностями должен обладать игрок, чтобы уметь решать игру. В одном частном смысле эта задача была поставлена и решена мною в самом начале работы над проблемами случайности. Речь шла об информационных возможностях игроков (автоматов или их коллективов).

Вопрос был поставлен так: что обязан знать игрок об игре, чтобы решение было в принципе возможно? Простейший тип игры – матричная игра, т.е. игра двух игроков, в которой первый должен выбрать одно из m действий, а второй – одно из n действий, и задание этой пары определяет выигрыш первого (он же – проигрыш второго). Выигрыши образуют матрицу размером mXn. Решение игры в общем случае являет собой пару оптимальных стратегий (два набора вероятностей, с которыми игроки применяют свои действия), и реализующийся при этом средний выигрыш – цену игры. Для матричной игры решение всегда существует (теорема фон Неймана, 1928 г.), причем игрок, применяющий свою оптимальную стратегию, гарантирует себе выигрыш не менее цены игры, независимо от того, как ведет себя противник (и получает больше цены, если противник ошибся).

Решение может быть найдено с помощью эффективной процедуры – решения системы дифференциальных уравнений. Эту процедуру я и использовал для ответа на поставленный выше вопрос [Чайковский, 1971].

А именно, поиск решения игры был рассмотрен как взаимодействие двух больших коллективов достаточно простых автоматов, когда каждый акт поиска состоит в том, что каждый автомат первого коллектива играет с автоматом второго согласно игровой матрице. Разумность игрока (коллектива) как целого достигается сравнением выигрышей групп, применяющих в данный момент одно и то же действие (применяющих одну и ту же "чистую стратегию"). При этом распределение автоматов коллектива по действиям играет роль коллективной памяти.

Сама по себе приближенная оценка средних внутри коллектива несложна: достаточно каждому автомату между актами игры несколько раз случайным образом обменяться половиной своего текущего выигрыша с несколькими соседями, чтобы в коллективе быстро выровнялась величина, близкая к среднему выигрышу коллектива. Столь же легко оценивается выигрыш, средний по автоматам, выполняющим данное действие, а значит можно оценить и их разность – среднюю выгодность данного действия. Этот случайный обмен и несет организующую функцию.

Оказалось, что для решения игры знать игровую матрицу необязательно. Достаточно, чтобы каждый автомат знал лишь один из номеров действий, к которым в данный момент выгодно переходить (причем каждый выгодный номер какой-то части автоматов известен); наоборот, знание выгодности собственного действия недостаточно: если каждый автомат знает лишь то, что номер выполняемого им действия надо сменить на другой (неизвестно какой), то коллективы бесконечно блуждают. Тем самым, граница эффективности случайного поиска в игре оказалась четкой: если известно только, где плохо, игра не решается, а если каждому члену коллектива известно хоть одно из направлений к лучшему, то решается.

Подробнее это рассмотрено в п. 4.3 книги [Чайковский, 1990], а идея доказательства (данного в моей диссертации) приведена в заметке [Чайковский, 1971a]. Поскольку заметка в итоге оказалась единственной публикацией доказательства, ее надо пояснить.

Игровые задачи интересовали меня в одном отношении – можно ли их решать методом проб и ошибок. С этой позиции среди методов решения важны те, которые можно трактовать как случайный поиск. Наиболее привлекала внимание доказанная в 1950 г. теорема Брауна – Неймана: всякая симметричная игра (игра, в которой роли обоих игроков одинаковы; она описывается антисимметричной матрицей размера mXm) может быть решена путем решения системы (m – 1) обыкновенных дифференциальных уравнений, в которой переменными являются вероятности применения действий первым игроком. Доказательство ее построено на двух свойствах симметричной игры: во-первых, она имеет нулевую (а потому заранее известную) цену, а во-вторых, достаточно найти оптимальную стратегию одного игрока – у другого будет та же. Правую часть каждого уравнения образует кусочно-аналитическая функция, которая равна выгодности данного действия (в данном случае – выигрышу первого игрока при данном действии, если этот выигрыш положителен, и равна нулю в ином случае) [Льюс, Райфа, 1961, c. 551].

Здесь сумма выгодностей действий игрока является так называемой функцией Ляпунова, и потому решение системы прозрачно как аналитически, так и поведенчески. Однако в таком виде задача не привлекает ввиду явной искусственности симметричной игры. К счастью, оказалось, что симметрия игры ни при чем: теорема сохраняет силу для произвольной матричной игры. Эту систему уравнений естественно рассмотреть как модель поведения двух бесконечных коллективов автоматов, непрерывно играющих попарно в матричную игру, причем переменные величины будут играть роль распределений автоматов по действиям в данный момент поиска. Существование решения означает, что данные коллективы способны к оптимальному поведению.

Естественно встал вопрос: существует ли решение системы уравнений, в которых вместо выгодностей взяты невыгодности? Оказывается – нет. Удалось найти простой пример игры 3Х3, в котором система уравнений не приближается к решению игры (траектории блуждают по всему фазовому пространству). Это и было интерпретировано мной как недостаточность штрафов – в игре коллективов надо поощрять тех, чьи действия лучше среднего. И наконец, оказалось, что численное значение выгодностей лишь замедляет процесс поиска: быстрее всего ищут те, кто знает лишь знак выгодности, т.е. лишь номер действия, к которому следует перейти.

Конечно, факт решаемости игры не несет существенного поведенческого смысла, поскольку и сами автоматы, и способ их обмена информацией слишком сложны и надуманны. Однако указание информационной границы, ниже которой решение заведомо невозможно, весьма осмысленно: самая простая конфликтная ситуация (матричная игра) оказывается неразрешима методом случайного поиска, притом – даже в самом грубом приближении. В этом и состояло для меня ориентационное значение игровой модели. Грубо говоря, рассмотрение ее привело сперва к отказу от попыток решать эволюционные задачи методом проб и ошибок, а затем и к пониманию ограниченности статистической ПМ вообще. Подробнее см. главу 9.

 

Случайность и тенденции

Тенденцией называется закономерность, вполне очевидная, но нечеткая и не поддающаяся точной формулировке; чаще всего это происходит вследствие наличия противоречащих примеров. В 1907 г. философ Анри Бергсон ввел в оборот эволюционной литературы тенденцию как эволюционное понятие, и главным его примером были тенденции царств природы: хотя всем известны понятия животного и растения, однако нет ни одного признака, позволяющего четко различить их; главное свойство растений (фотосинтетический механизм) является лишь тенденцией – есть растения паразиты, а есть животные с фотосинтезом (многие жгутиконосцы и др.).

Колмогоров, как мы видели в главе 2, понимал вероятность тоже как тенденцию. По-видимому, никакое знание, в том числе точное, невозможно без нечетких понятий. В сущности, об этом и вел речь Любищев, говоря о пробабилизме (см. выше, п. 2). Для той же цели разрабатывается так называемая нечёткая логика, тесно связанная с модальной логикой, а через нее – с индефинитикой [Чендов, 1974].

Для нашей темы важен та тенденция, которую С.В. Мейен, палеонтолог, эволюционист и философ, назвал мероно-таксономическим несоответствием(*). Этим термином Мейен обозначил "отсутствие соответствия между классами частей и классами самих индивидов" [Мейен, 1984, с. 18]; для нас это значит, что распределение меронов по таксонам и наполнение таксонов меронами в определенной степени случайны. Данная тенденция характерна для разнообразия любых объектов. Так, для таксона "завод" характерен мерон "высокие вытяжные трубы", труба – как бы символ завода, но возможны заводы без них, зато данный мерон характерен и для таксона "теплоцентрали". После работы Мейена [1984], правильнее характеризовать случайность типа Б как скрещение несогласованных тенденций (процесс – это тенденция во времени).

Организующая роль мероно-таксономического несоответствия выражается во многом и, в частности, во всех процессах приспособления: для обретения старым таксоном нового свойства чаще всего прежний мерон используется не по назначению, а как положено мерону иного таксона. В биологии этот феномен известен как принцип смены функций и является основным при объяснении появления новых органов в эволюции. Так, рыба, оказавшись на суше, использует плавники для ползания, что в ходе эволюции может привести к появлению лап. Аналогично, тракторный завод может быстро перейти на выпуск подвижной бронетехники, даже если это не планировалось при проектировании завода, т.е. было случайным в смысле (Б) для его проекта.

Случайность такого типа возможна в качестве массовой именно потому, что пространство таксонов связано с пространством меронов не прямо (мерон – таксон), а как бы наискось, косой сеткой – через мероно-таксономическое несоответствие.

 


Дата добавления: 2019-02-22; просмотров: 388; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!