Парадоксы Монти Холла о дверях и о 3х заключённых

Джастмэн
  АС: отредактировано 12.02.2011 - Добавлено несколько абзацев в конце для более ясного понимания выбора.               


                ПАРАДОКСЫ МОНТИ ХОЛЛА О ДВЕРЯХ
                И      О 3х ЗАКЛЮЧЁННЫХ


                Неудачи других кажутся нам совершенно естественными,
                но вот почему нам не везёт – этого мы не можем понять

                Мария Эбнер-Эшенбах

                («Афоризмы, цитаты, крылатые слова»,
               

   «Парадокс Монти Холла – одна из известных задач теории вероятностей, решение которой, на первый взгляд, противоречит здравому смыслу. Задача формулируется как описание гипотетической игры, основанной на американском телешоу «Let’s Make a Deal», и названа в честь ведущего этой передачи. Наиболее распространенная формулировка этой задачи, опубликованная в 1990 году в журнале Parade Magazine, звучит следующим образом:

   …Представьте, что вы стали участником игры, в которой вы находитесь перед тремя дверями. Ведущий, о котором известно, что он честен, поместил за одной из дверей автомобиль, а за двумя другими дверями – по козе. У вас нет никакой информации о том, что за какой дверью находится. Ведущий говорит вам: «Сначала вы должны выбрать одну из дверей. После этого я открою одну из оставшихся дверей, за которой находится коза. Затем я предложу вам изменить свой первоначальный выбор и выбрать оставшуюся закрытую дверь вместо той, которую вы выбрали вначале. Вы можете последовать моему совету и выбрать другую дверь, либо подтвердить свой первоначальный выбор. После этого я открою дверь, которую вы выбрали, и вы выиграете то, что находится за этой дверью.»

    Вы выбираете дверь номер 3. Ведущий открывает дверь номер 1 и показывает, что за ней находится коза. Затем ведущий предлагает вам выбрать дверь номер 2. Увеличатся ли ваши шансы выиграть автомобиль, если вы последуете его совету?

    Решение

   Правильным ответом к этой задаче является следующее: да, шансы выиграть автомобиль увеличиваются в два раза, если игрок будет следовать совету ведущего и изменит свой первоначальный выбор.

   Наиболее простое объяснение этого ответа состоит в следующем соображении. Для того чтобы выиграть автомобиль без изменения выбора, игрок должен сразу угадать дверь, за которой стоит автомобиль. Вероятность этого равна 1/3. Если же игрок первоначально попадает на дверь, за которой стоит коза (а вероятность этого события 2/3, поскольку есть две козы и лишь один автомобиль), то он может однозначно выиграть автомобиль, изменив своё решение, так как остаются автомобиль и одна коза, а дверь с козой ведущий уже открыл.
Таким образом, без смены выбора игрок остаётся при своей первоначальной вероятности выигрыша 1/3, а при смене первоначального выбора, игрок оборачивает себе на пользу в два раза большую оставшуюся вероятность того, что в начале он не угадал.
   Также интуитивно понятное объяснение можно сделать, поменяв местами два события. Первое событие – принятие решения игроком о смене двери, второе событие – открытие лишней двери. Это допустимо, т.к. открытие лишней двери не даёт игроку никакой новой информации (док-во см. в этой статье).
Тогда задачу можно свести к следующей формулировке. В первый момент времени игрок делит двери на две группы: в первой группе одна дверь (та, что он выбрал), во второй группе две оставшиеся двери. В следующий момент времени игрок делает выбор между группами. Очевидно, что для первой группы вероятность выигрыша 1/3, для второй группы 2/3. Игрок выбирает вторую группу. Во второй группе он может открыть обе двери. Одну открывает ведущий, а вторую сам игрок.

   Проблема трёх заключённых

   Другая формулировка парадокса была представлена Мартином Гарднером в колонке Математические игры, которую он вёл в журнале Scientific American, в 1959.

   Трое заключённых A, B и C приговорены к смертной казни, однако известно, что один будет помилован. Приговор запрещает сообщать преступнику, будет ли он помилован или нет. A уговаривает охранника сказать, кого из двух других заключённых казнят. Так как вопрос не касается A, охранник решается сообщить, что казнят B. Как изменились вероятности казни A и C? Или, проводя аналогию с проблемой Монти Холла, следует ли A поменяться местами с С, если у него есть такая возможность?

Ответ

В таблице приведены вероятности того, кто из заключённых будет помилован, до и после сообщения охранника.

До сообщения охранника                После сообщения охранника
p(A) = 1/3                p(A) = 1/3
p(B) = 1/3                p(B) = 0
p(C) = 1/3                p(C) = 2/3

Таким образом, A делает заключение о том, что C имеет вдвое более высокую вероятность выжить по сравнению с ним. Поэтому, если есть возможность, ему следует поменяться с C
   Ключом к пониманию ответа является то, что охранник не сообщает A новой информации о его судьбе, так как A и до сообщения охранника знал о том, что его либо помилуют, либо нет, а хотя бы один из двух других заключённых будет казнён. О судьбе заключённых B и C заявление охранника, конечно, несёт информацию (предполагается, что охранник сказал правду). Вероятность того, что помилуют B, становится равна нулю, а вероятность того, что помилуют C, увеличивается. Несимметричность значений вероятности быть казнённым для A по сравнению с C объясняется тем, что охранник поделился информацией именно с A». Конец цитаты  («Википедия», http://ru.wikipedia.org/wiki, Парадокс Монти Хола).


               
                РЕШЕНИЕ

   Проблема не в том, что математики знают о вероятности больше «простых смертных», а в том, что они всецело уповают на непоколебимую истинность математических расчётов и приоритет математики в целом для познания явлений окружающего мира, недооценивая при этом силу и важность логики. А именно логика, как ядро человеческого мышления, имеет приоритет над другими методами познания и объяснения явлений. Не зря, открыв её законы, Аристотель, затем Лейбниц, а также многие другие философы  и логики (например, Фреге, Рассел, Кантор и другие) желали, чтобы логика стала основой для других наук, в том числе и математики. Потому что никакая другая наука не является настолько всеобщей, как логика, ведь механизм логического рассуждения занимает центральное место в человеческом мышлении.

   В умозаключениях о выборе в этих парадоксах заключена фундаментальная ошибка – «неверная исходная посылка» («Логические парадоксы. Пути решения», глава «Ошибки рассуждения в парадоксах – исходная посылка», http://www.proza.ru/2009/04/26/341), а точнее две.

   Первая ошибка состоит в том, что успех предвидения событий, моделирование требуемого результата считается всецело основанным на математических расчётах и лежащим в границах определения степени вероятности каких-либо событий. Но на самом деле это не так. Оценка степени вероятности события даёт лишь общую картину вариантов события, но отнюдь не гарантирует необходимого успеха предсказания. Поэтому оценка степени вероятности вариантов события является всего лишь одним из параметров для принятия решения. Ведь наша цель – успешный выбор, а не точная оценка вероятности события. Попытка у нас одна, а не сто, поэтому оценка вероятности тут не поможет.

   В этом парадоксе выводы о применении оценки вероятности противоречат рассуждениям в других парадоксах. Например, в «Парадоксах лотереи и закона больших чисел Бернулли» (http://proza.ru/2009/07/01/188) рассуждения всех пытавшихся их решать строятся на постоянстве, универсальности степени вероятности вариантов события в независимости от выпадения или невыпадения предыдущих вариантов, то есть на постоянстве степени вероятности в течение произвольного периода времени. Но в этом парадоксе рассуждения уже строятся на изменчивости степени вероятности вариантов события в течение времени, на её зависимости от имеющейся информации, хотя и тут, и там используется одна и та же теория вероятности, но почему-то на основе разных подходов. Противоречие в рассуждениях о применении оценки степени вероятности очевидно, не так ли? И если в парадоксах лотереи и закона больших чисел Бернулли верное решение основано на понимании не постоянства, а изменчивости оценки степени вероятности вариантов события в течение времени в зависимости от имеющейся в конкретный момент времени информации о событии, то в данном парадоксе такой подход ошибочен.

   Авторы рассуждения предлагают нам поменять сделанный первоначально выбор варианта (двери или места в камере) на основе того, что раскрытие одного из вариантов меняет вероятность выбранного нами, как и оставшегося варианта события. Но на самом деле, хотя оценка вероятности вариантов события и меняется, но нам это никак не поможет для успешного выбора. Потому что САМО СОБЫТИЕ ОСТАЁТСЯ НЕИЗМЕННЫМ, а меняется лишь наше отношение к произошедшему событию, которое никак не может его изменить. Ошибочность логического основания, исходной посылки, другими словами, состоит в  непонимании, что изменение отношения к произошедшему уже событию, к факту, никак не влияет на изменчивость этого факта для нас, то есть на получение информации о нём в будущем для нас. Изменение нашего отношения на основе полученной информации влияет только на само наше поведение касательно произошедшего уже факта, то есть на выбор не вариантов свершившегося уже события, а на изменение нашего поведения относительно выбора. Например, если проснуться и выглянуть в окно, но не обнаружить на небосклоне Солнца и увидеть, что на улице темно, то можно начинать кричать о конце света либо спокойно ждать следующего дня. Выбор поведения зависит от нашего понимания свершившегося факта (отсутствия Солнца) и отношения к нему, то есть от нас самих, от субъекта, а не от оценки степени вероятности того, наступил ли конец света или ещё нет. И выбор из этих двух вариантов никак не изменит произошедшего уже события – наступление всего лишь очередной ночи или наступление, к примеру, ядерной зимы. Так и относительно нашей задачи. Изменение или нет нашего выбора варианта (двери или места в камере) никак не поменяет место нахождения за какой-то из дверей автомобиля или помилование одного из заключённых. Потому что принятое решение о местонахождении автомобиля за дверью и решение о помиловании одного из заключённых никак, во-первых,  не связано с нашим выбором, с отношением к этому, а, во-вторых, не изменится, так как уже произошло и находится в прошлом. Поэтому может измениться лишь наше поведение относительно выбора варианта произошедшего события.

   Вы возразите, что, как раз-таки, на точность и большую успешность нашего угадывания события и влияет оценка степени вероятности выбираемого события. Нет. Не может быть большей или меньшей и вообще степени успешности угадывания, есть лишь угадывание или нет. Изменение собственного выбора варианта события на основе понимания изменения оценки степени вероятности варианта события аналогично изменению маршрута следования (своего поведения) после пробегания перед нами чёрной кошки на основе вероятности того, что после этого случаются всякие неприятности. И отклонение нашего маршрута  в настолько большей степени, вплоть до возвращения обратно, насколько большее количество кошек перед нами пробежало и насколько чаще после этого случались неприятности.

   Существует ещё одна ложная посылка в рассуждениях в данной задаче. Она состоит в непонимании того, что угадывание автомобиля или помилования заключённого зависит не от степени вероятности возможного варианта события, а в гораздо большей мере от НАШЕЙ СПОСОБНОСТИ К ПРЕДВИДЕНИЮ, другими словами, НАШЕЙ УДАЧЛИВОСТИ, то есть от СТЕПЕНИ ВЕРОЯТНОСТИ НАШЕГО УГАДЫВАНИЯ ЛЮБЫХ СОБЫТИЙ. Это означает, что выбор зависит целиком и полностью только от  наших качеств, от нас самих. Кто-то всю жизнь выигрывает в лотерею, получая кучу призов, покупая лишь по 1-2 билета, попадает в водоворот случайных и даже невероятных событий, оканчивающихся для него счастливо, а кто-то не может выиграть ни разу, хотя и скупает лотерейные билеты пачками, тратя немыслимые суммы, при этом попадая в нелепые ситуации или ломая предметы одним касанием. Кто-то может верно угадать вариант события 7-8 или даже 10 раз из десяти, а кто-то и из 20 раз ни разу. Кто-то выживает после удара молнии, при этом, даже излечиваясь от болезней и приобретая новые способности, а кто-то тонет в тарелке с супом. Никто не знает, почему так происходит. И оценка вероятности в разрешении этого вопроса не поможет.

   Поэтому изменение первоначального выбора двери или места в камере никак не влияет на угадывание, на получение успешного результата для нас. Мы можем угадать и с первого раза или нет, но узнаем мы это лишь после прояснения ситуации в итоге, но никак не до получения результата. А приведённое в начале рассуждение на основе оценки вероятности – это «порочный круг» («Логические парадоксы. Пути решения», глава «Ошибки рассуждения в парадоксах – порочный круг»,  http://proza.ru/2009/04/26/369), то есть рассуждение на основе предположений, а не фактов. Но тогда предпочтительнее делать выбор на собственных качествах: интуиции, тем более, если постоянно в течение жизни она оказывается верной; собственных знаний, опыта и гипотез, например, на основе анализа предыдущих передач и выявления некоторой статистической закономерности; обострённых чувств, например, тонкого обоняния («собачий нюх»), с помощью которого можно услышать запах машины за дверью (резины, краски и т.д.);  или других.

   Почему я считаю, что выбор на собственных качествах, если хотите – на «вере в себя», предпочтительнее, чем на основе оценки степени вероятности? Представьте, что ведущий убрал совсем одну дверь, оставив изначально для выбора две двери, а затем, указывая на одну из двух дверей, сказал, что именно за ней находится ааааавтаамаабиииилллль!!! (вспомните Якубовича в «Поле чудес» с двумя шкатулками или ящиком), долго уговаривая после нашего выбора поменять решение. При этом условие о его честности по отношению к нам аннулируется. И что? Теперь наш выбор становится более простым? Отнюдь нет. Вероятность угадывания становится 1 к 2, но и вероятность неудачи становится такой же. А его информация нам не помогла нисколько, как и в передаче Монти Холла с тремя дверями. Даже если представить сто дверей, как предлагается в статье из «Википедии» далее, то ситуация остаётся всё той же непредсказуемой. Кто-то угадает с одной попытки нужную дверь из ста, причём не удивлюсь, если он сможет это сделать два раза подряд, а кто-то, навроде героя Стива Мартина из фильма «Розовая пантера» или Пьера Ришара из фильма «Невезучие», не сможет угадать нужную и с десяти-пятнадцати попыток из двух дверей. И никакое знание теории вероятности ему не поможет.


   Для чёткого и ясного понимания стоящего перед нами выбора представьте такую ситуацию. После того, как человек выбрал одну из трёх дверей, ведущий открывает не одну из оставшихся двух дверей, а именно ту дверь, которую выбрали, потому что знает, что за ней находится коза. И затем предлагает поменять выбор. Только в этом случае и стоит менять свой выбор! Если, конечно, коза вам меньше нужна в хозяйстве, чем автомобиль, что не факт. Кому-то козье молоко здоровье спасает. Да и от автомобилей у кого-то автопарк может уже «ломиться» :). Но если вы всё-таки хотите выиграть машину, тогда перед вами теперь стоит простой выбор из двух оставшихся не открытыми дверей, то есть 50 на 50.

   А сейчас вернёмся к условиям задачи, когда ведущий после выбора вами двери открывает одну из двух оставшихся дверей и предлагает изменить выбор. Теперь перед вами снова выбор из двух дверей: одной из оставшихся не открытыми и той, которую вы уже выбрали. Почему же все считают, что автомобиль не может находиться за выбранной вами дверью? Какие для этого есть основания? Да никаких! Более того, теперь ваша уверенность в том, что вы близки к успеху должна ещё больше возрасти! Ведь вы видите, что ваши шансы с 1-го к 3-м резко подскочили до 1-го к 2-м! И после открытия одной из дверей логически верный  вывод звучит так: «Автомобиля нет за открытой дверью, потому что там коза. Следовательно, автомобиль находится за одной из оставшихся дверей: либо за той, на которую я не указал, либо за той, что я выбрал». Ну и какие мотивы должен иметь человек для смены выбора? Да любые, кроме оценки вероятности, потому что она равна 50 на 50.

   Таким мотивом могло бы стать, к примеру, знание человека о своей абсолютной невезучести. Да и то лишь на первый взгляд. Потому что закон подлости и невезучие так не обманешь. Они проявятся только в итоге, когда вы сделаете свой выбор окончательно и не угадаете. Другим мотивом могло бы стать сознательное предпочтение одной из стратегий, а именно «стратегии постоянной смены выбора в длительных сериях выбора при любых ситуациях». Но такая стратегия в данной ситуации не по мне. Потому что она олицетворяет неуверенность человека в себе, в своём выборе, исходящая из постоянной ошибочности принятия первоначальных решений. В таком случае стоит задуматься о побудительных мотивах первоначального принятия решения. Но и при такой стратегии неудача также будет удивлять (по оценке вероятности) от 33 до 67 раз из 100 тех, кто решится на изменение своего первоначального выбора. А возможно и больше, как, впрочем, и меньше, но это уже зависит от самого человека – является ли он удачливее других или наоборот.

   Всех вводит в заблуждение в подобных ситуациях выбора именно оценка степени вероятности событий. Ведь человеку для разумного выбора нужен разумный довод. Оценка степени вероятности, казалось бы, и является таким разумным доводом в пользу принятия того или иного решения. Но это будет так, только если правильно осознавать, что даёт оценка степени вероятности событий и как она отражает реальность или, другими словами, воплощается в реальности. Иначе все её расчёты будут безотносительны и будут лишь походить на «жонглирование цифрами».

   Оценивая выбор с точки зрения оценки вероятности, все при этом забывают, что она наиболее точно описывает действительность только при возрастании количества опытов. Об этом и говорит закон больших чисел Бернулли: «…Закон больших чисел в форме Бернулли состоит в следующем: с вероятностью, сколь угодно близкой к единице, можно утверждать, что ПРИ ДОСТАТОЧНО БОЛЬШОМ ЧИСЛЕ ОПЫТОВ (выделено мной – Джастмэн) частота появления события А как угодно мало отличается от его вероятности, т. е…» (Теория вероятности, §5. 3. Закон больших чисел Бернулли. , http://www.toehelp.ru/theory/ter_ver/5_3). 
 Даже только из данной формулировки закона можно сделать простой логический вывод: следовательно, при малом числе опытов частота появления события «А»  КАК УГОДНО МНОГО МОЖЕТ ОТЛИЧАТЬСЯ  от его вероятности. Что и наблюдается в действительности. Если взять произвольный период из длительной серии опытов, к примеру, тысячу или даже сотню опытов поделить на периоды по 10 или 5 опытов, то в пределах каждого отдельного периода будет наблюдаться по факту изменение вероятности события от 0 до 100% (от 0 до 1). Об этом я написал в «Парадоксах лотереи и закона больших чисел Бернулли» (http://proza.ru/2009/07/01/188), указав примерную схему чередований двух вариантов события:

А,  Б,  А,  Б,  ААА,   Б,  АА,  ББ,  АА,  ББББББ,  АА,  БББ,  А,  ББББББ,  ААА,  Б,  АА,  ББ,  А,  Б,  АААА,  Б,  АА,  БББ,  АААА,  Б,  А,  Б,  А… (по 30 А и Б, всего 60).

Из неё видно, что варианты события чередуются сериями. Серии можно наблюдать во всех областях жизни. Вариативность событий и достигается тем, что варианты выпадают сериями, то есть от 1 до нескольких выпадений подряд. Но при этом длина каждой серии не может возрастать бесконечно, как и их частота. Иначе баланс вероятности допустит крен в одну из сторон, что уменьшит вариативность. При этом вероятность каждого варианта события в сумме всех периодов, которые и составляют «длину серии опытов», в нашем примере это 100, или 1000, или как на схеме 60 опытов, будет действительно «как угодно мало» отличаться от рассчитанной по формуле вероятности события. Например, в серии из ста опытов подкидывания монетки «орёл» и «решка» выпадут примерно поровну, то есть в соотношении 40-60% на 60-40%. Но при этом закон не запрещает выпасть сначала 50 раз «решке», а потом 50 раз «орлу», как и не запрещает выпадать им по очереди через один раз. Но при этом в первых 50 опытах «решка» может выпасть и лишь 10 раз, а «орёл» 40 раз, чередуясь, а в следующих 50 опытах наоборот. Это все наблюдали не раз и в жизни. Но чаще всего игроки. Именно, исходя из такого наблюдения, их ожидания, а, значит, стратегия и меняются. Но, даже зная, что вероятность вариантов в рамках периода меняется, нельзя заранее знать, что именно в первой половине опытов больше выпадет «решка», а во второй «орёл». И тем более нельзя точно знать, что именно в первом опыте, как, впрочем, и в последнем, или в любом другом выпадет именно сейчас «решка» или именно сейчас «орёл». Поэтому при единичном выборе или даже при короткой серии выборов оценка степени вероятности играет малую роль. И при угадывании с одного раза, как в нашей ситуации с автомобилем, мы не можем утверждать, выпадет ли нам «орёл» или «решка» первым опытом, то есть угадаем мы или нет из двух вариантов, двух дверей. А нам, как раз, первая попытка и нужна.

   Поэтому я сделаю свой первоначальный выбор варианта, основываясь на собственном понимании ситуации и собственных знаниях и интуиции, и останусь ему верен, если не изменятся исходные данные для моего решения помимо оценки вероятности.

   Возможно даже, что самый случайный выбор и является самым верным, дарованным нам свыше в соответствии с неизвестными нам законами, приведшими нас в это самое время и место к этому самому выбору.

                14.07.2009