<<
>>

Глава 7 В поисках практической достоверности

Шла Вторая мировая война. Зимней ночью во время одного из налетов немецкой авиации на Москву известный советский профессор статистики неожиданно появился в своем дворовом бомбоубежище.
До тех пор он никогда туда не спускался. «В Москве семь миллионов жителей, — говаривал он. — Почему я должен ожидать, что попадут именно в меня?» Удивленные друзья поинтересовались, что заставило его изменить свою точку зрения. «Подумать только! — воскликнул он. — В Москве семь миллионов жителей и один слон. Прошлой ночью они убили слона».

Это современный вариант рассматриваемого в «Логике» Пор-Роя-ля примера с боязнью грозы, хотя и отличается от него мотивацией личностной установки в условиях риска. Здесь профессор превосходно понимал, насколько мала математическая вероятность попасть под бомбу. Его поведение наглядно иллюстрирует двойственный характер всего, что связано с вероятностью: частота события в прошлом вступает в конфликт с эмоциональной оценкой действительности и влияет на выбор поведения в условиях риска.

Смысл истории этим не исчерпывается. Она перекликается с подходом Гранта, Петти и Галлея: если точное знание будущего и даже прошлого недостижимо, какова достоверность имеющейся у нас информации? Что важнее для принятия решения: семь миллионов москвичей или погибший слон? Как мы должны оценивать добавочную информацию и как включать ее в оценки, базирующиеся на исходной информации? Является ли теория вероятностей математической забавой или серьезным инструментом прогнозирования?

Теория вероятностей является серьезным инструментом прогнозирования, но при пользовании им нельзя забывать о том, что, как говорится, дьявол в мелочах, что все зависит от качества информации, на основе которой вероятность оценивается. Эта глава посвящена осуществленной в течение XVIII столетия последовательности гигантских шагов, революционизировавших использование информации и определивших методологию применения теории вероятностей в задачах выбора и принятия решений в современном мире.

Впервые изучением связей между вероятностью события и качеством исходной информации занялся второй из старших Бернул-ли — Якоб (1654-1705), дядя известного Даниила Бернулли1.

Он был еще ребенком, когда Паскаль и Ферма высказали свои замечательные математические идеи, и умер, когда его племяннику Даниилу едва исполнилось пять лет. Талантливый, как все Бернулли, он был современником Исаака Ньютона и, обладая свойственным всем Бернулли сложным и самолюбивым характером, считал себя соперником великого английского ученого.

Сама по себе постановка Якобом обсуждаемого вопроса, даже если отвлечься от предложенных им ответов, была научным подвигом. По его признанию, он размышлял над этой проблемой двадцать лет и окончил посвященный ей труд незадолго до смерти, последовавшей в 1705 году.

Якоб был самым мрачным из Бернулли, особенно к концу жизни, несмотря на то что он жил в веселые и легкомысленные времена, наступившие в Англии после реставрации монархии в 1660 году и восшествия на престол Карла II1) (Ему была свойственна своеобразная поэтичность, сказавшаяся, к примеру, в пожелании, чтобы на его могильном камне высекли прекрасную спираль Фибоначчи, поскольку ее свойство расширяться, не изменяя формы, является «символом стойкости и неизменности посреди хаоса и напастей, а в конечном итоге — даже нашего воскрешения во плоти». Под спиралью он потребовал выбить эпитафию: «Eadem Ми-tata resurgo» («Неизменная в вечном движении»), см.: [David, 1962, р. 139].), когда, например, один из его весьма известных современников Джон Арбутнот, лекарь королевы Анны, член Королевского общества и математик-дилетант, занимавшийся проблемами вероятности, считал уместным для иллюстрации содержащихся в своих опусах положений сдабривать их фривольными примерами, обсуждая вероятность того, что «женщина в двадцатилетнем возрасте сохранила девственность» или что «лондонский щеголь того же возраста не болен триппером»2.

В 1703 году Якоб Бернулли впервые поставил вопрос о зависимости получаемого значения вероятности от выборки. В письме к своему другу Лейбницу он заметил, что ему кажется странным, что нам известна вероятность выпадения семи, а не восьми очков при игре в кости, но мы не знаем, с какой вероятностью двадцатилетний переживет шестидесятилетнего.

Не следует ли нам, спрашивает он, для ответа на этот вопрос подвергнуть исследованию множество пар людей всех возрастов?

Отвечая Бернулли, Лейбниц пессимистически оценил этот подход. «Природа установила шаблоны, имеющие причиной повторяемость событий, — пишет он, — но только в большинстве случаев. Новые болезни захлестнули человечество, так что не имеет значения, сколько опытов вы провели над трупами, — на их основе вам не установить таких границ природы событий, чтобы в будущем не осталось места вариациям»3. Хотя письмо Лейбница написано на латыни, выражение «но только в большинстве случаев» он написал по-гречески: со? ети то тсоХи. Очевидно, этим он хотел подчеркнуть, что конечное число опытов, предлагаемое Якобом, с неизбежностью окажется недостаточным для точного исчисления замыслов природы 2).

Реакция Лейбница не обескуражила Якоба, но внесла коррективы в его подход к решению проблемы. Лейбницево предупреждение по-гречески не прошло даром.

Усилия Якоба определить вероятность на основе обследования выборки данных нашли отражение в его «Ars Conjectandi», работе, которую его племянник Николай полностью опубликовал через восемь лет после смерти автора в 1713 году4.(В одном из последующих писем Якобу Лейбниц заметил: «Можете не сомневаться, что любой, кто попытается на основе данных о продолжительности жизни в современных Лондоне и Париже делать выводы о смертности праотцев, живших до Потопа, придет к чудовищно искаженным выводам» [Hacking, 1975, р. 164]). Интерес Якоба сосредоточен на том, чтобы показать, где метод логического вывода — объективный анализ данных — кончается и начинается другой метод — прогнозирование на основе вероятностных законов. В известном смысле здесь прогнозирование рассматривается как процесс восстановления целого по части.

Якоб начинает свой анализ с констатации того, что в теории вероятностей для принятия гипотезы о возможности события «необходимо только подсчитать точное число возможных событий и затем определить, насколько наступление одного события более вероятно, нежели наступление другого».

Трудность, на которую он постоянно указывает, заключается в том, что использование вероятности ограничено почти исключительно случайными играми. С этой точки зрения достижения Паскаля представляются не более как интеллектуальной забавой.

Для Якоба это ограничение имеет принципиальное значение, о чем свидетельствует его рассуждение, созвучное Лейбницеву предупреждению:

Но кто из смертных... может установить число болезней, подсчитав все, причиняющие страдания человеческому телу... и насколько фатальный исход от одной болезни более вероятен, чем от другой — от чумы или от водянки... от водянки или от лихорадки, — и на этой основе сделать предсказания о соотношении жизни и смерти для будущих поколений? ...Кто может претендовать на столь глубокое проникновение в природу человеческого духа и изумительную структуру тела, чтобы в играх, результат которых зависит от... остроты ума или физической ловкости игроков, рискнуть предсказать, кто из игроков выиграет и кто проиграет?

Якоб указывает на принципиальное отличие между реальностью и абстракцией при использовании вероятностных законов. Например, предложенное Пацциоли рассмотрение незавершенной игры в balla, как и пример с гипотетическим неоконченным турниром на первенство по бейсболу, о котором у нас шла речь при обсуждении треугольника Паскаля, не имеет ничего общего с реальными жизненными ситуациями. В реальной жизни игроки в balla, как и участники бейсбольного турнира, обладают различной «остротой ума и физической ловкостью» — качествами, которые я игнорировал в приведенных ранее упрощенных примерах использования законов вероятности для предсказания событий. Треугольник Паскаля дает только намек на исход игры в реальных условиях.

Теория может определить вероятность тех или иных исходов для игры в казино или лотереи — здесь нет необходимости вращать колесо рулетки или считать лотерейные билеты, чтобы определить характер результата, но в реальной жизни важна относящаяся к делу информация. Беда в том, что мы никогда не обладаем ей в нужном объеме.

Природа устанавливает шаблоны, но «только в большинстве случаев». В теории, которая абстрагируется от природы, дело обстоит проще: мы или имеем необходимую информацию, или не нуждаемся в ней. Как сказал цитированный в введении Фишер Блэк, мир выглядит более упорядоченным с территории Массачусетского технологического института, чем в перспективе хаотического бурления Уолл-стрит.

В нашем обсуждении гипотетической игры в balla и воображаемого бейсбольного турнира статистика игр, физические способности и интеллектуальное развитие игроков не имели отношения к делу. Игнорировалась даже сама природа игры. Теоретический подход полностью подменял конкретную информацию.

В реальности фанатики бейсбола, как и брокеры фондовой биржи, собирают массу статистических данных, потому что эта информация необходима им для оценки класса игроков и команд или для оценки будущей прибыльности акций. И даже заключения экспертов с вероятностными оценками конечных результатов, полученные на основе обработки тысяч фактов, и в спорте и в финансах оставляют место сомнениям и неопределенности.

Треугольник Паскаля и все предшествующие работы по теории вероятностей отвечали только на один вопрос: какова вероятность того или иного отдельного события. Ответ на этот вопрос в большинстве случаев имеет ограниченную ценность, поскольку чаще всего он мало что дает для оценки ситуации. Что на деле даст нам знание того, что игрок А имеет 60% шансов победить в отдельной партии в balla? Можно ли на этом основании утверждать, что он способен победить игрока В в 60% партий? Ведь победы в одном турнире недостаточно для этого утверждения. Сколько раз должны сыграть А и В, чтобы мы могли убедиться, что А играет лучше, чем В? Что говорит нам результат бейсбольного турнира этого года о вероятности того, что победившая команда является самой сильной вообще, а не только в этом году? Что говорит высокий процент смертности от рака легких среди курильщиков о вероятности того, что курение раньше срока сведет в могилу именно вас? Свидетельствует ли смерть слона о целесообразности спускаться в бомбоубежище при налетах?

Реальные жизненные ситуации часто требуют от нас определения вероятности вполне определенного исхода на пути заключения от частного к общему.

В жизни очень редко встречаются задачи, сводящиеся к чистой игре случая, для которых можно определить вероятность исхода до изучения ряда событий — a priori, как сказал бы Якоб Бернулли. В большинстве случаев мы вынуждены определять вероятности на основе имеющихся данных после ряда происшедших событий — a posteriori. Само понятие a posteriori предполагает эксперимент и измерение степени уверенности. В Москве семь миллионов жителей, но после гибели слона от фашистской бомбы профессор решил, что пришло время спускаться в бомбоубежище.

Вклад Якоба Бернулли в решение проблемы определения вероятности на основе информации об ограниченном наборе реальных событий был двояким. С одной стороны, он сформулировал задачу в этом виде в то время, когда никто еще даже не усматривал необходимости ее постановки. С другой — он предложил решение, зависящее только от одного необходимого условия: мы должны предположить, что «при равных условиях наступление (или не наступление) события в будущем будет следовать тем же закономерностям, какие наблюдались в прошлом»5.

Это допущение чрезвычайно важно. Якоб мог сетовать на то, что в реальной жизни информация очень редко оказывается достаточно полной, чтобы применять простые вероятностные законы для предсказания результатов. Но он признаёт, что оценка вероятностей постфактум также невозможна, пока мы не примем предположения, что прошлое является прообразом будущего. Трудность этого предположения не требует пояснений.

Какие бы данные мы ни отбирали для анализа, прошлое остается лишь фрагментом реальности. Эта фрагментарность играет решающую роль при переходе от ограниченного набора данных к обобщению. Мы никогда не имеем (или не можем позволить себе собрать) всей информации, в которой нуждаемся, чтобы обладать той же уверенностью, с какой без тени сомнения утверждаем, что у игральной кости шесть граней с нанесенными на каждую разными цифрами или что у колеса европейской рулетки 37 лунок (у американской 38) с разными числами против каждой. Реальность представляет собой серию взаимосвязанных событий, зависимых друг от друга, и принципиально отличается от случайных игр, в которых результат каждой отдельной игры не влияет на результат последующей. В случайных играх все сводится к определенным числам, а в реальной жизни мы чаще используем приблизительные оценки — «мало», «много» или «не очень много», а не точные количественные величины.

Якоб Бернулли невольно определил содержание оставшейся части моей книги. С этого момента разговор об управлении риском будет сводиться к использованию трех его основополагающих предположений — полнота информации, независимость испытаний и надежность количественных оценок. В каждом отдельном случае вопрос о правомерности этих предположений является главным для решения вопроса о том, насколько успешно мы можем использовать измерения и информацию для прогнозирования будущего. По существу, эти предположения определяют наш взгляд на прошлое: можем ли мы объяснить происшедшее, или при описании события следует прибегнуть к понятию чистой случайности (что, иначе говоря, означало бы, что мы не имеем объяснения)?

Несмотря на все трудности, нам приходится иногда осознанно, чаще неосознанно предполагать, что перечисленные Якобом необходимые условия выполняются, даже если нам достаточно хорошо известны отличия реальности от идеального случая. Наши ответы могут быть неточными, но описанная в этой главе методология, разработанная Якобом Бернулли и другими математиками, просто принуждает нас заняться определением вероятности будущих событий на основе ограниченных наборов данных о прошлых событиях.

Теорема Якоба Бернулли о вычислении вероятности a postetiori известна как закон больших чисел. Вопреки распространенной точке зрения этот закон не дает метода оценки наблюдаемых фактов, которые являются лишь несовершенным отображением явления в целом. Не следует из него и утверждение, будто увеличение числа наблюдений влечет за собой возрастание вероятности совпадения того, что мы видим, с тем, что мы исследуем. Закон не является и средством улучшения качества тестов: Якоб не забыл замечание Лейбница и отверг свои первоначальные идеи о поиске четких ответов на основе эмпирических тестов.

Якоба интересовало другое определение вероятности. Предположим, вы подбрасываете монету. Закон больших чисел не утверждает, что среднее число выпадений орла будет приближаться к 50% при увеличении числа бросков; простые вычисления дадут вам этот ответ и избавят от утомительного подбрасывания монеты. Закон, скорее, утверждает, что при увеличении числа бросков будет возрастать вероятность того, что процент появлений орла в общем числе бросков будет отличаться от 50% на величину, меньшую сколь угодно малой заданной величины. В слове «отличаться» все дело. Речь идет не об истинности значения 50%, а о вероятности того, что отклонение наблюдаемого среднего значения вероятности от расчетного будет меньше, чем, скажем, 2%, — другими словами, что с увеличением числа бросков эта вероятность будет возрастать.

Это не означает, что при бесконечном числе бросков отклонений не будет; Якоб явным образом исключает этот случай. Не означает это и того, что отклонение будет с необходимостью становиться пренебрежимо малым. Закон лишь утверждает, что среднее значение при большом числе бросков будет с большей, чем при малом числе бросков, вероятностью отличаться от истинного среднего на величину, меньшую наперед заданной. Но всегда останется возможность того, что наблюдаемый результат будет отличаться от истинного среднего на величину, большую некоей заданной. Семи миллионов жителей Москвы оказалось недостаточно для профессора статистики.

Закон больших чисел не надо путать с законом о среднем. Математики говорят нам, что вероятность выпадения орла при одном бросании монеты составляет 50%, — но результат каждого броска не зависит от всех остальных. Он не зависит от результата предшествующих бросков и не влияет на результаты последующих. Следовательно, закон больших чисел не утверждает, что вероятность выпадения орла для отдельного броска станет выше 50%, если в первых ста или миллионе бросков только в 40% случаев выпал орел. Закон больших чисел отнюдь не обещает, что вы отыграетесь после серии проигрышей.

Для иллюстрации закона больших чисел Якоб предложил мысленный эксперимент с кувшином, наполненным 3000 белых камешков и 2000 черных, ставший с тех пор очень популярным среди специалистов по теории вероятностей и авторов математических головоломок. Он оговаривает, что нам должно быть неизвестно, сколько камешков каждого цвета в кувшине. Мы по одному вынимаем камешки из кувшина, фиксируем цвет каждого из них и возвращаем обратно в кувшин. Из факта, что по мере возрастания числа обследованных таким образом камешков мы получаем «практическую достоверность» (moral certainty) — имеется в виду достоверность в обыденном смысле слова, а не абсолютная достоверность — того, что число белых и число черных камешков будут соотноситься как 3:2, Якоб заключает, что «мы можем определить это соотношение a posteriori с почти той же точностью, как если бы оно было известно нам a priori»6. Его расчеты показывают, что 25 550-кратного вытаскивания камешков из кувшина будет достаточно, чтобы с вероятностью, превышающей 1000/iooi' утверждать, что результат будет 3/2 с точностью 2%. Это и есть ваша практическая достоверность.

Якоб не использует выражение «практическая достоверность» необдуманно. Оно покоится на его определении вероятности, позаимствованном из одной ранней работы Лейбница. «Вероятность, — утверждает он, — это степень достоверности и отличается от абсолютной достоверности как часть отличается от целого»7.

Но Якоб идет дальше Лейбница в обсуждении того, что означает понятие «достоверность». Наше индивидуальное суждение о достоверности — вот что привлекает внимание Якоба: условие практической достоверности имеет место, если мы почти абсолютно убеждены в верности суждения. Когда Лейбниц вводил это понятие, он определил его как «бесконечную вероятность». Сам Якоб удовлетворяется вероятностью 1000/юо1> но он хочет подстраховаться: «Было бы полезным, если бы должностные лица установили пределы практической достоверности»8.

Якоб торжествует. Отныне, утверждает он, мы можем делать предсказания о любых неопределенных величинах с той же степенью научной обоснованности, как и предсказания в случайных играх. Он перевел вероятность из сферы теории в мир реальности:

Если вместо кувшина мы обратимся, например, к атмосфере или человеческому телу, в котором таится множество самых разных процессов или болезней, как камешков в кувшине, то на основе наблюдений мы сможем определить, насколько наступление одного события более вероятно, чем наступление другого9.

Однако, как оказалось, с кувшином у Якоба не обошлось без хлопот. Расчет, показавший необходимость 25550 испытаний для получения практической достоверности, должен был ужаснуть его неприемлемой величиной этого числа; в те времена население его родного города Базеля было меньше 25550 человек. Судя по тому, что именно на этом месте его книга обрывается, можно предположить, что он растерялся и не знал, как быть дальше. Приходилось делать вывод, что трудно найти в реальной жизни случаи, в которых все наблюдения удовлетворяли бы требованию независимости друг от друга:

Таким образом, если все события вечно повторяются, приходится признать, что всё в мире происходит по определенным причинам в соответствии с определенными правилами, и мы вынуждены предположить относительно наиболее явно случайных вещей наличие некоей необходимости, или, иначе говоря, РОКА10.

Тем не менее его кувшин с камешками заслужил бессмертие. Эти камешки стали инструментом в первой попытке измерить неопределенность — точнее, определить ее — и вычислить вероятность того, что эмпирически определенное значение случайной величины близко к истинному, даже если истинное значение неизвестно.

Якоб Бернулли умер в 1705 году. Его племянник Николай — Николай Медлительный — продолжил исследования дяди, связанные с определением вероятностей на основе наблюдений, одновременно медленно, но верно завершая подготовку к изданию «Ars Conjec-tandi». Его результаты были опубликованы в том же 1713 году, в котором наконец вышла в свет книга Якоба.

Якоб для начала задает вероятность того, что отклонение наблюдаемого значения от истинного окажется в некоем определенном интервале, а затем вычисляет число наблюдений, необходимое для получения именно этого заданного значения. Николай поставил перед собой обратную задачу. Считая число наблюдений заданным, он вычислял вероятность того, что отклонение наблюдаемого среднего от истинного окажется в заданных пределах. Он использовал пример, в котором предполагал, что отношение числа рождающихся мальчиков к числу рождающихся девочек равно 18:17. Если общее число рождений составляет, скажем, 14000, ожидаемое число рождений мальчиков должно быть 7200. Затем он рассчитал, что с шансами по меньшей мере 43,58 к 1 действительное число родившихся мальчиков окажется в интервале 7200 + 163 и 7200 - 163, то есть между 7363 и 7037.

В 1718 году Николай предложил французскому математику Абрахаму де Муавру присоединиться к его исследованиям, но де Муавр отверг это предложение: «Я хотел бы оказаться способным... применить теорию случайностей (Doctrine of Chances) к решению экономических и политических задач, [но] с готовностью передаю мою часть работы в лучшие руки»11. Из этого ответа де Муавра Николаю следует, что исследования по использованию вероятности и прогнозированию быстро продвигались вперед.

Де Муавр родился в 1667 году — через 13 лет после Якоба Бернулли — в протестантской семье во Франции, в обстановке возрастающей враждебности ко всем некатоликам12. В 1685 году, когда ему было 18 лет, король Людовик XIV отменил Нантский эдикт, провозглашенный в 1598 году родившимся в протестантской вере королем Генрихом IV и предоставивший протестантам, называемым гугенотами, равные политические права с католиками. После отмены эдикта исповедование реформатской религии было запрещено, дети гугенотов должны были воспитываться в католической вере, эмиграцию запретили. Де Муавр свыше двух лет провел в тюрьме за свои религиозные убеждения. Ненавидя Францию и все с нею связанное, он в 1688 году бежал в Лондон, где Славная революция как раз покончила с остатками государственного католицизма. На родину он так и не вернулся.

В Англии де Муавр вел печальную и неустроенную жизнь. Несмотря на все усилия, ему не удалось добиться приличной академической должности. Он зарабатывал на жизнь уроками математики и консультациями по применению теории вероятностей для игроков и страховых брокеров. С этой целью он держал неофициальную приемную в кофейне Слайтера, что на улице Святого Мартина, где большей частью и проводил остаток дня по окончании занятий с учениками. Хотя он был другом Ньютона и стал членом Королевского общества уже в тридцать лет, он так и остался едким, ушедшим в себя, асоциальным человеком. Умер он в 1754 году в бедности и слепоте в возрасте 87-ми лет.

В 1725 году де Муавр опубликовал работу, озаглавленную «Пожизненная рента» («Annuities upon Lives»), с анализом таблиц Галлея о продолжительности жизни и смертности в Бреслау. Хотя книга посвящена главным образом научным проблемам, в ней обсуждаются многие вопросы, относящиеся к головоломкам, которые пытались решить Бернулли и которые позднее де Муавр детально исследовал.

Историк статистики Стивен Стиглер (Stigler) приводит интересный пример, рассмотренный в работе де Муавра о ренте. Таблицы Галлея свидетельствовали, что в Бреслау из 346 человек пятидесятилетнего возраста только 142, то есть 41%, дожили до семидесяти лет. Это очень маленькая выборка. В какой мере можно использовать этот результат для выводов об ожидаемой продолжительности жизни пятидесятилетних? Де Муавр не мог использовать эти числа для определения вероятности того, что человек в возрасте пятидесяти лет имеет меньше 50% шансов дожить до семидесяти, но он мог бы ответить вот на какой вопрос: «Если в действительности шансы равны, какова вероятность того, что выборка покажет величину не более 142/з4в?»

Первая прямо посвященная теории вероятностей работа де Муавра озаглавлена «De Mensura Sortis» (буквально «Об измерении случайных величин»). Работа была впервые опубликована в 1711 году в журнале Королевского общества «Philosophical Transactions». В 1718 году де Муавр предпринял значительно расширенное издание этой работы на английском языке, озаглавленное «Теория случайностей» («The Doctrine of Chances»), с посвящением своему близкому другу Исааку Ньютону. Книга имела огромный успех и выдержала еще два издания в 1738-м и 1756 годах. Работа, видимо, произвела сильное впечатление на Ньютона, который при случае говорил своим студентам: «Обратитесь к мистеру де Муавру, он знает эти вещи лучше меня». «De Mensura Sortis», по-видимому, первая работа, в которой риск определен как шанс проигрыша: «Риск проиграть некую сумму обратен ожиданию выигрыша, и истинной мерой его является произведение поставленной на кон суммы на вероятность проигрыша».

В 1730 году де Муавр в конце концов обратился к предложенной Николаем Бернулли теме — насколько хорошо реальная выборка отображает свойства совокупности, на основе которой она построена. В 1733 году он опубликовал полное решение задачи и включил его во второе и третье издания «Теории случайностей». Он начинает с признания, что Якоб и Николай Бернулли «показали очень большое искусство... Однако некоторые вещи нуждаются в дальнейшей разработке». В частности, подход обоих Бернулли «представляется настолько трудоемким и связан с такими сложностями, что до сих пор мало кто соглашался их преодолевать».

Действительно, необходимость проведения 25550 испытаний делала решение задачи практически неосуществимым. Даже если бы, как утверждал Джеймс Ньюмен, Якоб Бернулли в приведенном им примере был бы готов удовлетвориться «практической достоверностью», не большей, чем в пари с равными шансами, — вероятностью 50/юо того, что результат будет с точностью до 2% равен 3/2, — и то понадобилось бы 8400 испытаний. По нынешним стандартам требование Якобом вероятности 1000/iooi курьезно само по себе. Сегодня большинство статистиков принимают несовпадение не более чем в 1 из 20 случаев как основание признания значимости (так сегодня называют практическую достоверность) результата с более чем достаточной степенью вероятности.

Достижения де Муавра в решении этой проблемы стоят в ряду наиболее важных математических открытий. Используя вычисления и основные свойства треугольника Паскаля, составляющие содержание биномиальной теоремы, де Муавр демонстрирует, как ряд случайных испытаний, подобных опытам Бернулли с кувшином, приводит к распределению результата вокруг среднего значения. К примеру, предположим, вы вытащили сто камешков подряд из кувшина Якоба, каждый раз возвращая камешек в кувшин и фиксируя отношение числа черных и белых камешков. Теперь предположим, вы выполнили серию таких опытов по сто испытаний в каждом. Де Муавр смог бы заранее приблизительно сказать вам, сколько из этих отношений будут близки к среднему отношению в суммарном числе испытаний и как эти отдельные отношения будут распределены относительно этого среднего.

Распределение де Муавра ныне известно как нормальная, или, в соответствии с ее формой, колоколообразная кривая. Эта кривая показывает, что наибольшее число наблюдений группируется в центре, вблизи среднего значения, вычисленного для суммарного числа наблюдений. Она симметрично спускается по обе стороны от среднего значения, вблизи его круто, а затем все более полого. Другими словами, результаты наблюдений, далекие от среднего значения, менее вероятны, чем близкие к нему.

Форма кривой де Муавра позволила ему вычислить статистическую меру ее дисперсии относительно среднего значения. Эта мера, известная как стандартное или среднее квадратичное отклонение*(В русской научной литературе чаще используется второй термин, известный также как среднее квадратическое. — Примеч. науч. редактора.), чрезвычайно важна для решения вопроса о том, включает ли в себя совокупность наблюдений достаточно репрезентативную для изучаемой совокупности выборку. В нормальном распределении приблизительно 68% результатов наблюдений оказываются в пределах одного среднего квадратичного отклонения от среднего значения и 98% — в пределах двух средних квадратичных отклонений.

Среднее квадратичное отклонение может сказать нам, не имеем ли мы дело со случаем «голова-в-духовке-ноги-в-холодильнике», когда любые рассуждения о среднем являются бессмысленными. Среднее квадратичное отклонение может также сказать нам, что 25 550 манипуляций с камешками Якоба позволяют весьма точно оценить соотношение числа черных и белых камешков в кувшине, поскольку относительно малое число наблюдений будет сильно отличаться от среднего значения.

Де Муавр был поражен закономерностью, которая проявлялась с увеличением числа случайных и независимых наблюдений; он относил эту упорядоченность к предписаниям Всемогущего. Это приводит к мысли, что при правильно выбранных условиях измерения можно в самом деле преодолеть неопределенность и приручить риск. Используя курсив, чтобы подчеркнуть значение сказанного, де Муавр так подытожил свои исследования: «Случай порождает Отклонения от закономерности, однако бесконечно велики Шансы, что с течением Времени эти Отклонения окажутся пренебрежимо ничтожными относительно повторяемости того Порядка, который естественным образом является результатом БОЖЕСТВЕННОГО ПРЕДНАЧЕРТАНИЯ»13.

Вкладом де Муавра в математику был инструмент, который сделал возможной оценку вероятности того, что заданное число наблюдений попадет в некоторую область вокруг истинного отношения. Этот результат нашел широкое практическое применение.

Например, все производители опасаются того, что результатом сборки может оказаться бракованная продукция, которая дойдет до потребителей. Стопроцентное качество в большинстве случаев практически невозможно — наш мир, похоже, непоправимо враждебен совершенству.

Представьте себе директора булавочной фабрики, который старается добиться, чтобы бракованные булавки встречались не чаще, чем в 10 случаях из 100000, то есть чтобы брак составлял не более 0,01% от объема производства14. Для контроля дел он проводит обследование произвольной выборки из 100 000 сошедших с конвейера булавок и выясняет, что у 12 нет головок — на 2 больше, чем он надеялся получить в среднем по всей производимой продукции. Насколько значима эта разница? Какова вероятность найти 12 бракованных булавок из выборки объемом в 100000, если средний процент брака составляет 10 бракованных булавок на каждый 1 000 000? Нормальное распределение и среднее квадратичное отклонение де Муавра дают ответ на этот вопрос.

Но обычно вопрос ставится по-иному. Чаще никто точно не знает, сколько именно бракованных изделий в среднем выпускает фабрика. Вопреки благим намерениям действительная доля брака может оказаться в среднем выше, чем 10 из 100000. Что скажет выборка из 100000 булавок о вероятности того, что для всей выпускаемой продукции брак в среднем составляет 0,01%? Насколько более точные сведения можно получить из выборки объемом в 200 000 булавок? Какова вероятность того, что процент брака окажется в пределах от 0,009% до 0,011%? А в пределах от 0,007% до 0,013%? Какова вероятность того, что одна наугад взятая булавка окажется бракованной?

Здесь исходными данными являются 10 булавок, 12 булавок, 1 булавка, а вероятность оказывается искомой величиной. В такой постановке задача сводится к вычислению так называемой обратной вероятности: какова вероятность того, что по всей произведенной продукции брак составляет в среднем 0,01%, если в выборке из 100000 булавок оказалось 12 бракованных?

Одно из наиболее эффективных решений этой задачи было предложено пастором Томасом Байесом, который родился в 1701 году и жил в Кенте15. Байес был нонконформистом. Он отвергал большинство обрядов англиканской церкви, перенятых ею от католической после отделения от Рима во время правления Генриха VIII.

Хоть Байес и был членом Королевского общества, известно о нем немного. В одном довольно скучном и безликом учебнике статистики он характеризуется :сак «загадочная личность»18. При жизни он не издал ни одного сочинения по математике и оставил только две работы, которые были опубликованы после его смерти, но не смогли обратить на себя должного внимания.

Тем не менее одна из этих работ, «О решении проблемы в теории случайностей» («Essay towards Solving a Problem in the Doctrine of Chances»), оказалась замечательно оригинальным произведением, которое обессмертило имя Байеса среди статистиков, экономистов и других представителей социальных наук. В нем заложены основы современных методов статистического анализа, начало работы над которыми было положено трудами Якоба Бер-нулли.

После смерти Байеса в 1761 году, согласно составленному за год до того завещанию, рукопись этой работы и сто фунтов стерлингов достались «Ричарду Прайсу, в настоящее время, как я полагаю, пастору в Ньюингтон-Грин»17. Любопытно, что у Байеса были столь неверные сведения о Прайсе, фигуре тогда намного более важной, чем простой священник в маленьком городке графства Кент.

Ричард Прайс был человеком высоких нравственных принципов, страстным поборником свободы вообще и свободы вероисповедания в частности. Он был убежден, что свобода дана человеку Богом и поэтому является непременным условием нравственного поведения, и утверждал, что лучше быть свободным грешником, чем рабом. В 1780 году он написал книгу об американской революции с чрезвычайно длинным названием: «Соображения о значении американской революции и путях превращения ее во всемирное благо» («Observations on the Importance of the American Revolution and the Means of Making it a Benefit to the World»), в которой выразил свою веру в то, что революция была предначертана Богом. Рискуя собой, он заботился о перемещенных в Англию американских военнопленных. Он был другом Бенджамина Франклина и хорошо знал Адама Смита. Смит отсылал Франклину и Прайсу некоторые главы книги «О богатстве народов» («The Wealth of Nations») для чтения и критических замечаний.

Одна разновидность свободы беспокоила Прайса: свобода заимствования. Он был глубоко озабочен величиной национального долга Британии, выросшего в результате войн с Францией и с колонистами Северной Америки. Он сетовал по поводу непрекращающегося накопления государственного долга и называл его «величайшим национальным злом»18.

Но Прайс был не просто священником и страстным поборником свободы. Он известен также как математик, который за работы в области теории вероятностей был принят в члены Королевского общества.

В 1765 году три человека из страховой компании, носящей название «Общество справедливости» (Equitable Society), пригласили Прайса помочь им в составлении таблиц смертности, на основе которых должны были определяться размеры сборов при страховании жизни и продаже пожизненной ренты. После изучения среди прочих трудов Галлея и де Муавра Прайс опубликовал по этому вопросу две статьи в «Philosophical Transactions»; его биограф Карл Кон сообщает, что голова Прайса поседела за одну ночь от напряжения при работе над второй из этих статей.

Прайс начал с изучения записей в лондонских регистрационных книгах, но математическое ожидание продолжительности жизни, получаемое на основе этих записей, оказалось значительно ниже имевшихся данных о смертности19. Тогда он обратился в графство Нортгемптон, где записи велись более аккуратно, чем в Лондоне. Он опубликовал результаты своих изысканий в 1771 году в книге, озаглавленной «Заметки о страховых выплатах» («Observations on Reversionary Payments»), которая оставалась катехизисом страховщиков до конца XIX столетия. Эта работа принесла ему славу основоположника страховой статистики как комплекса вероятностных методов, применяемых ныне всеми страховыми компаниями в качестве основы исчисления сборов и выплат.

Однако в работе Прайса были серьезные, весьма дорогостоящие ошибки, частично обусловленные погрешностями исходных данных, которые не охватывали большое число незарегистрированных рождений. Более того, он завысил коэффициенты смертности для ранних возрастов и занизил их для старших, а его оценки величины миграции населения в Нортгемптон и из него оказались неточными. Наиболее серьезные последствия имело занижение ожидаемой продолжительности жизни, что привело к значительному завышению сборов при страховании жизни. «Общество справедливости» обогатилось на этой ошибке, а британское правительство, использовавшее те же таблицы для определения выплат покупателям пожизненной ренты, понесло значительные убытки20.

Через два года после смерти Байеса Прайс послал копию его «очень остроумной» работы некоему Джону Кантону, другому члену Королевского общества, с сопроводительным письмом, дающим представление о намерениях, с которыми Байес ее писал. Впоследствии в 1764 году Королевское общество опубликовало ее в «Philosophical Transactions», но и это не помешало новаторской работе Байеса прозябать в безвестности в течение двадцати лет.

Здесь приводится постановка Байесом задачи, которую он пытался решить:

ЗАДАЧА

Дано: число случаев [в выборке], в которых некое событие наступило, и число случаев, в которых оно не наступило.

Требуется определить: вероятность того, что вероятность наступления события в одном испытании [в генеральной совокупности] находится в некоем заданном интервале значений21.

Поставленная здесь задача в точности обратна задаче, поставленной Якобом Бернулли примерно шестьюдесятью годами ранее (с. 136). Байес задается вопросом, как определить вероятность того, что событие будет иметь место, при том что мы знаем только, что оно в определенном числе случаев наступило и в некоем другом числе случаев не наступило. Другими словами, булавка может оказаться бракованной или качественной. Если мы обнаружим десять бракованных булавок в выборке из ста, какова вероятность, что во всей совокупности булавок — не только в выборке из ста — процент брака окажется в интервале между 9 и 11%?

Сопроводительное письмо Прайса Кантону показывает, как далеко за одно столетие продвинулся анализ вероятности в практике принятия решений. «Каждый здравомыслящий человек, — пишет Прайс, — поймет, что поставленная здесь задача ни в коем случае не является простым упражнением в области теории случайностей, но требует решения в целях построения прочного основания для всех наших суждений относительно предыдущих событий и выяснения вероятности последующих»22. Он далее указывает, что ни Якоб Бернулли, ни де Муавр не поставили вопрос именно таким образом, хотя де Муавр и охарактеризовал трудности в получении своего собственного решения как «наибольшие из всех, какие можно ожидать в теории случайностей ».

Для доказательства своей точки зрения Байес использовал не очень подходящий для диссидентствующего священника пример — бильярд. Запущенный по бильярдному столу шар где-то останавливается и остается на месте. Затем другой шар многократно запускается таким же образом, и подсчитывается число случаев, когда он останавливается справа от первого. Это «число случаев, когда неопределенное событие наступило», — успех. Неуспех — это число случаев, когда событие не наступило, то есть шар оказался слева от первого. Вероятность местонахождения первого шара — единичное испытание — следует вывести из «успеха» или «неуспеха» второго23.

Важнейшее применение подхода Байеса заключается в использовании новой информации для уточнения вероятности, основанной на старой информации, или, пользуясь языком статистики, сравнении апостериорной вероятности с априорной. В случае с бильярдными шарами положение первого шара представляет собой априорную, а многократные оценки его местонахождения повторяющимися запусками второго шара — апостериорную вероятность.

Процедура пересмотра выводов относительно старой информации по мере получения новой имеет источником философскую точку зрения, делающую достижения Байеса чрезвычайно современными: в динамичном мире в условиях неопределенности нет однозначных ответов. Математик А. Ф. М. Смит (Smith) это очень хорошо сформулировал: «Каждая попытка научно обосновать ответы, возникающие в ситуации сложной неопределенности, является, на мой вкус, тоталитарной пародией на считающийся разумным процесс познания»24.

Хотя из-за сложности байесовского подхода детальное рассмотрение его здесь неуместно, пример типичного применения его приведен в конце этой главы.

Важнейшей отличительной особенностью всех описанных в этой главе научных достижений является смелая мысль, что неопределенность может быть измерена. Неопределенность означает, что значение вероятности неизвестно; перефразируя высказывание Ха-кинга об определенности, можно сказать, что нечто является неопределенным, если наша информация верна, а событие не происходит или если наша информация неверна, а событие происходит.

Якоб Бернулли, Абрахам де Муавр и Томас Байес показали, как вычислять величину вероятности на основании эмпирических фактов. В этих достижениях впечатляют живость ума, проявленная в постановке вопросов, и смелость, с которой он дерзко атакует неизвестное. Де Муавр не скрывал восхищенного удивления перед собственными результатами, когда сослался на БОЖЕСТВЕННОЕ ПРЕДНАЧЕРТАНИЕ. Он любил такого рода выражения. В другом месте у него читаем: «Если бы мы не ослепляли себя метафизической пылью, то могли бы коротким и очевидным путем прийти к познанию великого СОЗДАТЕЛЯ и ВСЕДЕРЖИТЕЛЯ всего сущего»28.

Мы уже основательно углубились в XVIII столетие, когда англичане считали познание высшей формой человеческой деятельности. Это действительно было время, когда ученые стряхнули со своих глаз метафизическую пыль. Не было больше препятствий для исследования непознанного и созидания нового. Огромные успехи в освоении природы риска, достигнутые до 1800 года, дали мощный толчок науке наступающего столетия, и в Викторианскую эпоху исследования в этом направлении получили дальнейшее развитие.

Приложение

Пример практического применения Байесова подхода к статистическим задачам

Обратимся вновь к булавочной компании. Компания имеет две фабрики, причем старая выпускает 40% продукции. Это означает, что взятая наугад булавка, бракованная или нет, с вероятностью 40% выпущена на старой фабрике; это исходная вероятность. Известно, что на старой фабрике процент брака вдвое больше, чем на новой. Если клиент звонит и сообщает о купленной им бракованной булавке, на какую из двух фабрик должен звонить менеджер по сбыту?

Исходная вероятность побуждает утверждать, что, скорее всего, бракованная булавка сделана на новой фабрике, выпускающей 60% продукции компании. С другой стороны, частота появления брака на этой фабрике вдвое меньше, чем на старой. Пересмотрев исходную вероятность с учетом этой дополнительной информации, получаем, что вероятность выпуска бракованной булавки новой фабрикой равна только 42,8%; это значит, что с вероятностью 57,2% виновата старая фабрика. Эта новая оценка становится апостериорной вероятностью.

<< | >>
Источник: Бернстайн П. . Против богов: Укрощение риска / Пер. с англ. — М.: ЗАО «Олимп-Бизнес». — 400 с.: ил. 2000

Еще по теме Глава 7 В поисках практической достоверности:

  1. ГЛАВА ПЛАНИРОВАНИЕ И ПОИСК
  2. ГЛАВА 5 ПОИСК И ПОЛУЧЕНИЕ РАБОТЫ
  3. Глава 1. В поисках самоопределения: экономика труда и ее методологические основания
  4. глава четвертая в поиске
  5. Глава У ПОИСКИ МЕРИЛА ЦЕННОСТИ
  6. Глава 2. ЗАНЯТОСТЬ, БЕЗРАБОТИЦА И ИНФЛЯЦИЯ: ПОНЯТИЕ, ВЗАИМОСВЯЗЬ, ПОИСК РАЦИОНАЛЬНОЙ МОДЕЛИ
  7. Глава 9 В ПОИСКАХ НОВОГО САХАРНОГО МАКСИМУМА
  8. Глава 11. Поиск, отбор и управление франчайзи
  9. Глава 14. Осознание потребности и информационный поиск
  10. Глава 1. В поисках секретов налогообложения. К истории вопроса.
  11. Глава 30 ЭВОЛЮЦИОННАЯ ЭКОНОМИКАИ ПОИСКИ НОВОЙ ТЕОРИИЭКОНОМИЧЕСКИХ ИЗМЕНЕНИЙ
- Бюджетная система - Внешнеэкономическая деятельность - Государственное регулирование экономики - Инновационная экономика - Институциональная экономика - Институциональная экономическая теория - Информационные системы в экономике - Информационные технологии в экономике - История мировой экономики - История экономических учений - Кризисная экономика - Логистика - Макроэкономика (учебник) - Математические методы и моделирование в экономике - Международные экономические отношения - Микроэкономика - Мировая экономика - Налоги и налолгообложение - Основы коммерческой деятельности - Отраслевая экономика - Оценочная деятельность - Планирование и контроль на предприятии - Политэкономия - Региональная и национальная экономика - Российская экономика - Системы технологий - Страхование - Товароведение - Торговое дело - Философия экономики - Финансовое планирование и прогнозирование - Ценообразование - Экономика зарубежных стран - Экономика и управление народным хозяйством - Экономика машиностроения - Экономика общественного сектора - Экономика отраслевых рынков - Экономика полезных ископаемых - Экономика предприятий - Экономика природных ресурсов - Экономика природопользования - Экономика сельского хозяйства - Экономика таможенного дел - Экономика транспорта - Экономика труда - Экономика туризма - Экономическая история - Экономическая публицистика - Экономическая социология - Экономическая статистика - Экономическая теория - Экономический анализ - Эффективность производства -