<<
>>

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

Теория вероятностей прекрасно характеризует статистику, предмет, которого побаиваются даже наиболее талантливые слушатели бизнес- школ. По существу, теория вероятностей — более точное определение статистики, поскольку описывает, как статистика используется для решения проблем.

При известных значениях вероятности отыскания нефти как следует поступить Сэму? Сколько из 800 находящихся в браке слушателей программ бизнес-школ первой десятки разведется после первого года обучения? Все это теория вероятностей. Почти все деловые люди избегают статистики, поэтому она предоставляет МВА возможность блеснуть. Я прослушал курс статистики ближе к окончанию института и практически ничего не усвоил, так как нам преподавали теорию, а не применение ее к решению проблем. Программы для МВА сосредоточены на практическом приложении статистики, а разбираться с теорией предоставляют математикам. Если вы совсем не знакомы со статистикой, не пропускайте этот раздел. С помощью немногих страниц, посвященных данному предмету, я не сделаю вас экспертом, но обещаю, что если вы на

беретесь терпения и прочтете весь текст, то приобретете рабочие знания, достаточные, чтобы квалифицированно попросить об оказании помощи, когда она вам потребуется. Подготовка посредством сообщения слушателям рабочих знаний по самым разным предметам — основной принцип обучения будущих МВА. Преподаватели не рассчитывают, что всего за два года сделают из своих слушателей технических экспертов, но предполагают, что смогут научить их понимать, когда именно требуется помощь эксперта для решения конкретной проблемы.

Распределение вероятностей

В ситуации с множественностью возможных исходов результатом будет распределение (distribution) исходов. Каждой возможности приписывается определенная вероятность. Тщательный анализ, интуиция и суждение помогают добиваться, чтобы сумма вероятностей всех возможных исходов любого события (event) равнялась 100%, как в узле с ветвями вероятных событий на дереве решений.

Кривую распределения исходов называют гистограммой (probability mass function) или функцией плотности вероятности (probability density function). В ситуации множества возможных исходов кривая получается плавной, в этом случае она называется функцией плотности вероятности. Если возможных исходов всего несколько, кривая получается неплавной, в этом случае она называется гистограммой.

Пример с дождями. Дождь в Сиэтле — это событие, характеризуемое распределением вероятностей. В соответствии с гипотетическими данными выпадение дождей в Сиэтле можно представить в форме таблицы и кривых распределения вероятностей.

Таблица результатов измерения в дождливые дни

в Сиэтле в апреле 1992 г.

Уровень дневных              Число дней, в которые              Доля соответствующих

осадков в дюймах              уровень осадков был таким дней в месяце, %

0 5 16
2 6 19
4 8 26
6 3 19
8 3 10
10 3 10
"28 Too

Функция плотности вероятности по данным измерения осадков

Выпадение дождей в Сиэтле в 1962-1992 гг. (1240 дней)

Функция плотности вероятности по данным измерения осадков

Уровень осадков, дюймы

Подбрасывание монеты имеет два вероятных исхода — монета падает «орлом» или «решкой» кверху. Поэтому распределение исходов двух подбрасываний монеты может иметь несколько вариантов, если вы ставите, например, на «орла».

Двойная удача — «орел»/«орел»

Одна удача/одна неудача — «орел»/«решка»

Две неудачи — «решка»/«решка»

Результаты подбрасывания монеты лежат в основе наиболее распространенного биномиального распределения (binomial distribution).

При биномиальном распределении существуют всего два исхода — удача и неудача, вероятности которых в сумме дают единицу.

Кажущуюся загадочной теорию биномиального распределения можно применить к такому практическому делу, как анализ рынка акций. Удачей или благоприятным исходом можно считать прибыль на акцию по итогам месяца, а неудачей или неблагоприятным исходом — убыток или нулевую прибыль. В исследовании динамики цен на акции компании ATamp;T в период с 1957 по 1977 г. был проанализирован каждый месяц для определения уровня прибыли. Установили, что 56,7% времени 20-летнего периода вложение денег в эти акции завершалось благоприятным исходом, т.е. получением прибыли.

Исследованные месяцы были объединены в группы по три (кварталы). Исследователи заметили, что частота событий с благоприятным исходом была следующей:

Количество благоприятных исходов Наблюдаемая частота

0

1

2

3

0,088

0,325

0,387

0,200

1,000

Математик, подбрасывавший монету, составил таблицы для решения всех задач, связанных с биномиальными распределениями. В примере с компанией ATamp;T для пользования такой таблицей необходимо иметь следующую информацию:

г (число возможных удач или благоприятных исходов) = от 0 до 3; п (число попыток) = 3 (3 месяца в квартале); р (вероятность успеха или благоприятного исхода) = 56,7%.

На основании этих данных таблица биномиального распределения дает следующий прогноз ожидаемых благоприятных исходов:

Количество благоприятных исходов

0 1 2

3

Ожидаемая частота 0,082 0,318 0,416 0,184

1,000

Как ни странно, биномиальное распределение довольно хорошо коррелирует с фактическими результатами анализа данных по ATamp;T. При принятой вероятности благоприятного исхода (probability of success) (р) вероятность получения прибыли по итогам месяца в течение квартала можно узнать из таблицы. Поэтому портфельные менеджеры, директора по продажам и аналитики-исследователи могут использовать биномиальные распределения на практике для оценки вероятностей тех или иных исходов.

Нормальное распределение: тайна колоколообразной кривой

Нормальное распределение (normal distribution) используется чаще всего, а его графическое представление обычно называют колоколообразной кривой (bell curve). В Гарвардской бизнес-школе колоколообразную кривую используют для выставления оценок. Кривая показывает, что 15% слушателей получают оценку «неудовлетворительно» («хвостисты», которые обязаны сдавать тему повторно). В Дарденской бизнес-школе преподаватели ставят неудовлетворительную оценку, основываясь на собственном суждении. Результат: в двух кампусах сложились принципиально различные конкурентные ситуации (см. с. 208).

Когда в основе гистограммы лежит множество попыток, кривая имеет тенденцию к завершенности формы и принимает колоколообразные очертания. Такую кривую мы называем функцией плотности вероятности. Именно такой была кривая в примере с ситуацией с дождями в Сиэтле. Появление на кривой горба в середине обусловлено центральной предельной теоремой (central limit theorem). Она гласит, что «распределение средних арифметических (averages) для повторяющихся независимых выборок принимает форму колоколообразного нормального распределения». Почему? Просто потому, что при большом числе не-

Колоколообразная кривая выставления оценок слушателям

зависимых выборок исход стремится к центральному среднему арифметическому (т. е. при большом числе независимых выборок средние по выборкам одинаково часто отклоняются как в положительную, так и в отрицательную сторону от некоего «центра» (его называют «средним по генеральной совокупности»), причем чем больше это отклонение, тем реже оно происходит. — Прим.ред.).

Концепция «средних по выборкам» довольно расплывчата. На практике это утверждение (утверждение о нормальном распределении средних по выборкам) часто распространяется на любую большую совокупность данных. Почему? Потому что нормальное распределение очень легко использовать, и оно неплохо аппроксимирует реальность.

Курс акций — это отражение многочисленных конъюнктурных колебаний на рынке, результатом которых является благоприятный или неблагоприятный исход (прибыль или убыток соответственно). Исход как таковой можно рассматривать в качестве «среднего арифметического» таких конъюнктурных колебаний. Едва ли не все происходящее можно рационализировать через среднее арифметическое, и этим объясняется полезность нормальных распределений.

Характеристики нормальной кривой. Колоколообразная, или нормальная, кривая описывается двумя характеристиками: средним (mean) и его среднеквадратическим (или стандартным) отклонением

(CKO) (standard deviation). Среднее (ju) является центром распределения. Обычно его называют средним арифметическим. Оно есть результат деления суммы значений на их количество. Среднеквадратическое отклонение (о) показывает, насколько распределение распространяется вширь. СКО можно также описать как критерий «разброса случайной величины вокруг среднего». Две эти характеристики являются важнейшими для большей части концепций теории вероятностей.

Существуют другие разновидности средних для совокупности данных: медиана (median) — величина, стоящая в середине совокупности данных, упорядоченных по возрастанию (так, что половина данных в выборке меньше медианы, а половина — больше), и мода (mode) — величина, чаще всего встречающаяся в совокупности данных.

Функция плотности вероятности, представленная разными значениями среднеквадратического отклонения

Функция плотности вероятности, представленная разными значениями среднеквадратического отклонения

Среднее

Как и в случае биномиального распределения, для нормального распределения сумма всех исходов, представленная площадью под кривой, равна 100%. Необычность нормальной кривой придает тот факт, что при любом значении СКО вероятность события не изменяется и не зависит от формы нормального распределения. (Особенность нормальной кривой в том, что при любом отклонении случайной величины от среднего значения, если измерять это отклонение в величинах СКО, вероятность отклонения будет одна и та же независимо от величины СКО.

— Прим.ред.).

Пример нормального распределения из розничной торговли. Эл Банди, владелец обувного магазина, хочет быть уверенным в том, что запасы на его складе достаточны для удовлетворения покупательниц с любым размером ноги. Он оплатил Академии ног расходы на исследование по поводу частоты встречающихся среди женщин размеров ног и получил совокупность данных, собранных путем опроса.

Он обработал эти данные и получил нормальное распределение. Он также ввел в свой калькулятор данные по ряду размеров, нажал на кнопку «среднее квадратическое отклонение» и получил ответ «2». Эл ввел среднее, или среднее арифметическое, для всей совокупности ответов по размерам и получил ответ «7». Посмотрев на построенную кривую, он сделал вывод, что она похожа на внушающее доверие нормальное распределение.

Нормальное распределение для размеров обуви

Вероятность

-За -2а -1сг И +1 о +2а +3сг
1 3 5 7 9 11 13

Среднее

Сравнительные размеры обуви

Россия 35 36 37 38 39 40
США 4 5 6 7 8 9

Распознав кривую, Эл может применить правила, присущие любому нормальному распределению. Площадь участков под кривой при разных значениях отклонения от среднего значения будет следующей:

1СКО              =              0,3413

  1. СКО              =              0,4772
  2. СКО              =              0,49865
  3. СКО              =              0,4999683

Если м-р Банди, используя эти правила, запасет размеры с 5-го по 9-й, он сможет удовлетворить потребности 68,26% (0,3413 х 2) всех местных покупательниц. Расширив ассортимент склада с 3-го по 11-й размеры, он сможет обуть 95,44% местных женщин. Если же Эл будет иметь на складе размеры с 1 -го по 13-й, то 99,73% покупательниц уйдут от него с покупкой. Для тех уникумов, которые носят размеры меньше 1 -го и больше 13-го, он всегда может предложить систему специальных заказов.

Естественно, таблицы нормальных распределений составлены для определения вероятности отклонения любой конкретной точки на кривой (с учетом нецелочисленных СКО) от среднего. Для пользования таблицами необходимо рассчитать значение Z.

Z = [(Интересующая точка) - Среднее]/СКО

Пример использования нормальной кривой в финансовой деятельности

Давайте применим усвоенные фрагменты теории вероятностей к финансовой деятельности. Предполагается, что, как показано на прилагаемом графике (см. с. 212), ежемесячная прибыль на акции компании Pioneer Aviation, курс которых неустойчив, описывается нормальным распределением. Сводные данные по прибыли в ретроспективе показывают, что среднее (центр распределения) равно 1%, а СКО (разброс) — 11%. Джералд Расмуссен захотел узнать, какова вероятность того, что в следующем месяце прибыль окажется менее 13%.

Используя формулу расчета Z, мы можем удовлетворить его интерес:

Z = (13 - l)/ll = +1,09 СКО относительно среднего.

Таблица нормального распределения, которую я привожу в Приложении, говорит нам, что площадь под нормальной кривой в интервале от среднего до отклонения, имеющего значение 1,09 СКО, равна 0,3621. Площадь участка под всей левой половиной кривой равна 0,5000, так как она целиком представляет половину распределения. Это верно в любой ситуации. Вероятность попадания в точку, находящуюся выше или ниже центра или среднего любого нормального распределения, равна 50%. Исходя из приведенных данных, определяем вероятность того, что прибыль на акции окажется ниже 13% : 0,3621 + 0,5000 = 0,8621, и, с другой стороны, — что она окажется выше 13%: 1 - 0,8621 = 0,1379. Это ответ реально-

Функция плотности вероятности

Ежемесячная прибыль на акции Pioneer Aviation

Функция плотности вероятности

-10%              1%              12%              13%

Среднее Ежемесячная прибыль на акции

го мира на деловую задачу реального мира, полученный с использованием статистики в качестве прикладного инструментария.

Статистика не трудна, если вы не блуждаете слишком долго в дебрях теории. Существуют и другие распределения, но их редко используют в бизнесе. Распределение Пуассона (Poisson distribution) подобно нормальному распределению, но имеет удлиненный хвост в правой части

Функция плотности вероятности

Ежемесячная прибыль на акции Pioneer Aviation

Функция плотности вероятности

Среднее

Ежемесячная прибыль на акции

графика. Предполагается, однако, что почти всегда распределения являются нормальными, так как это позволяет использовать правила нормального распределения, относящиеся к СКО.

Кумулятивные функции распределения

Кумулятивная функция распределения (cumulative distribution function — CDF) отражает представление о накопленных частотах гистограммы. Вы берете гистограмму типа колоколообразной кривой и задаетесь вопросом: «А какова вероятность того, что исход будет меньше или равен такому-то конкретному значению?» Нормальная кривая показывает вам вероятность того, что интересующая вас величина окажется вблизи данного значения, a CDF — вероятность того, что она не превысит данного значения. CDF можно использовать также для соединения матримониального союза наших представлений о неопределенности исходов (теория вероятностей) с нашим инструментом для принятия решений (дерево решений). CDF представляет диапазон возможных исходов, когда вы имеете дело с неопределенными величинами, имеющими множественные значения.

Вернемся к рассмотрению примера с нефтяными скважинами и возьмем распределение значений возможной стоимости нефти, которые могут стать реальными, если нефть удастся найти и извлечь:

При построении дерева решений мы исходили из возможного выигрыша в случае удачи в размере 1 ООО ООО долл. Эта сумма была выбрана в качестве ожидаемого денежного эквивалента (EMV) события обнаружения нефти только для удобства. Распределение содержит широкий спектр значений. Как видно из таблицы, с вероятностью 0,005 выигрыш может оказаться равным 6 ООО ООО и 50 000 долл. Если перемножить значения выигрыша в долларах на соответствующие вероятности, указанные во втором столбце, а затем сложить произведения, то вы получите в сумме 1 000 000 долл., т.е. использованный выше EMV.

Построение функции непрерывного распределения позволяет лицам, ответственным за принятие решений, установить среднее или EMV, когда они не знают, с чего начать. Построение кумулятивного распределения — это метод объединения серии ваших суждений относительно вероятности верхней границы, середины и нижней границы интервала неизвестного исхода для установления EMV, используемого при принятии решения.

В графической форме кумулятивное распределение диапазонов исходов напоминает большую букву S. Имея перед собой такую кривую, вы видите все возможные исходы, т.е. своего рода динамику их, а не только разрозненные статичные точки. Как показано на следующем рисунке, Сэм Хьюстон считает, что все возможные в данном случае исходы попадают в непрерывный диапазон значений от 0 до 6 000 000 долл.

Диапазон вероятностей от 0 до 1,0 кумулятивного распределения разбивается на квантили (fractiles), или части, методом медиан интервалов значений (bracket median technique). Представленная выше в табличной форме (см. с. 213) CDF разбита на квантили именно таким способом. Для разбиения диапазонов вероятностей CDF, например, на пять диапазонов следует использовать квантили 0,1; 0,3; 0,5; 0,7 и 0,9. Эти квантили будут представлять собой арифметическое среднее диапазонов значений 0-0,2; 0,2-0,4; 0,4-0,6; 0,6-0,8 и 0,8-1,0 соответственно (см. с. 215).

Квантиль 0,5 равнозначен медиане, поскольку с каждой его стороны находится ровно половина возможных значений. Медиана не обязательно представляет собой то же самое, что среднее, которое мы использовали для обозначения центра нормального распределения. Медиана — это просто центр диапазона значений. Среднее — это сумма произведений всех вероятностей на соответствующие значения; именно такая сумма была рассчитана при определении EMV события обнаружения нефти в размере 1 000 000 долл.

Кумулятивная функция распределения

Кумулятивная функция распределения

Значения возможных исходов бурения на нефть (в тыс. долл.)

Для соединения концепции CDF с деревом решений применительно к принятию важных управленческих решений вообразим, как следовало бы представить графически все значения вознаграждения, которое может подарить вам нефтяная скважина. Я вижу диапазон значений, изображенных в виде веера (fan) вероятностей. Кому-то может не хватить терпения для представления бесконечных возможностей в виде ветвей дерева, поэтому в качестве вспомогательного средства используем концепцию CDF.

Графическое представление кумулятивного распределения. Чтобы представить CDF в графической форме, вам следует опираться на собственное суждение и данные ваших исследований. Нужно задать себе ряд вопросов:

Каким должно быть значение, при котором 50% времени результат оказывается выше или ниже заданного значения (медиана)? Каким должно быть значение на нижнем конце диапазона (квантиль 0,10)?

Каким должно быть значение на верхнем конце диапазона (квантиль 0,90)?

Дерево решений для ситуации бурения на нефть

Используется функция непрерывного распределения вероятности (в тыс. долл.)

EMV = 0,9 [(0,2 х 130 000) + (0,2 х 750 000) + (0,2 х 870 000) + (0,2 х 1 150 000) + (0,2 + 2 100 000)] = 900 000 000 долл.

2100              0,9              квантиль

1150              0,7              квантиль

870              0,5              квантиль

750              0,3              квантиль

Ответив на эти вопросы, вы сможете представить CDF того, что, по вашему мнению, будет диапазоном возможных исходов. Ограничившись пятью исходами или пятью квантилями кумулятивного распределения, вы можете изобразить веер событий и их вероятностей как пять ветвей на дереве решений.

Ожидаемый денежный эквивалент будет таким же, как при нашем первом рассмотрении данного примера, но только потому, что с самого начала для удобства была выбрана правильная величина EMV.

Сокращенный вариант такого анализа называют «методом индюка Пирсона» (Pearson turkey method). Вместо пяти квантилей используется всего три — 0,05; 0,6 и 0,95. Соответствующие этим квантилям вероятности — 0,185; 0,63 и 0,185.

Применительно к крупным задачам для построения дерева решений применяются программы моделирования методом Монте-Карло (Monte Carlo simulation models). Дерево и параметры веера событий в концепции кумулятивного распределения встроены в компьютерную модель. Чтобы получить представление о возможном реальном развитии событий, программу приходится прогонять многократно. Некоторые из компаний, входящих в первые 500 по данным журнала Fortune, используют этот метод.

Кумулятивное распределение и анализ методом квантилей можно применять к ситуациям, в которых EMV ветви дерева решений неопределенен. Но как бы то ни было, суждение аналитика превыше всего. Дерево

  • это всего лишь инструмент, который МВА обязан использовать в сочетании со своими знаниями и интуицией. 
<< | >>
Источник: Силбигер С.. MBA за 10 дней / Пер. с англ. Э.В. Шустера. — 2-е изд. — М.: ЗАО «Консультант Плюс». — 440 с.. 2002

Еще по теме ТЕОРИЯ ВЕРОЯТНОСТЕЙ:

  1. Теория условной вероятности
  2. ИЗМЕРЕНИЕ ВЕРОЯТНОСТЕЙ
  3. 3 Условные вероятности и корреляция
  4. Вероятность Разорения
  5. ВЗВЕШИВАНИЕ ПО ВЕРОЯТНОСТЯМ
  6. 11.4.1 Определение вероятностей исходов
  7. ИСТОРИЧЕСКИ ОБОСНОВАННЫЕ ВЕРОЯТНОСТИ и МОДЕЛИРОВАНИЕ
  8. 3.4 Прогнозирование вероятности банкротства
  9. Оценка совместных вероятностей
  10. Методы диагностики вероятности банкротства
  11. Оценка вероятности реализации рисков
  12. Совместные вероятности двух непрерывных распределений
  13. 3.4.1. Совместное распределение вероятностей
  14. ДЕРЕВО ВЕРОЯТНОСТЕЙ ИНВЕСТИЦИОННОГО ПРОЕКТА
  15. Дерево вероятностей инвестиционного проекта