<<
>>

Возможные способы использования данных

Индукция?

Существуют стандартные философские аргументы, восходящие к Дэвиду Юму (XVIII в.), с помощью которых отвергается идея о том, что можно использовать данные для непосредственного получения достоверной информации.

Простое накапливание фактов и последующий поиск в них некой общей закономерности не являются прямым источником информации (хотя и могут быть источником гипотез). И хотя наблюдение конкретной связи событий может психологически побудить нас считать такую связь стабильной, нет никакого логического основания ожидать, что эта связь продлится.

В любом случае данные, пригодные для моделирования, не находятся «под рукой». Чтобы конструировать данные, нам требуется целое множество понятий и идей. Это должно быть видно любому экономисту, поскольку именно так определяется способ получения официальных статистических данных, которые зачастую представляют собой материал для регрессионного анализа. Но, кажется, до сих пор экономисты порой не отдают себе в этом отчета. С одной стороны, некоторые из них считают, что можно моделировать временной ряд без какого-либо обращения к теории вообще, рассуждая о «процессе генерирования данных» (data-generation process). С другой стороны, есть исследователи, готовые использовать официальную статистику, которая фактически не соответствует экономическим категориям, для проверки гипотез о распределении дохода, основанных на теоретических выкладках.

Общая проблема, на которую указал Юм, особенно серьезно касается экономистов. Для них это не просто философская тонкость, которая вряд ли может иметь отношение к практике. Экономика намного более, чем естественные науки, подвержена «сдвигу параметров» (parameter shift). Наблюдаемая закономерность может измениться за одно десятилетие (что показывает недавняя история денежного обращения).

Еще более обманчивы причинно-следственные отношения, казалось бы, вытекающие из непосредственного исследования данных.

Хотя в эконометрике присутствует формальное различие между корреля

цией и причинностью, эконометрические процедуры незаметно смешивают оба понятия (Black, 1982).

Несмотря на это, среди экономистов есть ряд авторов, которые не согласны с идеей о невозможности индукции. В эту группу входят видные авторы, включая Р. Ф. Харрода (Harrod, 1956). Но, придя к выводу, что «Харрод не нашел ответа Юму», А-. Дж. Айер писал: «Я считаю, что мораль такова: ни одна подобная теория логического типа не будет успешной» (Ауег, 1970 : 37). Это взгляд философа. Однако позиция Юма вместе с идеей Поппера о том, что вероятность события и его информационное содержание находятся в обратном соотношении друг к другу (Popper, 1959 : 270), оказалась решающей для большинства экономистов, но не для всех. Читателю следует остерегаться ссылок на «индуктивную логику», которые присутствуют в литературе по экономической методологии, так как ясно, что ее не существует (по крайней мере, если понимать индукцию так, как это понимается здесь).

Важно отметить этот момент, потому что утверждения Поппера

о              «разрешении» проблемы индукции было сильно искажено, особенно в литературе по экономической методологии. Проблема заключается в том, что если у нас не будет индукции, то как мы получим знания? Решение Поппера — решать не проблему индукции (которая, по сути, неразрешима), а проблему знания, идя другим путем — путем предположений и опровержений (Popper, 1959 : ch. 1). Но если мы пойдем по этому пути, тогда источники предположений — наших гипотез — станут существенными.

Источники гипотез

То, что мы вслед за Юмом отвергаем индукцию как источник знания, не обязательно означает, что мы отвергаем ее как источник гипотез. Если мы придерживаемся точки зрения, согласно которой исходная гипотеза может иметь любой источник, то из этого следует, что любые догадки, появившиеся при исследовании данных, — абсолютно законный источник гипотез.

В действительности очевидно, что в мире естественных наук очень важным является «опознание регулярности» (pattern recognition).

В этом заключается особенная ирония, поскольку в экономике это тоже когда-то считалось важным, особенно в экономике промышленности. Но отчасти благодаря появившемуся в 1960-е гг. ошибочному убеждению, что критика Юма исключает эту процедуру, экономисты более не придают ей какого-либо значения.

В формировании гипотез важную роль играет также интуиция. Мы определенно не можем целиком полагаться на опознание регулярности в качестве источника гипотезы. Важнейшую роль играет также воображение. Но воображение, по-видимому, намного продуктивнее,

когда его источником является любознательность, направленная на реальный мир, и когда оно опирается на данные об этом мире и ограничивается ими. Как подчеркнул великий биолог Франсуа Жакоб, научный прогресс происходит благодаря постоянному взаимодействию между воображением и экспериментом (Jacob, 1988 : 306).

Но если мы -собираемся построить гипотезу, то должны уметь формулировать предпосылки относительно той области, к которой относится наша гипотеза.

,

Предпосылки

С момента опубликования в 1953 г. повлиявшего на многих очерка Фридмена, и особенно с начала 1960-х гг., экономисты стали склоняться к мнению, что реалистичность и точность предпосылок не имеют значения. Основой этому послужила часть фридменовской аргументации, названная Самуэльсоном «F-уклоном» (F-twist) (Samuelson, 1963). Смысл F-уклона состоит приблизительно в следующем: предпосылки нереалистичны, но то, от чего мы в них абстрагируемся, не имеет большого значения, «следовательно», мы можем не только заключить, что о нереалистичности всех предпосылок не стоит беспокоиться, но и прийти к выводу, что теория тем лучше, чем менее реалистичны эти предпосылки.

Как мы увидим далее, данный ряд необоснованных заключений (non sequiturs) появился вследствие исходной путаницы относительно того, что понимать под нереалистичностью предпосылок. Так или иначе, этот ход мыслей привел к некоторой форме инструментализма, которую можно выразить фразой: «Мы не знаем, почему это работает, но это работает».

Хотя этому подходу и присущ некий привлекательный прагматизм, инструментализм в конечном счете не может нас удовлетворить, если мы заинтересованы в истине. Как заметил Поппер, существует четкая грань между теориями и правилами вычисления и последние сами по себе не позволяют нам отличить истину от лжи (Popper, 1974 : 111-113). Более того, когда наше правило вычисления становится непригодным, мы остаемся беспомощными. Таким образом, наш подход, по сути, антирационален. В действительности, грубо говоря, с точки зрения чисто инструменталистского подхода не важно, явились ли цены на рынке ценных бумаг результатом решений людей или действий маленьких зеленых человечков с Марса до тех пор, пока можно применять правило вычисления, связывающее цены, к примеру, с изменениями в темпе роста денежной массы.

Такой подход, по мнению некоторых экономистов (особенно в 1960-х гг.), считался естественнонаучным. На самом же деле в физике истинностью исходных предпосылок не пренебрегают. Один физик как-то заметил: «Слишком просто получить бесконечный ряд интересных на вид, но неверных или не имеющих значения формул вме

сто того, чтобы проверить обоснованность исходных предпосылок» (Ziman, 1978 : 14).

Конечно, тут можно возразить, что предпосылки никогда не бывают абсолютно точными. Однако следует отметить два момента. Во-первых, предпосылки являются по своей сути картой, где точны лишь контуры и отражены далеко не все детали. Разумеется, мы не включаем в карту каждую деталь, но в то же время нам не нужна карта центра Лондона, если мы находимся в Нортумберленде. Во- вторых, предпосылки основываются на ранее полученной информации — это так или должно быть так, чему пример — естественные науки. Предпосылки теории должны непременно основываться на результатах работы ученых, выдержавших и теоретическую критику, и неоднократную проверку (поскольку, как мы увидим, последнее зачастую отсутствует в экономике, то можно понять, почему экономисты пренебрегли данным аспектом процедуры научного исследования).

Конечно, какая-то степень конвенционализма здесь все еще требуется; если мы описываем, что является прочими равными условиями, и считаем содержание этих условий доступным для проверки (Hutchison, 1938), то попадаем в ситуацию бесконечного регресса (McCarty, 1978). Но конвенция (соглашение между учеными о том, что разумно принять) имеет под собой основу (по крайней мере в естественных науках) — принять можно результаты, которые выдержали критику и были неоднократно воспроизведены. Поскольку экономической науке это менее свойственно — тут разница не количественная, а качественная, то использование конвенций имеет здесь, вероятно, более шаткую основу, чем в физике, и, таким образом, тем более необходимо следить за тем, какие предпосылки выдвигаются экономистом.

Конечно, может показаться, что даже в естественных науках ученые пренебрегают предпосылками. Как подметил один автор, многие современные биологи, занимающиеся молекулярными аспектами, презирают таксономию растений. Но «их исследования неизбежно паразитируют на теле таксономического знания» (Ziman, 1978 : 46).

Проверка предпосылок в экономической науке жизненно важна еще и по другой причине: если мы выводим статистические заключения на основании данных, в которых присутствует «значительный и неустранимый разброс» (Ziman, 1978 : 170), то проверка предпосылок по крайней мере даст нам некоторое представление о возможных источниках этих расхождений.

То, что точность предпосылок, подобная точности карты, имеет важное значение, кажется настолько очевидным, что возникает интересный вопрос, как же экономисты оказались в нынешней ситуации? Ответ на этот вопрос в какой-то степени был дан философом Аланом Масгрейвом (Alan Musgrave, 1981) в его анализе оригинального очер

ка Фридмена. Он показывает, что в этой работе были перепутаны предпосылки «незначительности», «области применения» и «эвристики». Применительно к первой группе просто допускалось, что игнорируемые факторы не влияют сколько-нибудь существенно на исследуемые явления.

Предпосылки, входящие во вторую категорию, ограничивают применимость теории конкретными обстоятельствами. Предпосылки третьей категории принимаются с целью развить какую-либо определенную линию аргументации. Масгрейв показывает, что Фридмену не удалось провести грань между этими тремя категориями предпосылок и, фокусируя внимание на первой категории, он пришел к F-уклону.

Однако в действительности (как в случае с Нортумберлендом и центром Лондона) реалистичность предпосылок «области применения» имеет решающее значение. Как показал Коопманс (Koopmans, 1957 : 139), уже на ранней стадии нам необходимо знать, как мы собираемся применять теорию.

Но интересно, что это приводит нас обратно к идее «верификации», которая более всего занимала экономистов-методологов до появления указанной работы Фридмена (Blaug, 1980: ch. 3; ср.: Robbins, 1932), поскольку применимость и опровержимость предпосылок «области применения» чрезвычайно важны. Таким образом, прежде чем прийти к заключению, что прогнозы теории могут оказаться верными, мы должны проверить, выполняются ли в рассматриваемом случае ее предпосылки. Но проблема лежит еще глубже, поскольку для обеспечения надежности экономических знаний мы должны знать, насколько данная модель чувствительна к ошибочности ее предпосылок. И здесь мы вновь приходим к выводу, что предпосылки имеют значение.

Обычной причиной отказа от проверки теории по результатам ее прогнозов является так называемый тезис Дюгема—Куайна, состоящий в том, что мы всегда проверяем не отдельно взятую гипотезу, а целую совокупность гипотез, а потому, если теория не пройдет проверку, мы не сможем узнать, какая именно из гипотез была ложной. Но если мы уделим внимание нашим предпосылкам, у нас, несомненно, будет больше шансов это узнать. Кроме того, если мы проверим две конкурирующие теории, основанные на одинаковых предпосылках, у нас будет основа для выбора между ними. В конце концов, умышленно отбрасывать какую-либо информацию просто нелепо, а знание об истинности или ложности наших предпосылок — это все- таки информация.

Проверка

Как уже было отмечено в предыдущем разделе, в настоящее время экономисты не склонны уделять большого внимания предпосылкам. В основном сейчас их интересуют результаты проверок теоретиче

ских выводов на основе имеющихся данных. Хотя непосредственная причина такого отношения восходит к Фридмену, ее можно проследить в более ранних работах Поппера (Popper, 1959, 1963), который выдвинул следующие положения: во-первых, теория никогда не может быть доказана, но ее всегда можно опровергнуть; во-вторых, наши научные знания всегда условны и никогда не смогут быть абсолютны — все теории постоянно рискуют оказаться опровергнутыми; в-третьих, проверка гипотезы с целью ее опровержения — это верный путь, по которому практически идет наука. Работы Поппера обширны, глубоки и производят очень большое впечатление. Но в 1960-х гг. в экономической науке главенствующее положение заняла очень упрощенная версия попперовских идей, отражающая отчасти их фридме- новскую трактовку.

Однако вскоре обнаружилось, что проверка сама по себе имеет свои ограничения. Существует ряд обычных трудностей, включая мультиколлинеарность данных, проблему Дюгема—Куайна, упомянутую выше, а также сложность определения причинности чисто статистическими средствами, когда невозможен контролируемый эксперимент (как в случае экономической науки). Обо всем этом многократно шла речь на протяжении последних десяти лет. Вдобавок есть проблемы относительно того, что считать опровержением, точнее, какой степени неподтверждения достаточно для того, чтобы констатировать опровержение? Таким образом, в том, что мы готовы считать фактами, есть важная доля конвенционализма. Сперва экономисты пренебрегали этими моментами; надо сказать, что фальси- фикационизм 1960-х гг. был крайне примитивным, его сторонники не только не замечали уже упомянутых проблем, но и чрезмерно полагались на опубликованную официальную статистику (Coddington, 1972: 9).

Но проблемы нужно признать. Вследствие проблемы Дюгема— Куайна в экономической теории особенно трудно проверять теории из-за оговорок о прочих равных условиях, особенно если исследователи догматически полагают, что истинность предпосылок не имеет значения. Особая проблема, связанная с прочими равными условиями, состоит в том, что эти условия можно использовать для защиты теории от проверки, утверждая, что опровергнутая теория, вероятно, не прошла проверку из-за некоторых изменений в исходных условиях, которые не был** учтены и проверены (McCarty, 1978 : 13-14).

Экономисты должны решать такую проблему (хотя обычно они этого не делают) при помощи применения проверок, которые в большей степени сосредоточены на вспомогательных предпосылках, чем на проверяемых гипотезах, в этом заключается «хорошо сконструированный тест» (McCarty, 1977 : 8, цит. по Yoshida, 1975).

Несмотря на эти трудности, имеются сильные доводы в пользу дальнейшего проведения проверок с использованием хорошо скон- Заказ JSamp; 356

струированных тестов. Хотя в естественных науках намного меньше таких проблем, физики тоже сталкиваются со сложностями при проверке гипотез, поскольку теория и наблюдения далеки от идеального соответствия (Ziman, 1978 : 39). Однако, несмотря на это, исследователи «подгоняемые интеллектуальным соревнованием... неосознанно ведут себя согласно попперовскому принципу фальсификации не только по отношению к теориям, но даже по отношению к объективным „фактам", о наличии которых заявляют их конкуренты» (Ziman, 1978 : 59). Это особенно важно, поскольку именно повторение результатов вне конкретной группы, которой впервые удалось их получить, может быть решающим фактором принятия или отбрасывания теории.

Воспроизводимость результатов

В сущности, воспроизводимость научных результатов — это ключевой вопрос, которому, однако, экономисты до сих пор не уделяли должного внимания. Недавние споры по поводу холодного ядерного синтеза привлекли к этому вопросу внимание широкой публики — лаборатории всего мира пытались воспроизвести результаты, первоначально объявленные Понсом и Фляйшманом (Garwin, 1989).

В получении того, что Займен многозначительно назвал «надежным знанием» (reliable knowledge), именно воспроизводимость — проверка — является ключевой. Например, когда Стил (Steele) претендовал на то, что ему удалось добиться наследования приобретенных характеристик у мышей, реакция его коллег-биологов была следующей: «Ясно, что основной результат должен быть повторен в других лабораториях» (Taylor, 1980; см. также: Mitchison, 1980). Научная деятельность включает отбор из гипотез, появляющихся в журналах, тех, которые обладают воспроизводимостью — их всего лишь процентов десять от общего числа (Ziman, 1978 : 30-31, 40- 41, 130, 143).

Вопрос воспроизводимости результатов, привычный для ученых, занимающихся естественными науками, почти не принимался во внимание в социальной науке. Возможно, наиболее яркой иллюстрацией может послужить то, что произошло в антропологии, когда исследователь (Freeman, 1983), взяв на вооружение попперианский подход, отнесся к исследованию Маргарет Мид об обитателях Самоа как к серии гипотез, которые еще следует проверить. Мягко говоря, он обнаружил, что результаты Мид не были подтверждены имеющимися в наличии данными. Но прежде, чем экономисты злорадно улыбнутся, нам следует вспомнить, что сильное нежелание рассматривать данные, полученные во время «полевых исследований», — это правило среди экономистов (а исследование Мид о Самоа было основано на результатах «полевых» исследований).

Пример из области социальной психологии, который сразу приходит на ум, это случай с сэром Сирилом Бертом. Независимо от того, были ли им действительно сфабрикованы результаты его исследований интеллекта (а существует, несомненно, твердое убеждение в том, что так оно и было), удивительно, что до самой его смерти попытки проверить эти результаты так и не были осуществлены (Hearnshaw, 1979).

К сожалению, каждый практикующий экономист знает такие области, где очень трудно воспроизвести опубликованные результаты (Mayer, 1980). В экономике действительно есть несколько «благополучных областей». Неоднократные исследования последствий слияний и колебаний валютных курсов действительно приводили к повторению результатов всеми возможными способами. Но это исключительные области. Их исключительность является следствием двух причин, влияющих на большинство исследований: технико-эконометрических проблем и проблем данных (возможность же морального риска, связанного с легкостью опубликования «впечатляющих», но не воспроизводимых результатов, здесь рассматриваться не будет).

•я

Проблемы измерения

Обычно экономисты прибегают к регрессии как к первому и последнему средству при работе с данными. К сожалению, использование метода регрессии при работе с временными рядами требует очень большого доверия к данным, а это, похоже, не слишком плодотворно. Мы используем метод, взятый из сельскохозяйственных экспериментов: но там даже стандартный тест на линейность требует распределения значений У для каждого значения X, тогда как во временных рядах у нас есть лишь одно наблюдение У для каждого значения X. Поэтому то, что «называется» регрессией, по сути, ближе к корреляционному анализу 1920-х гг., который недолго был в моде среди экономистов. Отсутствие распределения У для каждого X и, следовательно, невозможность повторного взятия выборки поднимают вопросы об уровнях значимости, на которые экономисты просто не обращают внимания. Предпосылка случайности процесса, несомненно, является ложной (Learner, 1983). Типичным продуктом нашего избыточного доверия к данным является оцененное уравнение, демонстрирующее явные признаки мультиколлинеарности, где в результате этого вычисленные параметры являются неустойчивыми. Эту неустойчивость следует отличать от общей неустойчивости основных экономических соотношений, которая также часто игнорируется, хотя существуют стандартные методы ее проверки, в том числе дробление данных.

Частично по причине доступности стандартных компьютерных пакетов, которые сами по себе очень удобны, поскольку увеличивают возможность воспроизвести результаты, применяются низкокачествен

ные процедуры, включая рутинные поправки на серийную корреляцию без предварительной проверки ее существования.

К тому же хорошо известно, что содержащееся в опубликованной статье уравнение регрессии, которое обязательно является значимым на 5%-ном уровне, может быть последним из двадцати уравнений, девятнадцать из которых были незначимыми и поэтому не были опубликованы.

Было предложено, чтобы все итерации расчета регрессии были достоянием публики (Mayer, 1980). Но в жизни у нас есть компьютер, хорошо справляющийся со скучной арифметикой и послушно выполняющий поиск спецификации уравнения (к этой процедуре, естественно, неприменима традиционная теория статистического вывода (theory of inference)) (Learner, 1983 : 36), и, что еще хуже, склонность экономистов приспосабливать теорию к тому уравнению, которое работает (Blaug, 1980 : 257).

Но еще более неохотно экономисты признают, что данные часто бывают плохого качества. См. работы Уильбера и Харрисона (Wilber, Harrison, 1978 : 69) и Майера (Mayer, 1980 : 169). Мы уже обращали внимание на проблему официальной статистики и доступа к документам, по которым такая статистика составляется, что отнюдь не всегда позволяет исследователю доверять данным. Это было бы проблемой, даже если бы официальная статистика соответствовала экономическим концепциям (что бывает редко).

Таким образом, общий набор «грязных данных» (dirty data) подвергается экономистами разнообразным проверкам. Исследователи в области естественных наук не обязаны доверять цифрам, полученным другими людьми; более того, их воспроизведение имеет решающее значение для принятия нового результата. Таким образом, существует фундаментальное различие между экономикой, с одной стороны, и физикой или химией — с другой. Имея дело с общим набором данных, мы можем только проводить разные статистические проверки по тем же самым данным, а, как заметил Коуз, если вы будете «пытать» данные достаточно долго, они «сознаются». Решение проблемы данных заключается совершенно не в том, чтобы использовать другие математические методы, что в известном смысле стало заменой более основательной эмпирической работе. Как выразился Майер (Mayer, 1980 : 176-177): «Акцент на использовании продвинутых математических инструментов позволяет нам с чистой совестью пренебрегать некоторыми самыми элементарными правилами добротной исследовательской работы».

Однако мы определенно не должны терять надежду. Это был бы путь к иррационализму. В сущности, было бы неплохо «охладить страсть» к одному конкретному статистическому методу — регрессии — и быть более скромными в наших требованиях к данным, которые, по правде говоря, могут годиться только для ранговой кор

реляции. Как утверждал Майер, усовершенствование данных и (если они не опубликованы) повышение их доступности для других, а также большее внимание элементарному требованию воспроизводимости результатов, несомненно, были бы началом выхода из создавшегося положения. Вдобавок экономисты должны быть готовы конструировать свои собственные массивы данных и делать это так, чтобы их методы, равно как и сами полученные данные, могли быть доступны для публики. Райд (Reid, 1987) предложил ряд правил, которых следует придерживаться при использовании интервью и анкет, и следование таким правилам было бы важным первым шагом.  

<< | >>
Источник: А.ГРИНЭУЭЙ, М.БЛИНИ, И. СТЮАРТ. ПАНОРАМА ЭКОНОМИЧЕСКОЙ МЫСЛИ KOHЦA XX СТОЛЕТИЯ.Том 1. 2002

Еще по теме Возможные способы использования данных:

  1. 5| Способы обработки данных
  2. Использование вторичных данных
  3. Обработка и использование данных по затратам
  4. Использование учетных данных о персонале
  5. Использование цифровых данных в экономике
  6. Использование данных о вычисленных квотах
  7. Выбор налогоплательщиков с использованием интеллектуального анализа данных
  8. Права на использование программ и баз данных для ЭВМ
  9. Возможности выбора различных способов получения жилья
  10. Использование данных, содержащихся в отчетах о движении денежных средств
  11. Возможности выбора различных способов получения жилья   Права на жилье
  12. Расширенный пример использования информации одной из баз данных по интеллектуальной собственности
  13. Варианты использования электронной почты при формировании базы данных               перспективных              клиентов
  14. Использование электронной почты в вашей деятельности по формированию базы данных перспективных клиентов
  15. Метод и алгоритм расчета оптимального плана выездных проверок с использованием коэффициента риска и дополнительных данных
  16. 9.1. Инвестиционные возможности с использованием опционов
- Бюджетная система - Внешнеэкономическая деятельность - Государственное регулирование экономики - Инновационная экономика - Институциональная экономика - Институциональная экономическая теория - Информационные системы в экономике - Информационные технологии в экономике - История мировой экономики - История экономических учений - Кризисная экономика - Логистика - Макроэкономика (учебник) - Математические методы и моделирование в экономике - Международные экономические отношения - Микроэкономика - Мировая экономика - Налоги и налолгообложение - Основы коммерческой деятельности - Отраслевая экономика - Оценочная деятельность - Планирование и контроль на предприятии - Политэкономия - Региональная и национальная экономика - Российская экономика - Системы технологий - Страхование - Товароведение - Торговое дело - Философия экономики - Финансовое планирование и прогнозирование - Ценообразование - Экономика зарубежных стран - Экономика и управление народным хозяйством - Экономика машиностроения - Экономика общественного сектора - Экономика отраслевых рынков - Экономика полезных ископаемых - Экономика предприятий - Экономика природных ресурсов - Экономика природопользования - Экономика сельского хозяйства - Экономика таможенного дел - Экономика транспорта - Экономика труда - Экономика туризма - Экономическая история - Экономическая публицистика - Экономическая социология - Экономическая статистика - Экономическая теория - Экономический анализ - Эффективность производства -