Точность, устойчивость и адекватность модели
Качество модели проверяют по трем основным признакам: точности, устойчивости и адекватности. В разд. 4.4.2 мы кратко коснулись этих вопросов, рассмотрим их теперь подробнее.
А.
Для характеристики точности статистических моделей используются различные критерии: средняя относительная ошибка ?отн, Е-критерий, коэффициент детерминации R2 и стандартное отклонение А-. Остановимся на последней характеристике. '
Если вид функции регрессии /(х) = E(Y\x) известен, а ее параметры определены методом наименьших квадратов, то стандартное отклонение определяется по формуле
где К — фактические, К. — расчетные значения выходного показателя Е, а т +1 — число параметров модели.
При переходе к нормированному выходному показателю по формуле Y' = Y/(Ymax - YmJ, где Emax и Emin — максимальное и минимальное наблюдаемые значения показателя Е, формула (7.5) принимает вид
Значительно сложнее обстоят дела в случае, когда вид функции Дх) неизвестен.
В этом случае [13] основной (и по существу, единственной) характеристикой точности аппроксимационного варианта регрессионной модели является оценка а среднеквадратической ошибки аппроксимации о, вычисляемая по формуле
f.-(x) =f(x, 0 ), 0 — неизвестные параметры 0, построенные по
' 1/ U —об
обучающей подвыборке Bfl] .
Значение о позволяет оценить максимально возможную погрешность аппроксимации неизвестной функции регрессии (в пределах обследованного диапазона X) величиной ±2g/a//V , а результирующего показателя У(х) — величиной ±2а. Из сказанного следует, что наиболее точно приближает неизвестную функцию регрессии f(x) функция f(x), для которой о2 минимальна.
В случае когда экзаменующая подвыборка состоит из одного элемента, а обучающая — из всех остальных, формула (7.7) принимает вид
+ Замечание. Если вид функции регрессии не задан заранее, то величина Sp рассчитанная по формулам (7.5) или (7.6), не характеризует точность модели. Действительно, нетрудно подобрать функцию Y(x) = fix) такую, что S* невелико на заданной выборке, но на другой выборке Sp может оказаться очень большим, поскольку величина У(х) является случайной. Выбор модели по принципу минимизации критериев (7.7), (7.8) обеспечивает максимальную точность и устойчивость модели к варьированию состава выборочных данных, на основе которых она оценивается.
Точность параметрической аппроксимативной модели определяется величиной о2, вычисленной по формуле (7.8).
При этом выполняются приближенные оценки при достаточно больших N:
Пх) - У(х)
где fix) = ?(Т|х) — неизвестная функция регрессии, а fix) аппроксимация функции fix).
Для непараметрической модели а определим по формуле
о = min dib),
где dib) находится по формуле (7.3).
Так как [13] о задает асимптотически (при п —» сю) несмещенную оценку величины среднеквадратической погрешности непараметрической аппроксимации, то можно утверждать, что при достаточно большом N оценка (7.10) верна с вероятностью более 0,95, если остаток У- У подчиняется нормальному закону распределения.
Получить строгие оценки вида (7.9), (7.10) в данном случае при конечном N невозможно. В связи с этим в последующих разделах будут приведены результаты вычислительных экспериментов на модельных примерах, в которых регрессионная зависимость fix) известна. В этом
Б. Устойчивость модели по исходным статистическим данным в литературе не имеет однозначного толкования. Интуитивно под устойчивостью понимается относительно небольшая вариация расчетных значений при малых возмущениях входных данных.
Заметим вначале, что функция Y(x) = f(x) зависит от входных данных. Для того чтобы отметить эту зависимость в записи функции, введем обозначения:
XQ= (х..)м:"{ — матрица входных данных по объясняющим переменным (/= 1, ..., У; j= 1, ..., п)\
Y{) = (jr) j — столбец данных по выходному показателю;
АХ = (Алл— матрица возмущений объясняющих переменных;
AY = (АУ^=\ — столбец возмущений по выходному показателю.
Построенную модель можно записать в виде Y(x) =f(X0, Г0, х).
Тогда можно использовать общепринятое в математике понятие устойчивости, а именно: модель устойчива по X и Y, если найдется постоянная С gt; 0 такая, что
1/Ц, + А* г0 + АТ, х) - ДХ0, г0, х)| lt; С\\АХ\\ • ||ДТ||, (7.12)
где ||ДТ|| — норма матрицы и ||ДТ|| — норма вектора.
Отметим, что параметр С может зависеть от размеров допустимой области возмущений АХ и АТ. Пусть Д2, = ДАУ||АТ||, а Дц = АТ/||АТ||, тогда АХ = кtA^, а АТ= к2Аг\. Неравенство тогда можно записать в виде
1ЛЛ + М^ го + Мл, X) -ДХ0, т0, х)| lt; С(кл, к2). (7.13)
Неравенства (7.12) и (7.13) характеризуют абсолютную устойчивость, однако на практике более актуальным является вопрос об относительной устойчивости. Тогда неравенство (7.12) следует заменить на неравенство
lM + АТ г0 + д К х) - /lt;Т0, ?0, дг)| / |М. Ц *)1 lt;
lt; ЦДА1 ЦДЦ
“ 11Ц|| г0г
а в неравенстве (7.13) получаем: ||Д^|| = ||Т0||, ||Дг||| = ||Т0
Если функция С{к{, к-,) быстро возрастает, начиная с некоторых к°{, кто будем говорить, что модель теряет устойчивость при превышении погрешности по входным факторам на к°{ • 100%, а по выходным показателям — на к2- 100%.
Аналогичным образом можно определить меру устойчивости по выходным показателям при фиксированных входных объясняющих факторах, а также устойчивость по отдельным факторам.
Адекватность модели можно рассматривать с двух позиций: по экономико-математической модели в целом и по математической составляющей этой модели (см. разд. 4.4.2 и 4.4.4). Проверка адекватности экономикоматематической модели проводится стандартным образом и сводится к проверке нескольких признаков для ряда остатков г;.= Yj-f(xj): равенство нулю математического ожидания (несмещенность модели); выполнение нормального закона распределения для уровней остатка; вычисление ко-
N N _ 2
эффициента детерминации: R2 - 1 - - У) , который показы-
/= 1 /= 1
вает долю вариации показателя Y под воздействием объясняющих факторов X = (Х1, ..., XJ.
Под мерой адекватности математической составляющей модели мы понимаем отклонение аппроксимативной модели Y(x)=/(x) от искомой регрессионной зависимости f(x) = E(Y\Х= х). Поскольку функция f(x)
нам неизвестна, то погрешность Е = max оценкой 2 a/VA в неравенстве (7.9).
Еще по теме Точность, устойчивость и адекватность модели:
- 3.3. Балансовые пропорции, адекватные финансовой устойчивости предприятия
- 6.4. СТАТИСТИЧЕСКАЯ ПРОВЕРКА АДЕКВАТНОСТИ МОДЕЛЕЙ
- 10.6. Оценка адекватности и точностивыбранных моделей
- 3.5.3. Анализ адекватности регрессионных моделей
- Точность расчетов, проведенных с использованием CGE моделей
- Актуальность построения модели, адекватно отражающей деятельность налогоплательщиков, как основы автоматизации процесса налогового контроля
- Методы и алгоритмы уточнения модели с учетом структуры связи между факторами и показателями, а также точности исходной информации
- Оптимизационная модель портфеля проектов устойчивого развития
- Модели роста: устойчивый и неустойчивый сценарий
- 3.2 Организационная модель реализация концепции устойчивого развития компании
- 4. Разработана организационная модель реализации концепции устойчивого развития с применением элементов системы управления проектами и обоснована ее целесообразность
- 33.4. Анализ точности
- Оценка точности статистического наблюдения
- 5.3.2 Устойчивый рост. Сравнительная статикапри устойчивом уровне исследований
- 6.4.2. Двухэтапная процедура тестирования адекватности САРМ
- Устойчивость и устойчивое развитие как категории регионального менеджмента
- точность — вежливость королев
- Глава 4 Гигиена души: сохранить адекватность
- Оценка точности методов экспертных оценок
- Точность статистического наблюдения