§ 16.3. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА. КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ
Мы хотим знать, насколько хорошо приближает наши данные линейная модель, у, - у = (у, - у,) + (у, - у) = (у, - у) + е,.
Формула у — а + Ьх только частично объясняет вариацию значений у (а именно, слагаемое у, — у).
Но ведь на у влияют и другие факторы. Их влияние скрыто в остатке е,. Если бы связь была строго линейной, то е, = 0. И так для каждой точки х,.п
? (у, - у)2 — это общая вариация переменной у.
95
п
2 (У, - У)2 — это вариация переменной у, которая объясняется
1=1
формулой у = а + Ьх.
п
Z Си, - у,)2 — это вариация переменной у, которая не объясняется
J=I
формулой у = а + Ьх.
Ш-у)2
Введем характеристику г2 = —„-— коэффициент детерми-
1=1
нации. Эта мера показывает величину вариации переменной у, которая объясняется переменной х при наличии линейной связи этих величин. В случае строгой линейной зависимости между х и у г2 = 1. Если зависимость между х и у отсутствует, то г2 = 0.
Коэффициент детерминации не указывает причины и следствия. Он просто является математическим выражением взаимосвязи между переменными и показывает степень их взаимосвязанных изменений, хотя в экономической теории и можно постулировать причинно-следственную связь между этими переменными.
Коэффициент корреляции Пирсона:
Вторая дробь — удобная расчетная формула, которую чаще всего используют.
Коэффициент корреляции Пирсона г содержит информацию о поведении у с ростом х. Знак коэффициента корреляции Пирсона г совпадает со знаком коэффициента Ъ. Чем ближе г к 1, тем ближе связь между х и у к линейной. При г = 0 линейной связи между хм у не существует (но, возможно, между х и у есть другая зависимость).
Сильная корреляция между переменными необязательно указывает на причину и следствие. Например, может быть установлена сильная корреляция между зарплатой учителя и продажей спиртных напитков. Отсюда никак нельзя сделать вывод, что учителя пьют.
Просто обе эти величины связаны через другую переменную — общий уровень наличного дохода. Это пример ложной корреляции.Пример 82. Найдем остатки е„ коэффициент корреляции Пирсона и коэффициент детерминации в примере 81.
96
у = 2,12 — 0,Их Заполним таблицу. Номер X У f 2,12-0,11* е = у-у 1 2 1,9 3,61 1,90 0,00 2 3 1,7 2,89 1,79 -0,09 3 4 1,8 3,24 1,68 0,12 4 5 1,6 2,56 1,57 0,03 5 6 1,4 1,96 1,46 -0,06 Сумма 20 8,4 14,26 Поясним, как заполняется таблица. В 4-м столбце указаны квадраты соответствующих чисел 3-го столбца. Каждое число 2-го столбца подставляем в выражение 2,12 — 0,11х и результат пишем в 5-м столбце. В 6-м столбце указана разность чисел 3-го и 5-го столбцов. В последней строке указана сумма чисел соответствующего столбца.
п п ft _1=1 '=1 1=1_ _
= 5X32,5-20X8,4
У (5X90 - 202)(5Х 14,26 - 8,42)
Это значение близко к —1, что свидетельствует об очень сильной отрицательной связи (с ростом х значения у убывают). Знаки Ъ = —0,11 и г = -0,904 совпадают.
Коэффициент детерминации г2 = (—0,904)2 = 0,817, то есть 81,7% общей вариации себестоимости у зависит от выпуска продукции х.
Наша модель не объясняет 18,3% вариации себестоимости. Эта часть вариации объясняется факторами, не включенными в модель.
Задача 82. Найти остатки е„ коэффициент корреляции Пирсона и коэффициент детерминации в задаче 81.
Замечание. Для вычисления коэффициента корреляции Пирсона можно воспользоваться статистическими функциями ПИРСОН (массив 1; массив 2) или КОРРЕЛ (массив 1; массив 2) мастера функций fx пакета Excel. Массив 1 и массив 2 — это ссылки на ячейки, содержащие значения переменных. Для вычисления коэффициента детерминации можно воспользоваться статистической функцией КВПИРСОН (изв_знач_у; извзначх).
97
Еще по теме § 16.3. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА. КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ:
- 3.4. Коэффициент детерминации
- КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
- 3.5. Определение уравнения линии характеристики и коэффициента детерминации с помощью программы Excel
- 5.2.1.3. Оценка величины не хеджируемого риска портфеля. Определение коэффициента детерминации портфеля с помощью программы Excel
- 1.2.4. Использование программы Excel для расчета ковариации и коэффициента корреляции доходностей ценных бумаг
- § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
- Таблица 16 Пример 16-разрядной тарифной сетки с разрядными коэффициентами и расчетом базового оклада для каждого тарифного разряда Тарифныйразряд Разрядный коэффициент Базовый оклад (в рублях) 16 8 16000 15 7 14000 14 6,5 13000 13 6 12000 12 5 10000 11 4 8000 10 3 6000 9 2 4000 8 1,6 3200 7 1,3 2600 6 1 2000 5 0,9 1800 4 0,8 1600 3 0,7 1400 2 0,6 1200 1 0,25 500 Базовый тариф 2000 Система надбавок
- Ранговые коэффициенты связи
- § 32.4. КОЭФФИЦИЕНТ ХЕДЖИРОВАНИЯ
- ФИНАНСОВЫЕ КОЭФФИЦИЕНТЫ
- Анализ финансовых коэффициентов
- Районные коэффициенты к зарплате
- Коэффициент Джини
- Концепция бета-коэффициента
- 6.5. Коэффициенты обеспеченности