<<
>>

Выборочные аналоги параметров генеральной совокупности

Значительная часть задач статистики связана с необходимостью описать большую совокупность объектов. Обычно эту совокупность называет генеральной. Генеральной совокупностью, например, могут быть все жители Москвы, месячная продукция завода, производящего телевизоры, популяция рыб, живущих в данном заливе.

Но генеральная совокупность - это не просто множество. Эти слова применимы лишь к тем случаям, когда множество изучается выборочным методом. Если интересующая нас совокупность объектов слишком многочисленна или ее объекты труднодоступны, или име

ются другие причины, не позволяющие изучить все объекты, прибегают к изучению какой-то части объектов. Эта выбранная для полного исследования часть называется выборкой. Естественно желание выбрать ее так, чтобы она наилучшим образом представляла целое, была, как говорят, репрезентативной. Как этого добиться? Если целое, т. е. генеральная совокупность, нам мала или совсем неизвестна, не удается предложить ничего лучшего, чем чисто случайный выбор. Большая осведомленность позволяет действовать лучше, но все равно на некоторой стадии наступает незнание и как результат - случайный выбор.

Допустим, на большом поле мы хотим оценить урожай, прежде чем он будет собран. На различных участках растения развивались по-разному. На возвышениях испытывали недостаток влаги, а во впадинах - избыток. Удобрения были рассеяны тоже не вполне равномерно. По краям поля растения больше угнетались сорняками и т. д. Теоретически возможно было бы разделить наше поле на ряд однородных участков и изучить каждый участок отдельно. Однако разбивка на совершенно однородные участки невозможна. Выборочный метод предлагает другой подход. Мысленно разделим наше поле на квадраты площадью, скажем, 1 м2. Допустим, площадь нашего поля 12 тыс. м2. Генеральная совокупность состоит теперь из 12 тыс. малых участков по 1 м2.

Допустим, мы решаем обследовать 50 малых участков. (Вопрос о том, сколько участков надо обследовать и как это влияет на точность результата, мы рассмотрим ниже.) Как их выбрать? Занумеруем все 12 тыс. участков, безразлично, по какому принципу. Важно лишь, чтобы каждый участок имел номер и различные участки получили бы разные номера. Пятьдесят участков для обследования выберем чисто случайно. Этот выбор может быть сделан с помощью таблиц случайных чисел.

Сейчас проводится много социальных обследований. Цели их различны, но всегда связаны с описанием распределения в обществе значений каких-либо признаков, будь то политические симпатии или использование свободного времени. Генеральной совокупностью, в зависимости от задач, могут быть население города или страны, служащие определенного предприятия или учащиеся высших учебных заведений. Основной метод исследования выборочный, на сплошное обследование не хватает ни времени, ни сил. Но как произвести случайный выбор?

Как правило, случайный отбор идет по легко наблюдаемым признакам, относительно которых мы уверены, что они не связаны с интересующим нас признаком, ради изучения которого ведется исследование. Например, имея в руках список всех сотрудников данного предприятия, можно выделить из этого списка каждого десятого; они-то и составят выборку.

Нарушение принципов случайного выбора обычно приводит к серьезным ошибкам. Стал знаменитым своей неудачей опрос, проведенный американским журналом «Литературное обозрение» относительно исхода президентских выборов в 1936 г. Кандидатами на этих выборах были Ф. Д. Рузвельт и А. М. Ландон. В качестве генеральной совокупности редакция журнала использовала телефонные книги. Отобрав случайно 4 млн адресов, она разослала открытки с вопросами об отношении к кандидатам в президенты по всей стране. Затратив большую сумму на рассылку и обработку открыток, журнал объявил, что на предстоящих выборах президентом США с большим перевесом будет избран А. М. Ландон. Результат выборов оказался противоположным этому прогнозу.

Здесь были совершены сразу две ошибки. Во-первых, телефонные книги не могли дать репрезентативную выборку из населения страны, хотя бы потому, что абоненты в 1936 г. были в основном зажиточные главы семейств. Во-вторых, прислали ответы не все, а люди, не только достаточно уверенные в своем мнении, но и привыкшие отвечать на письма, т. е. в значительной части представители делового мира, которые и поддерживали А. М. Ландона. Явление, подобное только что описанному, когда выборка представляет не всю генеральную совокупность, а лишь какой-то ее слой, какую-то ее часть, называется смещением выборки. Смещение - один из основных источников ошибок при использовании выборочного метода.

Такой ошибки избежали социологи Дж. Гэллап и Э. Роупер. Они правильно предсказали победу Ф.Д. Рузвельта, основываясь всего лишь на 4 тыс. анкет. Причиной этого успеха, сделавшего славу его авторам, было не только правильное составление выборки. Они учли, что общество распадается на социальные группы, которые более однородны по отношению к кандидатам в президенты. Значит, выборка из слоя может быть относительно малочисленной с высоким результатом точности. Имея результаты обследования по слоям, можно характеризовать общество в целом.

Из сказанного выше следуют следующие выводы.

Генеральной совокупностью (X) называют множество результатов всех мыслимых наблюдений над значениями одного или нескольких признаков, которые могут быть сделаны при данном комплексе условий. При этом комплекс условий определяет вариацию признаков генеральной совокупности. Синонимом генеральной совокупности в статистике является случайная величина X. Выборочной совокупностью (выборкой) хь х2,..., х„ называют множество результатов, случайно отобранных из генеральной совокупности. Выборка должна быть репрезентативной, т.е. правильно отражать пропорции генеральной совокупности. Это достигается случайностью отбора, когда все объекты генеральной совокупности имеют одинаковую вероятность быть отобранными.

Задача статистики практически сводится к обоснованному суждению об объективных свойствах генеральной совокупности по результатам случайной выборки.

В основе объяснения перехода от характеристик случайной величины X, которые вычисляются на основе точного знания исследуемого закона распределения, к эмпирическим (выборочным) лежит интерпретация выборки как модели генеральной совокупности, в которой возможными значениями являются наблюдавшиеся (т.е. практически реализованные) значения хь х2,..., х„, а в качестве вероятностей берутся соответствующие относительные частоты их появления в выборке, т.е. величины, равные 1/и. Таким образом, выборку можно представить в табличном виде:

Условно рассматривая выборку как табличную форму задания дискретной случайной величины, возможные значения которой х,, х2,..., хп появляются с одними и теми же вероятностями р\-р2-

1

= ...=/?„ = —, легко представить эмпирические аналоги рассмотрен- п

ных выше начальных (8.16) и центральных (8.17) моментов.

Сказанное проиллюстрируем на примере наиболее часто используемых начального момента первого порядка vt = MX и центрального момента второго порядка ц2= DX-

Согласно (8.6), математическое ожидание дискретной случайной величины с п возможными значениями хь х2,...»хп и соответствующими вероятностямиравно:

Исходя из формулы математического ожидания, мы пришли к формуле средней арифметической (выборочной средней), основной и наиболее употребительной характеристики центра группирования:

(8.35)

Таким образом, средняя арифметическая х является выборочным аналогом математического ожидания MX. Дисперсия дискретной случайной величины согласно (8.11) равна:

Учитывая, что для выборки              получим:

Итак, мы пришли к формуле выборочной дисперсии:

(8.36)

которая является выборочным аналогом генеральной дисперсии DX.

Рассуждая аналогично, можно получить выборочные аналоги и других моментов генеральной совокупности, а также показать, что

т

относительная частота — есть выборочный аналог вероятности р

появления некоторого события А в отдельном испытании, если т есть число появления события А в п независимых испытаниях. Выборочным аналогом теоретической функции распределения F(x)

(6.2) является функция Р(х), построенная по выборке объемом п и определяемая соотношением

(8.37)

где v(x) - число выявленных значений в выборке хь х2,..., х„, меньших х.

Из определения эмпирической функции распределения непосредственно следует объяснение часто используемого ее другого названия - «накопленная относительная частота».

Для построения выборочной функции плотности /(х) по выборке объема п из непрерывной генеральной совокупности X используют предварительно сгруппированные данные (см. п. 2.4) и полагают, что

(8.38)

где к - порядковый номер интервала группирования, в который попала точка х; v(x) - число наблюдений, попавших в этот интервал, Д*- длина интервала.

В статистике используются два различных варианта интерпретации выборки и ее отдельных элементов.

При первом (практическом) варианте интерпретации под выборкой Х|, х2,..., х„ понимаются фактически выявленные значения исследуемой случайной величины, т. е. конкретные числа.

В соответствии со вторым вариантом интерпретации под выборкой х1; х2,х„ понимается последовательность независимых, одинаково распределенных случайных величин, закон распределения которых совпадает с распределением генеральной совокупности. Таким образом, если генеральная совокупность X имеет нормальное распределение, т. е. X-N (ц; о), то х, также принадлежит для всех i = 1, 2,п к нормальному распределению с математическим ожиданием Мх,- = ц и дисперсией Dxt = а2, т.

е. х, ~А^(ц; а) для i = 1, 2,..., п.

В соответствии со вторым определением выборки все выбороч- _ т

ные характеристики (х, s2, s, —) являются случайными величинами, как функции от случайных х,.

В отличие от выборочных, параметры генеральной совокупности (ц, а2, а, р) являются неслучайными величинами.

Как уже отмечалось, средние из большого числа наблюдений обнаруживают замечательную устойчивость. К такого рода средним относятся и все рассмотренные выше выборочные характеристики. Математическим обоснованием этого факта служат различные формы закона больших чисел. Закон позволяет теоретически обосновать устойчивость основных выборочных характеристик распределения (среднего значения, дисперсии, функции распределения и плотности, построенных по выборке хь х2,..., х„). При этом показателем устойчивости служит дисперсия соответствующей выборочной характеристики.

Проиллюстрируем сказанное на примере выборочной средней х, полученной по выборке хь х2,..., х„, взятой из генеральной совокупности х с математическим ожиданием Мх* = ц и дисперсией Dx, = о2.

Отсюда, в соответствии со вторым определением выборки, следует, что ее i-й элемент х,- есть случайная величина с математическим ожиданием Мх, = ц и дисперсией Z)x, = ст2 для всех г = 1,2,..., п. При этом элементы выборки хь х2,..., х„ взаимно независимы. Тог

В соответствии со свойствами дисперсии (8.14) и (8.15) можно

1

вынести множитель — за знак дисперсии, возведя предварительно

alt="" />

его в квадрат, и поменять местами знаки дисперсии и суммирования. Тогда будем иметь

(8.39)

Таким образом, согласно (8.39) по мере увеличения объема выборки дисперсия х будет уменьшаться и средняя будет стремиться к постоянной величине, определяемой генеральной средней ц.

Чтобы убедиться в этом, определим математическое ожидание х. С учетом свойств (8.8) и (8.9) математического ожидания будем иметь

В приведенном виде

Поэтому по мере увеличения п величина х будет приближаться к Мх = р со все меньшей вариацией.

Аналогично, относительная частота              какого-либо собы

тия по мере увеличения объема выборки п будет более точно характеризовать вероятность р этого события, так как согласно (8.33) математическое ожидание w равно Mw=р, а среднее квадратическое


отклонение w равно

Среднее квадратическое отклонение выборочных характеристик х и w с одной стороны характеризует их вариацию относительно математического ожидания, а с другой - ошибку выборки при оценке соответствующего параметра генеральной совокупности (ц или р). В этой связи среднее квадратическое отклонение называют стан

Статистические оценки стандартной ошибки выборки. Во многих случаях параметры генеральной совокупности ц, а и р неизвестны, а известны лишь полученные по выборке их оценки, значения средней арифметической х , выборочного среднего квадратичес

кого отклонения s или относительной частоты              Тогда оцен-

(8.41)

(8.42)

При достаточно больших объемах выборки (и gt; 30 для х и п gt; 100 для w) можно считать с учетом (8.41) и (8.42), что нормальный закон распределения имеет выборочные характеристики:

(8.43)

т.е.а также


(8.44)

Из (8.23) следует, что вероятность попадания случайной величины t в интервал от -ty до ty равна:

(8.45)

где у - заданная вероятность, а значения /у определяются по табл. П.1 из условия

Подставив в (8.45) значения t согласно выражениям (8.43) и (8.44) и решив неравенства относительно параметров ц и р соответственно, получим первый результат:

(8.46)

где              - предельная ошибка средней х.

(8.47)

где

ной частоты ги.

Формулы (8.46) и (8.47) определяют также интервал, в котором с вероятностью у будут находиться неизвестные параметры генеральной совокупности, соответственно математическое ожидание ц и вероятность р. 

<< | >>
Источник: В. С. Мхитарян, Т. А. Дуброва, В. Г. Минашкин. Статистика: Учебник для студ. учреждений сред. проф. С  образования. 2004

Еще по теме Выборочные аналоги параметров генеральной совокупности:

  1. Основные способы формирования выборочной совокупности
  2. § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
  3. 1.6. Выборочный метод в статистике. Статистические гипотезы Какое наблюдение называется выборочным?
  4. 3.3.1. Разработка базовых параметров политики управления совокупным риском
  5. Глава 3 Определение выпуска: введение совокупного предложения и совокупного спроса
  6. ГЛАВА 4. ОБЩЕЕ              МАКРОЭКОНОМИЧЕСКОЕ РАВНОВЕСИЕ: СОВОКУПНЫЙ СПРОС И СОВОКУПНОЕ ПРЕДЛОЖЕНИЕ
  7. Глава 9 ОБЩЕЕ МАКРОЭКОНОМИЧЕСКОЕ РАВНОВЕСИЕ: МОДЕЛЬ СОВОКУПНОГО СПРОСА И СОВОКУПНОГО ПРЕДЛОЖЕНИЯ
  8. Глава 4. Совокупный спрос,совокупное предложение и макроэкономическое равновесие
  9. Тема 17 СОВОКУПНЫЙ СПРОС И СОВОКУПНОЕ ПРЕДЛОЖЕНИЕ. МАКРОЭКОНОМИЧЕСКОЕ РАВНОВЕСИЕ
  10. Тема 3 Совокупный спрос и совокупное предложение (модель АО-АЭ)
  11. Краткий обзор модели совокупного спроса и совокупного предложения
  12. Глава 20 СОВОКУПНЫЙ СПРОС, СОВОКУПНОЕ ПРЕДЛОЖЕНИЕ И СТАБИЛИЗАЦИОННАЯ ПОЛИТИКА
  13. Построение кривой совокупного спроса на основе модели совокупных расходов 
  14. Совокупный спрос и совокупное предложение в переходной экономике
  15. Выборочный контроль
  16. Вы — генеральный менеджер
  17. ПРИМЕНЕНИЕ ГРАЖДАНСКОГО , , ,              ЗАКОНОДАТЕЛЬСТВА ПО АНАЛОГИИ
  18. Глава 3 СОВОКУПНЫЙ СПРОС И СОВОКУПНОЕ ПРЕДЛОЖЕНИЕ
  19. Метод исторических аналогий
- Бюджетная система - Внешнеэкономическая деятельность - Государственное регулирование экономики - Инновационная экономика - Институциональная экономика - Институциональная экономическая теория - Информационные системы в экономике - Информационные технологии в экономике - История мировой экономики - История экономических учений - Кризисная экономика - Логистика - Макроэкономика (учебник) - Математические методы и моделирование в экономике - Международные экономические отношения - Микроэкономика - Мировая экономика - Налоги и налолгообложение - Основы коммерческой деятельности - Отраслевая экономика - Оценочная деятельность - Планирование и контроль на предприятии - Политэкономия - Региональная и национальная экономика - Российская экономика - Системы технологий - Страхование - Товароведение - Торговое дело - Философия экономики - Финансовое планирование и прогнозирование - Ценообразование - Экономика зарубежных стран - Экономика и управление народным хозяйством - Экономика машиностроения - Экономика общественного сектора - Экономика отраслевых рынков - Экономика полезных ископаемых - Экономика предприятий - Экономика природных ресурсов - Экономика природопользования - Экономика сельского хозяйства - Экономика таможенного дел - Экономика транспорта - Экономика труда - Экономика туризма - Экономическая история - Экономическая публицистика - Экономическая социология - Экономическая статистика - Экономическая теория - Экономический анализ - Эффективность производства -