Выборочные наблюдения (лекции и методические указания)
4. МЕТОД ВЫБОРОЧНЫХ НАБЛЮДЕНИЙ
4.1. Выборочное исследование
При статистическом исследовании экономических явлений могут применяться выборочные наблюдения, при которых характеристики генеральной совокупности получаются на основании изучения части генеральной совокупности, называемой выборочной совокупностью или выборкой.
Выборочное наблюдение (выборочное исследование) заключается в обследовании определенного числа единиц совокупности, отобранного, как правило, случайным образом. При выборочном методе обследованию подлежит сравнительно небольшая часть всей изучаемой совокупности (обычно до 5–10%, реже до 15–20%). Отбор единиц из генеральной совокупности производится таким образом, чтобы выборочная совокупность была представительна
(репрезентативна) и характеризовала генеральную совокупность. Степень представительности выборки зависит от способа организации выборки и от ее объема. Полной репрезентативности выборки достичь не удается. Поэтому необходима оценка надежности результатов выборки и возможности их распространения на генеральную совокупность.
В зависимости от характеристик выборочных совокупностей выборки могут быть представительными, расслоенными, засоренными и цензурированными.
Представительная выборка – выборка наблюдений из генеральной совокупности, наиболее полно и адекватно представляющая ее свойства.
Расслоенная выборка – выборка, включающая ряд выборочных совокупностей, взятых из соответствующих слоев генеральной совокупности. Широко используется при выборочном обследовании в экономике, демографии и социологии.
Засоренная выборка – выборка наблюдений, содержащая “грубые” ошибки. Основная масса элементов засоренной выборки является реализацией случайной величины X , закон распределения которой известен. Такие элементы – “типичные” – появляются в совокупности с вероятностью . С вероятностью элементы совокупности оказываются реализацией другой случайной величины Y , закон распределения которой в общем случае неизвестен. Такие элементы называются “грубыми” ошибками. Обычные оценки, например, средняя арифметическая выборочная, на засоренной выборке теряют свои оптимальные свойства (эффективность, несмещенность) с ростом интенсивности засорения .
Цензурированная выборка – выборка, полученная из вариационного ряда наблюдений путем отбрасывания некоторого числа экстремальных наблюдений. Если отбрасывание производится по признаку выхода наблюдений за пределы заданного интервала, то такой прием называется цензурирование первого типа. В этом случае число оставшихся наблюдений является случайной величиной. Если отбрасывается фиксированная доля крайних малых значений и фиксированная доля крайних больших значений, то это называется цензурированием второго типа уровня При этом, число оставшихся в рассмотрении наблюдений является величиной заранее заданной.
Проведение выборочных исследований статистической информации состоит из следующих этапов:
– формулировка цели статистического наблюдения;
– обоснование целесообразности выборочного наблюдения;
– отграничение генеральной совокупности;
– установление системы отбора единиц для наблюдения;
– определение числа единиц, подлежащих отбору;
– проведение отбора единиц;
– проведение наблюдения;
– расчет выборочных характеристик и их ошибок;
– распространение выборочных данных на генеральную совокупность.
Выборочное исследование осуществляется с минимальными затратами труда и средств и в более короткие сроки, чем сплошное наблюдение, что повышает оперативность статистической информации, уменьшает ошибки регистрации. В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции, сопровождающимся разрушением проверяемого изделия.
Выборочный метод дает достаточно точные результаты, поэтому он может применяться для проверки данных сплошного наблюдения. Минимальная численность обследуемых единиц позволяет провести исследование более тщательно и квалифицированно. Например, при переписях населения практикуются выборочные контрольные наблюдения для проверки правильности записей сплошного наблюдения.
В основе теории выборочного наблюдения лежат теоремы законов больших чисел, которые позволяют решить два взаимосвязанных вопроса выборки: рассчитать ее объем при заданной точности исследования и определить ошибку при данном объеме выборки.
При использовании выборочного метода обычно используются два вида обобщающих показателей: относительную величину альтернативного признака и среднюю величину количественного признака.
Относительная величина альтернативного признака характеризует долю (удельный вес) единиц в статистической совокупности, обладающих изучаемым признаком. В генеральной совокупности эта доля единиц называется генеральной долей (p), а в выборочной совокупности – выборочной долей (w).
Средняя величина количественного признака в генеральной совокупности называется генеральной средней ( ), а в выборочной совокупности – выборочной средней ().
4.2. Виды отбора при выборочном наблюдении
Процесс образования выборки называется отбором, который осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности.
Основным условием проведения выборочного наблюдения является предупреждение возникновения систематических (тенденциозных) ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности. Существуют различные способы отбора: индивидуальный, групповой (серийный), комбинированный, повторный (возвратный), бесповторный (безвозвратный),одноступенчатый, многоступенчатый, собственно–случайный, механический, типический, двухфазный и многофазный отбор
При индивидуальном отборе в выборку отбираются отдельные единицы совокупности. Отбор повторяется столько раз, сколько необходимо отобрать единиц.
Групповой (серийный) отбор заключается в отборе серий (например, отбор изделий для проверки их целыми партиями). Если обследованию подвергаются все единицы отобранных серий, отбор называется серийным, а если обследуется только часть единиц каждой серии, отбираемых в индивидуальным порядке из серии, то – комбинированным.
Если в процессе отбора отобранная единица не исключается из совокупности, т.е. возвращается в совокупность, и может быть повторно отобранной, то такой отбор называется повторным или возвратным, в противном случае – бесповторным или безвозвратным. Серийный отбор, как правило, безвозвратный.
При повторном отборе вероятность попадания в выборочную совокупность всех единиц генеральной совокупности остается одинаковой. При бесповторном - для оставшихся единиц совокупности вероятность попадания в выборку увеличивается.
При одноступенчатом отбираются единицы совокупности (или серии) непосредственно для наблюдения. При многоступенчатом отбираются сначала крупные серии единиц (первая ступень отбора), наблюдению они не подвергаются. Затем из них отбираются серии, меньшие по численности единиц (вторая ступень), наблюдению не подвергаются, и так до тех пор, пока не будут отобраны те единицы совокупности (серии), которые будут подвергнуты наблюдению.
Собственно–случайный отбор состоит в отборе единиц (серий) из всей генеральной совокупности в целом посредством жеребьевки или на основании таблиц случайных чисел.
Жеребьевка состоит в том, что на каждую единицу отбора составляется карточка, которой присуждается порядковый номер. После тщательного перемешивания по очереди извлекаются карточки, пока не будет отобрано требуемое число единиц.
Случайными числами называются ряды чисел, являющихся реализациями последовательности взаимно независимых и одинаково распределенных случайных величин. Эти последовательности чисел получаются либо с помощью физических генераторов (подбрасывание кубиков с нанесенными на их сторонами цифрами; вытягиванием из урны карточек с написанными на них цифрами, преобразование случайных сигналов и др. физико–технические процессы), либо с помощью программных генераторов (аналитическим методом с помощью программ для ЭВМ). Числа, являющиеся результатами соответствующей вычислительной процедуры, называются псевдослучайными числами. Последовательность псевдослучайных чисел носит детерминированный характер, но в определенных границах она удовлетворяет свойствам равномерного распределения и свойству случайности.
Случайные числа могут быть выбраны по таблице случайных чисел (приложение 1), которая содержит 2000 случайных чисел, объединенных для удобства пользования таблицей в 500 блоков по 4 значения) Например,
5489, 5583, 3156, 0835, 1988, 3912.
Применение комбинаций этих цифр зависит от размера совокупности: если в генеральной совокупности 1000 единиц, то порядковый номер каждой единицы должен состоять из двух цифр от 000 до 999. В этом случае первые 8 номеров единиц выборочной совокупности следующие:
548, 955, 833, 156, 083, 519, 883, 912.
При произвольном объеме генеральной совокупности, отличающегося от 100, 1000, 10000 могут использоваться псевдослучайные числа, сформированные на ЭВМ, или из таблицы случайных чисел формируется последовательность случайных величин, распределенных в интервале от 0 до 1. Например, в приведенном выше примере
0,5489; 0,5583; 0,3156; 0,0835; 0,1988; 0,3912 и т.д.
Если генеральная совокупность состоит из 2000 единиц, то в выборочную совокупность должны войти единицы с номерами:
2000 × 0,5489 = 1097,8 или 1099;
2000 × 0,5583 = 1116,6 или 1117;
2000 × 0,3156 = 631,2 или 631;
2000 × 0,0835 = 167,0 или 167;
2000 × 0,1988 = 397,6 или 398;
2000 × 0,3912 = 782,4 или 782.
Процесс формирования случайных чисел и определения номера отбираемой единицы продолжается до тех пор, пока не будет получен заданный объем выборочной совокупности.
Можно предложить другой способ случайного отбора единиц в выборку. Допустим, что выборка состоит из 75 единиц, а генеральная совокупность - из 780. Из таблицы случайных чисел выбираются, например, следующие
5489, 5583, 3156, 0835, 1988, 3912.
В выборку могут войти только единицы, порядковые номера которых равны трехзначным числам меньше 780. Поэтому, используя только три последние цифры каждого числа, отбирается необходимые 75 номеров: 489, 583, 156 и т.д. Можно использовать и первые три цифры каждого числа, тогда отобранные номера: 548, 558, 315, 83, 198, 391. Можно разбить случайные четырехзначные случайные числа на ряд, состоящий из трехзначных чисел:
548, 955, 833, 156, 083, 519, 883, 912
и отобрать из них номера, которые меньше 780, а именно: 548, 156, 83, 519.
Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%–м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за № 1, то следующими отбираются 11–я, 21–я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их “рангов”, т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.
При достаточно большой совокупности этот способ отбора близок к собственно случайному, при условии, что применяемый список не составлен таким образом, чтобы какие-то единицы совокупности имели больше шансов попасть в выборку.
При типическом отборе генеральная совокупность разбивается на типические группы единиц по какому–либо признаку (формируются однородные совокупности), а затем из каждой из них производится механический или собственно–случайный отбор. Отбор единиц из типов производится тремя методами: пропорционально численности единиц типических групп, непропорционально численности единиц типических групп и пропорционально колеблемости признака в группах.
В целях экономии средств данные по некоторым интересующим исследователя признакам можно анализировать на основании изучения всех единиц выборочной совокупности, а по другим признакам - на основании части единиц выборочной совокупности, которые представляют подвыборку из единиц первоначальной выборки. Этот метод называется двухфазным отбором. При наличии нескольких подвыборок - метод многофазного отбора.
Многофазный отбор по своей структуре отличается от многоступенчатого отбора, так при многофазном отборе используются на каждой фазе одни и те же отобранные единицы, при многоступенчатом отборе на разных ступенях применяются единицы отбора разных порядков. Многофазным отбором чаще всего пользуются в тех случаях, когда различно число единиц, необходимых для определения отдельных показателей с заданной точностью. Это связано как с различиями в степени колеблемости признаков, так и с разной точностью, требуемой для расчетов. Ошибки при многофазной выборке рассчитываются на каждой фазе отдельно.
Все виды отбора, поскольку они могут быть повторными или бесповторными, имеют разновидности (табл.1)
Таблица1
Вид отбора |
Разновидности отбора в зависимости от |
|
повторяемости отбора единиц совокупности |
от величины серий или пропорциональности отбора единиц совокупности в группах |
|
Собственно случайный |
1. Собственно случайный повторный 2. Собственно случайный бесповторный |
|
Механический |
1. Механический повторный 2. Механический бесповторный |
|
Серийный |
1. Серийный с повторным отбором серий 2. Серийный с бесповтор- ным отбором серий |
1.1. Серийный с повторным отбором равновеликих серий 1.2. Серийный с повторным отбором неравновеликих серий 2.1. Серийный с бесповторном отбором равновеликих серий 2.2. Серийный с бесповторном отбором неравновеликих серий |
Комбиниро-ванный |
1. Комбинированный с повторным отбором серий 2. Комбинированный с бесповторным отбором серий |
1.1. Комбинированный с повторным отбором равновеликих серий 1.2. Комбинированный с повторным отбором неравновеликих серий 2.1. Комбинированный с бесповторным отбором равновеликих серий 2.2. Комбинированный с бесповторным отбором неравновеликих серий |
Типический |
1. Типический с повторным случайном отборе внутри групп 2. Типический при бесповторном случайном отборе внутри групп |
1.1. Типический с повторным случайном отборе внутри групп, пропорциональ- ном объему групп 1.2. Типический с повторным случайном отборе внутри групп, непропорцио- нальном объему групп 1.3. Типический с повторным случайном отборе внутри групп, пропорциональ- ном колеблемости в группах 2.1. Типический с бесповторным случайном отборе внутри групп, пропорциональ- ном объему групп 2.2. Типический с бесповторным случайном отборе внутри групп, непропорцио- нальном объему групп 2.3. Типический бесповторным случайном отборе внутри групп, пропорциональ- ном колеблемости в группах |
4.3. Ошибки выборочного отбора
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т.д.
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам и т.д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Расхождение между значениями изучаемого признака выборочной и генеральных совокупностей является ошибкой репрезентативности (представи-тельности). Она может быть случайной и систематической. Случайная возникает в силу того, что выборочное статистическое наблюдение является несплошным наблюдением, и выборка недостаточно точно воспроизводит (репрезентирует) генеральную совокупность.
Систематические ошибка репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки - принцип случайности.
При определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастного, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.
Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10%-е выборки):
Оценка |
Число студентов, чел |
||
Генеральная совокупность |
Первая выборка |
Вторая выборка |
|
2 3 4 5 |
100 300 520 80 |
9 27 54 10 |
12 29 52 7 |
Итого |
1000 |
100 |
100 |
Средний балл для генеральной совокупности
по первой выборке
по второй выборке
Доля студентов, получивших оценки "4" и "5":
по генеральной совокупности
по первой выборке
по второй выборке
Разность между показателями выборочной и генеральной совокупности является случайной ошибкой репрезентативности (ошибкой выборки).
Ошибки репрезентативности:
Как видно из расчетов, выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку.
4.3.1. Ошибка выборочной средней
Ошибка выборочной средней представляет собой расхождение (разность) между выборочной средней и генеральной средней , возникающее вследствие несплошного выборочного характера наблюдения. Величина ошибки выборочной средней определяется как предел отклонения от , гарантируемый с заданной вероятностью:
где – гарантийный коэффициент, зависящий от вероятности , с которой гарантируется невыход разности за пределы ; – средняя ошибка выборочной средней.
Значения гарантийного коэффициента и соответствующие им вероятности приведены в табл.4.1. Обычно вероятность принимается равной 0,9545 или 0,9973, а при этом равно соответственно 2 и 3.
Таблица 4.1
Значения гарантийного коэффициента
1,00 1,10 1,20 1,30 1,40 1,50 1,60 |
0,6827 0,7287 0,7699 0,8064 0,8385 0,8664 0,8904 |
1,70 1,80 1,90 2,00 2,10 2,20 2,30 |
0,9109 0,9281 0,9426 0,9545 0,9643 0,9722 0,9786 |
2,40 2,50 2,60 2,70 2,80 2,90 3,00 |
0,9836 0,9876 0,9907 0,9931 0,9949 0,9963 0,9973 |
Н.В.Смирнов, И.В.Дунин-Барковский. Курс теории вероятностей и математической статистики для технических приложений. - М.: Наука, 1965. 512 с.
Стр.173
Средняя ошибка определяется как среднее квадратическое отклонение средней величины в генеральной совокупности (средней генеральной)
В математической статистике доказывается, что величина средней квадратической стандартной ошибки простой случайной повторной выборки может быть определена по формуле
где - дисперсия признака в генеральной совокупности.
Дисперсия суммы независимых величин равна сумме дисперсий слагаемых
Если все величины X>i>> > имеют одинаковую дисперсию, то
Тогда дисперсия средней
Тогда средняя ошибка при определении средней
Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:
где – дисперсия признака в выборке.
Если n достаточно велико, то близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.
Тогда средняя ошибка средней в генеральной совокупности может быть как среднее квадратическое отклонение средней величины в выборочной совокупности (средней выборочной)
Средняя ошибка выборочной средней
Значения средней ошибки выборки определяются по формуле
где – дисперсия в генеральной совокупности.
Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:
где – дисперсия в выборке.
Если n достаточно велико, то близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.
При повторном отборе средняя ошибка определяется следующим образом:
где – средняя величина дисперсии количественного признака , которая рассчитывается по формуле средней арифметической невзвешенной
или средней арифметической взвешенной
где f>i> – статистический вес.
Формулы расчета средней ошибки выборочной средней для различных, наиболее часто используемых способов отбора выборочной совокупности приведены в табл.4.2.
Таблица 4.2
Формулы расчета средних ошибок выборочной доли
и выборочной средней
Метод отбора выборки |
Средняя ошибка |
|
выборочной доли |
выборочной средней |
|
Механический или собственно–случайный повторный отбор |
||
Механический или собственно–случайный бесповторный отбор |
||
Серийный отбор при повторном отборе равновеликих серий |
||
Серийный отбор при бесповторном отборе равновеликих серий |
||
Типический отбор при повторном случайном отборе внутри групп, пропорциональном объему групп |
||
Типический отбор при бесповторном случайном отборе внутри групп, пропорциональном объему групп |
где N – численность генеральной совокупности;
– межсерийная дисперсия выборочной доли;
r – число отобранных серий;
R – число серий в генеральной совокупности;
– средняя из групповых дисперсий выборочной доли;
– дисперсия признака x в выборке;
– межсерийная дисперсия выборочных средних;
– средняя из групповых дисперсий выборочной средней.
При бесповторном оборе с каждой отобранной единицей или серией вероятность отбора оставшихся единиц или серий повышается, при этом средняя ошибка выборочной средней уменьшается по сравнению с повторным отбором и имеет следующий вид:
для механического или собственно случайного бесповторного отбора
При достаточно большом объеме совокупности N можно воспользоваться формулой
для серийного бесповторного отбора равновеликих серий
При достаточно большом числе серий в генеральной совокупности R можно воспользоваться формулой
для типического отбора с бесповторным случайном отборе внутри групп, пропорциональном объему групп
.
Межсерийная дисперсия выборочных средних и средняя из выборочных дисперсий типических групп вычисляются следующим образом:
где – среднее значение показателя в j – й серии;
– дисперсия признака x в j – й типической группе;
n>j> – число единиц в j –й типической группе.
И.Г.Венецкий, В.И.Венецкая. Основные математико-статистические понятия и формулы в экономическом анализе. - М.: Статистика, 1974. 279 с.
Средние ошибки выборки при типическом методе отбора, пропорциональном объему групп и колеблемости признака в группе приведены в табл.3
Таблица 3
Формулы расчета средних ошибок выборочной средней
и выборочной доли при типическом методе отбора
Метод отбора выборки |
Средняя ошибка |
|
выборочной доли |
выборочной средней |
|
повторный случайный отбор внутри групп, непропорциональный объему групп |
||
бесповторный случайный отбор внутри групп, непропорциональный объему групп |
||
повторный случайный отбор внутри групп, пропорциональный колеблемости признака в группах |
||
бесповторный случайный отбор внутри групп, пропорциональный колеблемости признака в группах |
где N>j> – число единиц в j –й типической группе;
n>j> – число отобранных единиц в j –й типической группе;
– выборочная дисперсия признака x в j – й типической группе
(дисперсия признака в выборке из j – й типической группы);
– выборочная дисперсия доли в j – й типической группе
(дисперсия доли в выборке из j – й типической группы);
– среднее квадратическое отклонение признака x в выборке из
j – й типической группе;
Средние ошибки выборки при комбинированной выборке с равновеликими сериями приведены в табл.4
Таблица 4
Формулы расчета средних ошибок выборки при комбинированной
выборке с равновеликими сериями
Метод отбора выборки |
Средняя ошибка |
|
выборочной доли |
выборочной средней |
|
повтор-ный отбор серий |
||
бесповторный отбор серий |
где - общее число единиц в отобранных сериях ( );
n - выбранное число единиц, подвергающихся обследованию, из отобранных
серий.
При многоступенчатом отборе на каждой ступени отбора может быть найдена своя средняя ошибка. При отборе, например, крупных групп из генеральной совокупности средняя ошибка выборки - ; при отборе мелких групп из крупных средняя ошибка выборки - ; при отборе отдельных единиц совокупности из мелких групп средняя ошибка выборки - . Если численность групп одинаковая, то средняя ошибка, как для средней, так и для доли, трехступенчатого отбора может быть определена по формуле
Предельная ошибка выражается следующим образом:
и зависит от вариации изучаемого признака в генеральной совокупности, объема и доли выборки, способа отбора единиц из генеральной совокупности и от величины вероятности, с которой гарантируются результаты выборочного наблюдения.
Средняя величина количественного признака в генеральной совокупности определяется с у четом предельной ошибки выборочной средней
Иногда для определения размеров предельной ошибки величина определяется из эмпирической формулы (И.Г.Венецкий, В.И.Венецкая. Основные математико-статистические понятия и формулы в экономическом анализе. - М.: Статистика, 1974. 279 с. - стр.188)
4.3.2. Ошибка выборочной доли
Выборочная доля представляет собой отношение числа единиц, обладающих данным признаком или данным его значением ( m ) к общему числу единиц выборочной совокупности ( n )
(Эту статистическую характеристику не следует путать с долей выборки, являющейся отношением числа единиц выборочной совокупности к числу единиц генеральной совокупности).
Ошибка выборочной доли представляет собой расхождение (разность) между долей в выборочной совокупности ( w ) и долей в генеральной совокупности ( p ), возникающее вследствие несплошного характера наблюдения. Величина ошибки выборочной доли определяется как предел отклонения w от p , гарантируемый с заданной вероятностью:
где – гарантийный коэффициент, зависящий от вероятности , с которой гарантируется невыход разности w –p за пределы ; – средняя ошибка выборочной доли.
Средняя ошибка выборочной доли определяется по формуле
Или, как было доказано выше,
где – дисперсия доли в генеральной совокупности (дисперсия генеральной доли);
– дисперсия доли в выборке (дисперсия выборочной доли).
Приведенная формула средней ошибки выборочной доли применяется при повторном отборе.
Для определения дисперсии альтернативного признака допустим, что общее число единиц совокупности равно n . Число единиц, обладающих данным признаком - f , тогда число единиц, не обладающих данным признаком, равно n-f . Ряд распределения качественного (альтернативного) признака
Значение переменной |
Частота повторений |
1 0 |
f n-f |
Итого |
n |
Средняя арифметическая такого ряда равна:
то есть равна относительной частолте (частости) появления данного признака, которую можно обозначить через p , тогда
Таким образом, доля единиц, обладающих данным признаком равна p ; соответственно доля единиц, не обладающих данным признаком, равна q ; p+q =1. Тогда дисперсия альтернативного признака определяется по формуле
Для показателя доли альтернативного признака в выборке (выборочной доли) дисперсия определяется по формуле
При бесповторном отборе численность генеральной совокупности сокращается, поэтому дисперсия умножается на коэффициент Формулы расчета средних ошибок выборочной доли для различных способов отбора единиц из генеральной совокупности приведены в табл. 4.2; 3 и 4.
Дисперсии в формулах расчета средних ошибок выборочной доли в табл.4.2. рассчитываются следующим образом:
– межсерийная дисперсия выборочной доли
где w>j>> > – выборочная доля в j –й серии;
– средняя величина доли во всех сериях;
– средняя из групповых дисперсий
где w>j>> > – выборочная доля в j –й типической группе;
n>j> – число единиц в j –й типической группе;
k – число типических групп.
Для случая, когда доля (частость) даже приблизительно неизвестна, можно произвести "грубый" расчет средней ошибки выборки для доли, используя в расчете максимальную величину дисперсии доли, равную 0,25. Тогда для
повторного отбора
бесповторного отбора
Предельное значение ошибки выборочной доли определяется по следующей формуле:
Величина средней ошибки выборочной доли зависит от доли изучаемого признака в генеральной совокупности, числа наблюдений и способа отбора единиц из генеральной совокупности для наблюдения, а величина предельной ошибки зависит еще и от величины вероятности , с которой гарантируются результаты выборочного наблюдения.
Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Доля альтернативного признака в генеральной совокупности равна
Пример
Сущность процесса случайного отбора и основные свойства простой повторной выборки можно показать на условном примере.
Генеральная совокупность состоит из трех единиц ( N = 3 ), например
Порядковый номер рабочего |
1 |
2 |
3 |
4 |
Тарифный разряд, x>i> |
3 |
4 |
4 |
5 |
Генеральная средняя
разряд;
генеральная дисперсия
доля рабочих в генеральной совокупности, имеющих 4 тарифный разряд
Задача. Определить параметры генеральной совокупности ( средний разряд, дисперсию и долю рабочих с тарифным разрядом, равным 4) по результатам проведения простой случайной повторной выборки объемом 2 единицы ( n = 2 ).
В данном примере с одинаковой степенью вероятности могла бы появиться любая из 16 возможных комбинаций единиц, то есть любая из 16 возможных выборок. Результаты 16 выборок приведены в табл. 1
Таблица 1
Номер выборки |
Номера единиц, входящих в выборку |
Значения признака по данным выборки |
Выборочная средняя |
Отклонение выборочной средней от генеральной средней |
Выбо- рочная доля |
1 |
1; 1 |
3; 3 |
3,0 |
-1,0 |
0,0 |
2 |
1; 2 |
3; 4 |
3,5 |
-0,5 |
0,5 |
3 |
1; 3 |
3; 4 |
3,5 |
-0,5 |
0,5 |
4 |
1; 4 |
3; 5 |
4,0 |
0,0 |
0,0 |
5 |
2; 1 |
4; 3 |
3,5 |
-0,5 |
0,5 |
6 |
2; 2 |
4; 4 |
4,0 |
0,0 |
1,0 |
7 |
2; 3 |
4; 4 |
4,0 |
0,0 |
1,0 |
8 |
2; 4 |
4; 5 |
4,5 |
+0,5 |
0,5 |
9 |
3; 1 |
4; 3 |
3,5 |
-0,5 |
0,5 |
10 |
3; 2 |
4; 4 |
4,0 |
0,0 |
1,0 |
11 |
3; 3 |
4; 4 |
4,0 |
0,0 |
1,0 |
12 |
3; 4 |
4; 5 |
4,5 |
+0,5 |
0,5 |
13 |
4; 1 |
5; 3 |
4,0 |
0,0 |
0,0 |
14 |
4; 2 |
5; 4 |
4,5 |
+0,5 |
0,5 |
15 |
4; 3 |
5; 4 |
4,5 |
+0,5 |
0,5 |
16 |
4; 4 |
5; 5 |
5,0 |
+1,0 |
0,0 |
Возможные варианты значений выборочных средних и отклонения их от генеральной средней представлены в виде ряда распределения (табл.2)
Таблица 2
Выборочные средние разряды рабочих |
Число выборок с данной выборочной средней f>j> |
Отклонение выборочной средней от генеральной средней |
Вероятность появления данного значения выборочной средней (или величины отклонения выборочной средней от генеральной) |
3,0 |
1 |
-1,0 |
0,0625 |
3,5 |
4 |
-0,5 |
0,2500 |
4,0 |
6 |
0,0 |
0,3750 |
4,5 |
4 |
+0,5 |
0,2500 |
5,0 |
1 |
+1,0 |
0,0625 |
Итого |
16 |
1,0000 |
В распределении величин выборочных средних и их отклонений наблюдаются определенные закономерности.
1. Из возможных результатов случайной повторной выборки наиболее вероятны такие, при которых величина выборочной средней будет близка к величине генеральной средней. Таким образом, чем больше величина случайной ошибки выборки, тем менее вероятно появление такой ошибки.
2. В примере не встречаются ошибки больше единицы по абсолютной величине, т.е. всегда существует предел расхождений между выборочной и генеральной средней.
По данным табл.2, где представлены все возможные варианты выборочных средних и их отклонения от генеральной средней, определяется величина стандартной ошибки выборки
Однако на практике исследователь оперирует данными какой-то одной конкретной выборки, а поэтому указанным способом определить стандартную ошибку средней невозможно.
Среднюю ошибку можно определить по формуле, используя величину дисперсии в генеральной совокупности (в данном примере генеральная дисперсия признака равна 0,5)
Распределение выборочной доли представлено в табл.3
Таблица 3
Выборочная доля |
Число выборок с данной выборочной долей f>j> |
Отклонение выборочной доли от генеральной |
||
0,0 |
4 |
-0,5 |
0,0 |
1,0 |
0,5 |
8 |
0,0 |
4,0 |
0,0 |
1,0 |
4 |
+0,5 |
4,0 |
1,0 |
Итого |
16 |
8,0 |
2,0 |
В среднем для всех возможных вариантов выборок величина выборочной доли совпадает с долей признака в генеральной совокупности
Средняя квадратическая ошибка доли в генеральной совокупности
Среднюю квадратическую ошибку доли в генеральной совокупности можно определить, используя долю признака в генерального совокупности ( p = 0,5),
В формулы средних ошибок выборки
;
входят дисперсии признака и доли в генеральной совокупности, величины которых, как правило, при проведении выборочного наблюдения неизвестны. Поэтому для расчета средних ошибок выборки приходится использовать выборочные дисперсии в качестве оценки генеральной совокупности.
4.4. Объем выборки
Определение необходимого объема выборки n основывается на формулах предельных ошибок выборочной доли и выборочной средней. Например, для повторного отбора предельные ошибки равны
отсюда объемы выборок для расчета выборочной доли n>w> и выборочной средней n>x>> > следующие:
Аналогичным образом определяются объемы выборок при различных способах отбора выборочной совокупности. Для серийного отбора определяется число отобранных серий. Формулы расчета приведены в табл.4.3.
Таблица 4.3
Формулы расчета объема выборки
Метод отбора выборки |
Объем выборки или число серий для определения |
|
выборочной доли |
выборочной средней |
|
Механический и собственно–случайный повторный отбор |
||
Механический и собственно–случайный бесповторный отбор |
||
Серийный отбор при повторном отборе равновеликих серий |
||
Серийный отбор при бесповторном отборе равновеликих серий |
||
Типический отбор при повторном случайном отборе внутри групп, пропорциональном объему групп |
||
Типический отбор при бесповторном случайном отборе внутри групп, пропорциональ-ном объему групп |
где n>w>, n>x> – объемы выборок соответственно для определения ошибок выборочной доли и выборочной средней;
r>w>, r>x>> > – число отобранных серий соответственно для определения ошибок выборочной доли и выборочной средней;
– предельные ошибки соответственно выборочной доли и выборочной средней.
Вариация () признака существует объективно, независимо от исследователя, но к началу выборочного наблюдения она неизвестна. Для приближенной оценки используются следующие способы:
- дисперсия определяется на основе результатов проведения "пробного" обследования (обычно небольшого объема). По данным нескольких пробных обследований выбирается наибольшее значение дисперсии;
- дисперсия принимается из предыдущих исследований;
- по правилу "трех сигм" общий размах вариации Н укладывается в 6 сигм, среднее квадратическое отклонение принимается равным
Для большей точности размах делится на 5;
- если хотя бы приблизительно известна средняя величина изучаемого признака, то
- при изучении альтернативного признака (изучении доли), если нет даже приблизительных сведений о доле единиц, обладающих заданным значением этого признака, принимается максимально возможная величина дисперсии, равная 0,25.
В связи с тем, что генеральная дисперсия оценивается приближенно, рекомендуется рассчитанный объем выборки округлять в большую сторону.
Часто на практике задается не величина абсолютной предельной ошибки , а величина относительной погрешности , выраженная в процентах к средней величине
откуда
В этом случае объем выборки
Если известен коэффициент вариации то объем выборки
Например, по данным пробного обследования коэффициент вариации составляет 40%. Сколько необходимо отобрать единиц, чтобы с вероятностью 0,954 предельная относительная ошибка выборки не превышала 5%?
При
При серийном или типическом отборе, не пропорциональном объему групп, общее число отбираемых единиц делится на количество групп. Полученная величина является объемом выборки из каждой группы.
При отборе, пропорциональном числу единиц в группе, число наблюдений по каждой группе определяется по формуле
где n>j >- объем выборки из j -й группы;
n> >- общий объем выборки;
N>j >- объем j -й группы;
N> >- объем генеральной совокупности.
При отборе с учетом вариации признака, приводящем к минимальной ошибке выборки, процент выборки из каждой типической группы должен быть пропорционален среднему квадратическому отклонению в этой группе. Расчет численности выборки производится по формулам:
для средней
для доли
4.5. Малая выборка
Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 20–30 и может составлять 5–6. С увеличением численности выборочной совокупности повышается точность выборочных данных, однако приходится иногда ограничиваться малым числом наблюдений. Эта необходимость возникает, например, при проверке качества продукции, связанной с уничтожением проверяемой единицы продукции. В математической статистике доказывается, что при малых выборках характеристики выборочной совокупности можно распространять на генеральную, но расчет средней и предельной ошибок выборки имеет особенности.
Ранее указывалось, что при большом объеме выборочной совокупности (n > 100) коэффициент , на который необходимо умножить выборочную дисперсию, чтобы получить генеральную, не играет большой роли. Но когда выборочная совокупность небольшая, этот коэффициент необходимо принимать во внимание. Средняя ошибка малой выборки ( ) вычисляется по формуле
где – дисперсия в малой выборке, которая определяется следующим образом:
Предельная ошибка имеет вид
Значение коэффициента доверия зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n . Английский ученый Стьюдент доказал, что в случаях малой выборки действует особый закон распределения вероятности. В табл.4.4 приводятся значения, характеризующие вероятность () того, что предельная ошибка малой выборки не превысит –кратную среднюю ошибку:
Таблица 4.4
Распределение вероятности в малых выборках в зависимости
от значения коэффициента и численности выборки
|
n |
||||||
5 |
7 |
10 |
12 |
16 |
18 |
20 |
|
1,0 1,5 2,0 2,5 3,0 |
0,626 0,792 0,884 0,933 0,960 |
0,644 0,816 0,908 0,953 0,976 |
0,657 0,832 0,923 0,966 0,985 |
0,662 0,838 0,930 0,970 0,988 |
0,666 0,846 0,936 0,975 0,991 |
0,668 0,848 0,938 0,977 0,992 |
0,670 0,850 0,940 0,978 0,993 |
Статистическая проверка гипотез
Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики:
Учебник. М.: ИНФРА-М, 1998. - 416 с. (стр.182-203)
1. Выбор критической области. Критерии согласия.
2. Проверка гипотезы о принадлежности "выделяющихся" наблюдений исследуемой генеральной совокупности.
3. Проверка гипотезы о величине средней арифметической и доли.
4. Проверка гипотезы о расхождении двух выборочных дисперсий (дисперсионный анализ).
ЛИТЕРАТУРА
1. Богородская Н.А. Статистика. Методы анализа статистической
информации: Текст лекций. СПб.: СПГААП. - 1997. - 80 с.
2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики:
Учебник. М.: ИНФРА-М, 1998. - 416 с.
3. Статистика: Курс лекций /Харченко Л.П., Долженкова В.Г., Ионин В.Г. и
др.; Под ред. В.Г.Ионина. - Новосибирск: Изд-во НГАЭиУ, 1996. - 310 с.
4. Общая теория статистики: Статистическая методология в изучении
коммерческой деятельности. Учебник /А.И.Харламов, О.Э.Башина,
В.Т.Бабурин и др.; Под ред.А.А.Спирина, О.Э.Башиной. М.: Финансы
статистика, 1994. - 296 с.
5. Гусаров В.М. Теория статистики. - М.: Аудит, 1998. - 247 с.
6. Елисеева И.И., М.М.Юзбашев. Общая теория статистики. - М.: Финансы и
статистика, 1998. - 367 с.
7. Теория статистики. Учебник/Под ред.Р.А.Шмойловой. - М.: Финансы и
статистика, 1998. - 576 с.
8. Ряузов Н.Н. Общая теория статистики: Учебник для студентов экономич.
спец. вузов. -4-е изд., перераб. и дополн. М.: Финансы и статистика, 1984.
- 343 с.
9. Общая теория статистики / Под ред.Гольберга А.М., Козлова В.С. - М.:
Финансы и статистика, 1986. - 367 с.
10. Общая теория статистики / Под ред.Боярского А.Я., Громыко Г.Л.. М.:
Изд-во МГУ, 1985. - 326 с.
11. Практикум по теории статистики: Учебное пособие./ Под ред.
Р.А.Шмойловой. - М.: Финансы и статистика, 1998. 416 с.
12. Сборник задач по общей теории статистики: Учебное пособие для
студентов вузов, обучающихся по специальности “Статистика” /
Овсиенко В.Е., Голованова Н.В., Королев Ю.Г. и др., -2-е изд., перераб. и
дополн. М.: Финансы и статистика, 1986. - 191 с.
13. Практикум по общей теории статистики /Под ред. Ряузова Н.Н. - 2-е изд.,
перераб.и дополн. М.: Финансы и статистика, 1981. - 278 с.
14. Вайнберг Дж., Шумекер Дж. Статистика. М.: Статистика, 1979. 389 с.
15. Венецкий И.Г., Венецкая В.И. Основные математико–статистические понятия и формулы в экономическом анализе. М.: Статистика, 1974. 278 с.
16. Кейн Э. Экономическая статистика и эконометрия. М.: Статистика, 1977. 229 с.
Приложение
Таблица случайных чисел
5489 |
5583 |
3156 |
0835 |
1988 |
3912 |
0938 |
7460 |
0869 |
4420 |
3522 |
0935 |
7877 |
5665 |
7020 |
9555 |
7375 |
7124 |
7878 |
5544 |
7555 |
7579 |
2550 |
2487 |
9477 |
0864 |
2349 |
1012 |
8250 |
2633 |
5759 |
3554 |
5080 |
9074 |
7001 |
6249 |
3224 |
6368 |
9102 |
2672 |
6303 |
6895 |
3371 |
3196 |
7231 |
2918 |
7380 |
0438 |
7547 |
2644 |
7351 |
5634 |
5323 |
2623 |
7803 |
8374 |
2191 |
0464 |
0696 |
9529 |
7068 |
7803 |
8832 |
5119 |
6350 |
0120 |
5026 |
3684 |
5657 |
0304 |
3613 |
1428 |
1796 |
8447 |
0503 |
5654 |
3254 |
7336 |
9536 |
19441 |
5143 |
4534 |
2105 |
0368 |
7890 |
2473 |
4240 |
8652 |
9435 |
. 1422 |
9815 |
5144 |
7649 |
8638 |
6137 |
8070 |
5345 |
4865 |
2456 |
5708 |
5780 |
1277 |
6816 |
1013 |
2867 |
9938 |
3930 |
3203 |
5696 |
1769 |
1187" |
0951 |
5991 |
5245 |
5700 |
5564 |
7352 |
0891 |
6249 |
6568; |
4184 |
2179 |
4554 |
9083 |
2254 |
2435 |
2965 |
5154 |
1209 |
7069 |
2916 |
2972 |
9885 |
0275 |
0144 |
8034 |
8122 |
3213 |
7666 |
0230 |
5524 |
1341 |
9860 |
6565 |
6981 |
9842 |
0171 |
2284 |
2707 |
3008 |
0146 |
5291 |
2354 |
5694 |
0377 |
5336 |
6460 |
9585 |
3415 |
2358 |
4920 |
2826 |
5238 |
5402 |
7937 |
1993 |
4332 |
2327 |
6875 |
5230 |
7978 |
1947 |
, 6380 |
3425 |
7267 |
7285 |
1130 |
7722 |
0164 |
8573 |
7453 |
0653 |
3645 |
7497 |
5969 |
8682 |
4191 |
2976 |
0361 |
9334 |
1473 |
6938 |
4899 |
5348 |
1641 |
3652 |
0852 |
5296 |
4538 |
4456 |
8162 |
8797 |
8000 |
4707 |
1880 |
9660 |
8446 |
1883 |
9768 |
0881 |
5645 |
4219 |
0807 |
3301 |
4279 |
4168 |
4305 |
9937 |
3120 |
5547 |
2042 |
1192 |
1175 |
8851 |
6432 |
4635 |
5757 |
6656 |
1660 |
5389 |
5470 |
7702 |
6958 |
9080 |
5925 |
8519 |
0127 |
9233 |
2452 |
7341 |
4045 |
1730 |
6005 |
1704 |
0345 |
3275 |
4738 |
4862 |
2556 |
8333 |
5880 |
1257 |
6163 |
4439 |
7276 |
6353 |
6912 |
0731 |
9033 |
5294 |
9083 |
4260 |
5277 |
4998 |
4298 |
5204 |
3965, |
4028 |
8936 |
5148 |
1762 |
8713 |
1189 |
1090 |
8989 |
7273 |
3213 |
1935 |
9321 |
4820 |
2023 |
2589 |
1740 |
0424 |
8924 |
0005 |
1969 |
1636 |
7237 |
1227 |
7965 |
3855 |
4765 |
0703 |
1678 |
0841 |
7543 |
0308 |
9732 |
1289 |
7690 |
0480 |
8098 |
9629 |
4819 |
7219 |
7241 |
5128 |
3853 |
1921 |
9292 |
0426 |
9573 |
4903 |
5916 |
6576 |
8368 |
3270 |
6641 |
0033 |
0867 |
1656 |
7016 |
4220 |
2533 |
6345 |
8227 |
1904 |
5138 |
2537 |
0505 |
2127 |
8255 |
5276 |
2233 |
3956 |
4118 |
8199 |
6380 |
6340 |
6295 |
9795 |
1112 |
5761 |
2575 |
6837 |
3336 |
9322 |
7403 |
8345 |
6323 |
2615 |
3410 |
3365' |
1117 |
2417 |
3176 |
2434 |
5240 |
5455 |
8672 |
8536 |
2966 |
5773 |
5412 |
8114 |
0930 |
4697 |
6919 |
4569 |
1422 |
5507 |
7596 |
0670 |
3013 |
1351 |
3886 |
3268 |
9469 |
2584 |
2653 |
1472 |
5113 |
5735 |
1469 |
9545 |
9331 |
5303 |
9914 |
6394 |
0438 |
4376 |
3328 |
8649 |
8327 |
0110 |
4549 |
7955 |
5275 |
2890 |
2851 |
2157 |
0047 |
7085 |
1129 |
0460 |
6821 |
8323 |
2572 |
8962 |
7962 |
2753 |
3077 |
8718 |
7418 |
8004 |
1425 |
3706 |
8822 |
1494 |
3837 |
4098 |
0220 |
1217 |
4732 |
0150 |
1637 |
1097 |
1040 |
7372 |
8542 |
4126 |
9274 |
2251 |
0607 |
4301 |
8730 |
7690 |
6235 |
3477 |
0139 |
0765 |
8039 |
9484 |
2577 |
7859 |
1976 |
0623 |
1418 |
6685 |
6687 |
1943 |
4307 |
0579 |
8171 |
8224 |
8641 |
7034 |
3595 |
3875 |
6242 |
5582 |
5872 |
3197 |
4919 |
2792 |
5991 |
4058 |
9769 |
1918 |
6859 |
9606 |
0522 |
4993 |
0345 |
8958 |
1289 |
8825 |
6941 |
7685 |
6590 |
1932 |
6043 |
3623 |
1973 |
4112 |
1795 |
8465 |
2110 |
8045 |
3482 |
0478 |
0221 |
6738 |
7323 |
5643 |
4767 |
0106 |
2272 |
9862 |
МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Санкт-Петербургский государственный университет
аэрокосмического приборостроения
СТАТИСТИКА
Выборочные наблюдения
Методические указания к практическим занятиям
Санкт-Петербург
1999
Составитель Н.А. Богородская
Рецензент кандидат экономических наук доцент Л.Г.Фетисова
Методические указания к практическим занятиям предназначены для студентов, изучающих дисциплину "Статистика", обучающихся по направлению и специальности 521500 и 061100 "Менеджмент" и по экономическим специальностям и направлениям 071900, 060400, 060500, 522300 всех форм обучения.
В работе приведены методические указания к решению задач по теме "Выборочные наблюдения" и рассмотрены примеры решения задач для различных видов отбора: механического, собственно-случайного, серийного и типического при повторной и бесповторной выборке единиц из статистической совокупности.
С Санкт-Петербургский
государственный университет
аэрокосмического
приборостроения, 1999
Лицензия ЛР №020341 от 07.05.97
Подписано к печати Формат 60´84 1/16 Бумага тип. № 3.
Печать офсетная. Усл.печ.л. 1,86 Уч.-изд.л. 2,0 Тираж 100 экз. Заказ №
Редакционно-издательский отдел
Отдел оперативной полиграфии
СПбГУАП
190000, Санкт-Петербург, ул. Б. Морская, 67
1. МЕТОДИЧЕСКИЕ УКАЗАНИЯ К РЕШЕНИЮ ЗАДАЧ ПО ТЕМЕ "ВЫБОРОЧНЫЕ НАБЛЮДЕНИЯ"
1.1. Выборочное исследование
При статистическом исследовании экономических явлений могут применяться выборочные наблюдения, при которых характеристики генеральной совокупности получаются на основании изучения части генеральной совокупности, называемой выборочной совокупностью или выборкой.
Выборочное наблюдение (выборочное исследование) заключается в обследовании определенного числа единиц совокупности, отобранного, как правило, случайным образом. При выборочном методе обследованию подлежит сравнительно небольшая часть всей изучаемой совокупности (обычно до 5–10%, реже до 15–20%). Отбор единиц из генеральной совокупности производится таким образом, чтобы выборочная совокупность была представительна
(репрезентативна) и характеризовала генеральную совокупность. Степень представительности выборки зависит от способа организации выборки и от ее объема. Полной репрезентативности выборки достичь не удается. Поэтому необходима оценка надежности результатов выборки и возможности их распространения на генеральную совокупность.
В основе теории выборочного наблюдения лежат теоремы законов больших чисел, которые позволяют решить два взаимосвязанных вопроса выборки: рассчитать ее объем при заданной точности исследования и определить ошибку при данном объеме выборки.
При использовании выборочного метода обычно используются два вида обобщающих показателей: относительную величину альтернативного признака и среднюю величину количественного признака.
Относительная величина альтернативного признака характеризует долю (удельный вес) единиц в статистической совокупности, обладающих изучаемым признаком. В генеральной совокупности эта доля единиц называется генеральной долей (p), а в выборочной совокупности – выборочной долей (w).
Средняя величина количественного признака в генеральной совокупности называется генеральной средней ( ), а в выборочной совокупности – выборочной средней ().
1.2. Виды отбора при выборочном наблюдении
Процесс образования выборки называется отбором, который осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности.
Существуют различные способы отбора: индивидуальный, групповой (серийный), комбинированный, повторный (возвратный), бесповторный (безвозвратный), одноступенчатый, многоступенчатый, собственно-случай-ный, механический и типический отбор.
При индивидуальном отборе в выборку отбираются отдельные единицы совокупности. Отбор повторяется столько раз, сколько необходимо отобрать единиц.
Групповой (серийный) отбор заключается в отборе серий (например, отбор изделий для проверки их целыми партиями). Если обследованию подвергаются все единицы отобранных серий, отбор называется серийным, а если обследуется только часть единиц каждой серии, отбираемых в индивидуальным порядке из серии, то – комбинированным.
Если в процессе отбора отобранная единица не исключается из совокупности, т.е. возвращается в совокупность, и может быть повторно отобранной, то такой отбор называется повторным или возвратным, в противном случае – бесповторным или безвозвратным. Серийный отбор, как правило, безвозвратный.
При одноступенчатом отбираются единицы совокупности (или серии) непосредственно для наблюдения. При многоступенчатом отбираются сначала крупные серии единиц (первая ступень отбора), наблюдению они не подвергаются. Затем из них отбираются серии, меньшие по численности единиц (вторая ступень), наблюдению не подвергаются, и так до тех пор, пока не будут отобраны те единицы совокупности (серии), которые будут подвергнуты наблюдению.
Собственно-случайный отбор состоит в отборе единиц (серий) из всей генеральной совокупности в целом посредством жеребьевки или на основании таблиц случайных чисел.
Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц (серий) устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы (серии). Например, в простейшем случае, при 10%–м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица № 1, то следующими отбираются 11–я, 21–я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их “рангов”, т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.
При типическом отборе генеральная совокупность разбивается на типические группы единиц по какому–либо признаку, а затем из каждой из них производится механический или собственно-случайный отбор. Отбор единиц из типов производится тремя методами: пропорционально численности единиц типических групп, непропорционально численности единиц типических групп и пропорционально колеблемости в группах.
1.3. Ошибки выборочного отбора
Расхождение между значениями изучаемого признака выборочной и генеральной совокупностей является ошибкой репрезентативности (представи–тельности). Она может быть случайной и систематической. Случайная возникает в силу того, что выборочное статистическое наблюдение является несплошным наблюдением, и выборка недостаточно точно воспроизводит (репрезентирует) генеральную совокупность. При определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней.
1.3.1. Ошибка выборочной доли
Выборочная доля представляет собой отношение числа единиц, обладающих данным признаком или данным его значением ( m ), к общему числу единиц выборочной совокупности ( n )
(Эту статистическую характеристику не следует путать с долей выборки, являющейся отношением числа единиц выборочной совокупности к числу единиц генеральной совокупности).
Ошибка выборочной доли представляет собой расхождение (разность) между долей в выборочной совокупности ( w ) и долей в генеральной совокупности ( p ), возникающее вследствие несплошного характера наблюдения. Величина ошибки выборочной доли определяется как предел отклонения w от p , гарантируемый с заданной вероятностью:
где – гарантийный коэффициент, зависящий от вероятности , с которой гарантируется невыход разности w –p за пределы ; – средняя ошибка выборочной доли.
Значения гарантийного коэффициента и соответствующие им вероятности приведены в табл.1.1. Обычно вероятность принимается равной 0,9545 или 0,9973, а при этом равно соответственно 2 и 3.
Значения средней ошибки выборки определяются по формуле
где – дисперсия в генеральной совокупности.
Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:
где – дисперсия в выборке.
Таблица 1.1
Значения гарантийного коэффициента
1,00 1,10 1,20 1,30 1,40 1,50 1,60 |
0,6827 0,7287 0,7699 0,8064 0,8385 0,8664 0,8904 |
1,70 1,80 1,90 2,00 2,10 2,20 2,30 |
0,9109 0,9281 0,9426 0,9545 0,9643 0,9722 0,9786 |
2,40 2,50 2,60 2,70 2,80 2,90 3,00 |
0,9836 0,9876 0,9907 0,9931 0,9949 0,9963 0,9973 |
Если n достаточно велико, то близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.
Средняя ошибка выборочной доли определяется по формуле
где – дисперсия выборочной доли.
Для показателя доли альтернативного признака (выборочной доли) дисперсия определяется по формуле
Приведенная формула средней ошибки выборочной доли применяется при повторном отборе.
При бесповторном отборе численность генеральной совокупности сокращается, поэтому дисперсия умножается на коэффициент Формулы расчета средних ошибок выборочной доли для различных способов отбора единиц из генеральной совокупности приведены в табл. 1.2.
Таблица 1.2
Формулы расчета средних ошибок выборочной доли
и выборочной средней
Метод отбора выборки |
Средняя ошибка |
|
выборочной доли |
выборочной средней |
|
Механический и собственно–случайный повторный |
||
Механический и собственно–случайный бесповторный
|
||
Серийный при бесповторном отборе серий |
||
Типический при повторном случайном отборе внутри групп |
||
Типический при бесповторном случайном отборе внутри групп |
где N – численность генеральной совокупности;
– межсерийная дисперсия выборочной доли;
r – число отобранных серий;
R – число серий в генеральной совокупности;
– средняя из групповых дисперсий выборочной доли;
– дисперсия признака x ;
– межсерийная дисперсия выборочных средних;
– средняя из групповых дисперсий выборочной средней.
Дисперсии в формулах расчета средних ошибок выборочной доли в табл.1.2 определяется следующим образом:
– межсерийная дисперсия выборочной доли
где w>j>> > – выборочная доля в j -й серии;
– средняя величина доли во всех сериях;
– средняя из групповых дисперсий
где w>j>> > – выборочная доля в j -й типической группе;
n>j> – число единиц в j -й типической группе;
k – число типических групп.
Предельное значение ошибки выборочной доли определяется по следующей формуле:
Величина средней ошибки выборочной доли зависит от доли изучаемого признака в генеральной совокупности, числа наблюдений и способа отбора единиц из генеральной совокупности для наблюдения, а величина предельной ошибки зависит еще и от величины вероятности , с которой гарантируются результаты выборочного наблюдения.
Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Доля альтернативного признака в генеральной совокупности равна
1.3.2. Ошибка выборочной средней
Ошибка выборочной средней представляет собой расхождение (разность) между выборочной средней и генеральной средней , возникающее вследствие несплошного выборочного характера наблюдения. Величина ошибки выборочной средней определяется как предел отклонения от , гарантируемый с заданной вероятностью:
где – средняя ошибка выборочной средней.
При повторном отборе средняя ошибка определяется следующим образом:
где – средняя величина дисперсии количественного признака , которая рассчитывается по формуле средней арифметической невзвешенной
или средней арифметической взвешенной
где f>i> – статистический вес.
Формулы расчета средней ошибки выборочной средней для различных способов отбора выборочной совокупности приведены в табл.1.2.
Межсерийная дисперсия выборочных средних и средняя из выборочных дисперсий типических групп вычисляются следующим образом:
где – среднее значение показателя в j - й серии;
– дисперсия признака x в j - й типической группе;
n>j> – число единиц в j - й типической группе.
Предельная ошибка выражается следующим образом:
и зависит от вариации изучаемого признака в генеральной совокупности, объема и доли выборки, способа отбора единиц из генеральной совокупности и от величины вероятности, с которой гарантируются результаты выборочного наблюдения.
Средняя величина количественного признака в генеральной совокупности определяется с учетом предельной ошибки выборочной средней
4.4. Объем выборки
Определение необходимого объема выборки n основывается на формулах предельных ошибок выборочной доли и выборочной средней. Например, для повторного отбора предельные ошибки равны
отсюда объемы выборок для расчета выборочной доли n>w> и выборочной средней n>x>> > следующие:
Аналогичным образом определяются объемы выборок при различных способах отбора выборочной совокупности. Для серийного отбора определяется число отобранных серий. Формулы расчета приведены в табл.1.3.
Таблица 1.3
Формулы расчета объема выборки
Метод отбора выборки |
Объем выборки или число серий для определения |
|
выборочной доли |
выборочной средней |
|
Механический и собственно–случайный повторный |
||
Механический и собственно–случайный бесповторный |
||
Серийный при бесповторном отборе серий |
||
Типический при повторном случайном отборе внутри групп |
||
Типический при бесповторном случайном отборе внутри групп |
где n>w>, n>x> – объемы выборок соответственно для определения ошибок выборочной доли и выборочной средней;
r>w>, r>x>> > – число отобранных серий соответственно для определения ошибок выборочной доли и выборочной средней;
– предельные ошибки соответственно выборочной доли и выборочной средней.
2. ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ
2.1. Механический и собственно-случайный отбор
Задача 1. В районе А проживает 2500 семей. Для проведения обследования выбрано 50 семей методом механического (или собственно-случайного) бесповторного отбора. В результате обследования получены следующие данные о количестве детей в семье:
Таблица 2.1
Число детей в семье |
0 |
1 |
2 |
3 |
4 |
5 |
Количество семей |
10 |
20 |
12 |
4 |
2 |
2 |
Определить среднюю ошибку выборочной средней количества детей в семье и с вероятностью 0,997 пределы, в которых находится среднее количество детей в семье в районе А.
Решение.
Средняя ошибка выборочной средней определяется по следующей формуле (см.табл.1.2):
,
где n - численность выборки;
N - численность генеральной совокупности;
- дисперсия признака x .
Дисперсия определяется по формуле
, а среднее выборочное значение
Расчет среднего и дисперсии числа детей в семье в выборочной совокупности приведены в табл.2.2.
Таблица 2.2
Число детей в семье |
Количество семей |
||||
0 1 2 3 4 5 |
10 20 12 4 2 2 |
0 20 24 12 8 10 |
-1,48 -0,48 +0,52 +1,52 +2,52 +3,52 |
-14,8 - 9,6 +6,24 +6,08 +5,04 +7,04 |
21,9040 4,6080 3,2448 9,2416 12,7008 24,7808 |
Итого |
50 |
74 |
- |
0 |
76,4800 |
Среднее число детей в семье
чел.
Дисперсия числа детей в семье
Средняя ошибка числа детей в выборке составит
чел.
Значению вероятности 0,997 соответствует значение гарантийного коэффициента Тогда предельная ошибка выборочной средней
чел.
Значение генеральной средней определяется
Пределы, в которых находится среднее число детей в семье в районе А:
С вероятностью 0,997 можно утверждать, что число детей в семьях района А колеблется от 0,99 до 2,01 человека ( от 1 до 2 человек).
Задача 2. Методом собственно-случайного (или механического) повторного отбора было взято для проверки на вес 200 штук деталей. В результате проверки был установлен средний вес деталей 30 г при среднем квадратическом отклонении 4 г.
С вероятностью 0,954 определить пределы, в которых находится средний вес деталей в генеральной совокупности.
Решение.
Средняя ошибка среднего веса деталей в выборке (выборочной средней)
Предельная ошибка выборочной средней с вероятностью 0,954 (гарантийный коэффициент) составит
Верхняя граница генеральной средней
Нижняя граница генеральной средней
С вероятностью 0,954 можно утверждать, что средний вес детали колеблется в пределах
Задача 3. Методом собственно-случайного (или механического) бесповторного отбора из общей численности работников предприятия (5 тыс.чел.) было отобрано 500 работников. Установлено, что 20% работников в выборке старше 60 лет.
Определить с вероятностью 0,683 пределы, в которых находится доля работников предприятия в возрасте старше 60 лет.
Решение.
Средняя ошибка выборочной доли работников старше 60 лет определяется следующим образом (см.табл.1.2)
С вероятностью 0,683 (гарантийный коэффициент) предельная ошибка выборочной доли работников старше 60-ти лет составит
Верхняя граница генеральной доли
Нижняя граница генеральной доли
С вероятностью 0,683 можно утверждать, что доля работников в возрасте старше 60 лет на предприятии колеблется от 18,3% до 21,7%.
Задача 4. При обследовании 100 изделий, отобранных из партии методом механического (или собственно-случайного) повторного отбора, 10 изделий оказались дефектными.
Определить с вероятностью 0,866 пределы, в которых находится доля дефектных изделий в партии.
Решение.
Для дефектной продукции в выборочной совокупности
Средняя ошибка выборочной доли дефектных изделий равна (см.табл.1.2)
Предельная ошибка выборочной доли с вероятностью 0.866 (гарантийный коэффициент) составит
С вероятностью 0,866 можно утверждать, что доля дефектной продукции в партии колеблется от 5,5% до 14,5%.
Задача 5. В районе А проживает 2000 семей. Предполагается определить средний размер семьи в районе по выборке, взятой методом механического (или собственно-случайного) бесповторного отбора. При этом с вероятностью 0,997 ошибка среднего размера семьи в выборке (выборочной средней) не должна превышать 0,8 человека при среднем квадратическом отклонении в размере семьи 2 человека.
Определить необходимую численность выборки для определения среднего размера семьи в районе.
Решение.
Необходимая численность выборки (см.табл.1.3) при вероятности 0,997 (гарантийный коэффициент) определяется следующим образом:
семей.
Проверка. Средняя ошибка среднего размера семьи составляет
чел.
Предельная ошибка выборочной средней при вероятности 0,997 ()
чел. не превышает заданной ошибки 0,8 чел.
Задача 6. Для определения средней длины детали необходимо провести выборочное обследование методом случайного (или механического) повторного отбора.
Определить, какое количество деталей необходимо отобрать (числен-ность выборки), чтобы ошибка выборки (ошибка выборочной средней) не превышала 2 мм с вероятностью 0,988 при среднем квадратическом отклонении 8 мм.
Решение.
Необходимая численность выборки в случае повторного собственно-случайного (или механического) отбора (см.табл.1.3) при вероятности 0,997 (гарантийный коэффициент) определяется следующим образом:
деталей.
Проверка. Средняя ошибка средней длины детали составляет
мм.
Предельная ошибка выборочной средней при вероятности 0,988 () составляет мм, что соответствует условию задачи.
Задача 7. В городе А имеется 10 тыс.семей. С использованием метода выборочных наблюдений предполагается определить долю семей с числом детей три и более.
Определить численность выборки, чтобы при механическом (или собственно-случайном) отборе с вероятностью 0,954 ошибка выборки (доли семей с числом детей три и более) не превышала 0,02, если на основе предыдущих обследований известно, что дисперсия равна 0,2.
Решение.
Необходимая численность выборки для определения доли семей с числом детей три и более (см.табл.1.3) при вероятности 0,954 (гарантийный коэффициент) определяется
для бесповторного отбора
семей;
для повторного отбора
семей.
Задача 8. Для изучения оснащения 500 предприятий основными производственными фондами было проведено 10%-е выборочное обследование методом собственно-случайного (или механического) отбора, в результате которого получены следующие данные о распределении предприятий по стоимости основных производственных фондов:
Таблица 2.3
Среднегодовая стоимость основных производственных фондов, млн р. |
До 20 |
20-40 |
40-60 |
Свыше 60 |
Итого: |
Число предприятий |
5 |
12 |
23 |
10 |
50 |
Определить:
- с вероятностью 0,997 предельную ошибку выборочной средней и границы, в которых будет находиться среднегодовая стоимость основных производственных фондов всех предприятий генеральной совокупности;
- с вероятностью 0,954 предельную ошибку выборки при определении доли и границы, в которых будет находиться удельный вес предприятий со стоимостью основных производственных фондов свыше 40 млн р.;
- объемы выборочной совокупности при условии, что:
предельная ошибка выборки при определении среднегодовой стоимости основных производственных фондов с вероятностью 0,997 была бы не более 5 млн р.;
предельная ошибка доли предприятий со стоимостью основных производственных фондов свыше 40 млн р. с вероятностью 0,954 была бы не более 15%.
Решение.
Для определения границ генеральной средней необходимо вычислить среднюю выборочную и дисперсию , расчет которых приведен в табл.2.3.
Тогда
млн р.;
Таблица 2.4
Среднегодовая стоимость основных производственных фондов, млн р. |
Число пред-прия-тий |
Сере-дина интер-вала, млн р. |
||||
До 20 20 - 40 40 - 60 Свыше 60 |
5 12 23 10 |
10 30 50 70 |
50 360 1150 700 |
-35,2 -15,2 4,8 24,8 |
-176,0 -182,4 110,4 248,0 |
6195,20 2772,48 529,92 6150,04 |
Итого |
50 |
- |
2260 |
- |
0 |
15647,64 |
Для упрощения расчета средней и дисперсии можно использовать способ моментов.
При следующих исходных данных: N =500; n =50; средняя ошибка выборки при определении среднегодовой стоимости основных фондов составит:
при повторном отборе
млн р.;
при бесповторном отборе
млн.р.
При определении среднегодовой стоимости основных производственных фондов в среднем на одно предприятие в выборочной совокупности средняя ошибка выборки (ошибка репрезентативности) при повторном отборе составляет 2,5 млн р., при бесповторном - 2,37.
Предельная ошибка выборочной средней с вероятностью 0,997 (гарантийный коэффициент) составит
при повторном отборе
млн р.
при бесповторном отборе
млн р.
Значение генеральной средней определяется
Пределы, в которых находится среднее число детей в семье в районе А:
Среднегодовая стоимость основных производственных фондов в среднем на одно предприятие генеральной совокупности находится в следующих пределах:
при повторном отборе
млн.р или ;
при бесповторном отборе
млн.р или .
Эти границы можно гарантировать с вероятностью 0,997.
Вычисление пределов при установлении доли осуществляется аналогично нахождению пределов для средней величины
где p - доля единиц в генеральной совокупности, обладающих данным признаком.
Доля предприятий в выборочной совокупности со среднегодовой стоимостью основных производственных фондов свыше 40 млн р. составляет
Предельная ошибка доли с вероятностью 0,954 (гарантийный коэффициент):
при повторном отборе
при бесповторном отборе
С вероятностью 0,954 доля предприятий со среднегодовой стоимостью основных производственных фондов свыше 40 млн р. в генеральной совокупности находится в пределах:
при повторном отборе
или ;
при бесповторном отборе
или
При бесповторном отборе ошибка выборки меньше, чем при тех же условиях при повторной выборке.
Объем выборки для расчета ошибки средней при N =500; n =50; ; млн р. с вероятностью 0,997 (гарантийный коэффициент)
при повторном отборе
предпр.;
при бесповторном отборе
предпр.
Объем выборки для расчета ошибки доли при N =500; n =50; ; с вероятностью 0,954 (гарантийный коэффициент)
при повторном отборе
предпр.;
при бесповторном отборе
предпр.
2.2. Серийный отбор
Задача 1. В одном из цехов предприятия в десяти бригадах работает 100 рабочих. В целях изучения квалификации рабочих была проведена 20%-я серийная бесповторная выборка, в которую вошли 2 бригады. Получено следующее распределение обследованных рабочих по разрядам:
Таблица 2.5
Номер |
Разряды рабочих |
|
рабочего |
в бригаде 1 |
в бригаде 2 |
1 2 3 4 5 6 7 8 9 10 |
2 4 5 2 5 6 5 8 4 5 |
3 6 1 5 3 4 2 1 3 2 |
Определить с вероятностью 0,997 предел, в котором находится средний разряд рабочих цеха.
Решение.
Средняя ошибка выборочной средней (см.табл.1.2) определяется по следующей формуле:
,
где – межсерийная дисперсия выборочных средних;
R – число серий в генеральной совокупности;
r – число отобранных серий.
Для определения межсерийной (межгрупповой) дисперсии выборочных средних необходимо рассчитать групповые и общую среднюю величину.
Средний разряд:
в первой бригаде
разр.
во второй бригаде
разр.
Средний разряд рабочего в двух бригадах (общая средняя)
разр.
Межсерийная (межгрупповая) дисперсия
где – среднее значение показателя в j – й серии (группе);
– среднее значение показателя во всех сериях (общая средняя).
Средняя ошибка среднего разряда рабочего в двух бригадах (выборочной средней)
разр.
Значению вероятности 0,997 соответствует значение гарантийного коэффициента Тогда предельная ошибка выборочной средней
разр.
С вероятностью 0,997 можно утверждать, что средний разряд рабочих цеха находится в пределах
Задача 2. Детали упакованы в 200 ящиков по 40 деталей в каждый. Для проверки качества деталей был проведен сплошной контроль деталей в 20 ящиках (10%-й серийный бесповторный отбор). В результате контроля установлено, что доля бракованных деталей составляет 15%. Межсерийная дисперсия равна 0,002.
С вероятностью 0,954 определить пределы, в которых находится доля бракованной продукции во всей партии ящиков.
Решение.
Средняя ошибка выборочной доли (см.табл.1.2)
где – межсерийная дисперсия выборочной доли.
Предельная ошибка выборочной доли (доли бракованных деталей в выборке) с вероятностью 0,954 (гарантийный коэффициент) составит
С вероятностью 0,954 можно утверждать, что доля дефектной продукции в партии (в 200 ящиках) находится в пределах
Задача 3. В механическом цехе предприятия имеется 10 бригад по 20 рабочих в каждой бригаде. Для установления квалификации (среднего разряда) рабочих цеха используется метод серийного бесповторного отбора.
Определить необходимое количество бригад, чтобы с вероятностью 0,997 ошибка выборки (средний разряд рабочего в цехе) не превышала одного разряда. На основе предыдущих исследований известно, что межсерийная дисперсия равна 0,9.
Решение.
С вероятностью 0,997 (гарантийный коэффициент ) численность выборочной совокупности (число отобранных бригад) определяется следующим образом (см.табл1.3):
бр.
Задача 4. На предприятии работает 200 бригад с одинаковой численностью рабочих. Для изучения доли рабочих, выполняющих норму выработки, используется метод серийного бесповторного отбора.
Определить необходимую численность выборки, чтобы с вероятностью 0,954 предельная ошибка выборки (предельная ошибка доли рабочих, выполняющих норму выработки) не превышала 5%, если межсерийная дисперсия выборочной доли равна 2,25.
Решение.
Необходимая численность выборки для изучения выборочной доли (см.табл.1.3) с вероятностью 0,954 (гарантийный коэффициент) равна
бр.
Задача 5. Для определения средней наработки до отказа 1000 приборов, распределенных на партии (серии) по 10 шт., проводится серийная 4%-я бесповторная выборка. Результаты испытаний отобранных приборов характеризуются следующими данными:
Таблица 2.6
Показатели |
Номер партии приборов |
|||
1 |
2 |
3 |
4 |
|
Средняя наработка до отказа, тыс.ч Доля приборов с наработкой до отказа не менее 12 тыс.ч |
10 0,80 |
12 0,85 |
15 0,90 |
18 0,95 |
Определить:
1) средние ошибки репрезентативности:
- наработки приборов до отказа;
- удельного веса приборов с наработкой до отказа не менее 12 тыс.ч;
2) с вероятностью 0,954 пределы, в которых будет находиться:
- средняя наработка до отказа всех приборов;
- доля приборов в генеральной совокупности, наработка до отказа которых не менее 12 тыс.ч;
3) вероятность того, что
- предельная ошибка выборки при установлении средней наработки до отказа не превысит 1,0 тыс.ч;
- доля приборов с наработкой до отказа не менее 12 тыс.ч будет находиться в пределах от 83% до 92%.
Решение.
1. При бесповторном отборе серий средняя ошибка репрезентативности определяется по формулам (см.табл.1.3) соответственно для средней и для доли
где r – число отобранных серий;
R – число серий в генеральной совокупности;
– межсерийная дисперсия выборочных средних;
– межсерийная дисперсия выборочной доли.
Средняя наработка до отказа приборов в отобранных 4 партиях
тыс. ч.
Средний удельный вес приборов с наработкой до отказа не менее 12 тыс.ч
Межсерийная дисперсия для средней и для доли определяется по формулам
Расчет приведен в табл.2.7
Таблица 2.7
Но-мер партии |
Средняя наработка до отказа, тыс.ч |
Доля приборов с наработкой до отказа не менее 12 тыс. ч, |
||||
1 2 3 4 |
10 12 15 18 |
-3,75 -1,75 1,25 4,25 |
14,06 3,06 1,56 18,06 |
0,80 0,85 0,90 0,95 |
-0,075 -0,025 0,025 0,075 |
0,005625 0,000625 0,000625 0,005625 |
0 |
36,74 |
0,012500 |
Тогда межсерийные дисперсии
Средние ошибки репрезентативности:
- при определении средней -
тыс. ч;
- при определении доли -
2. С вероятностью 0,954 (гарантийный коэффициент) предельные ошибки репрезентативности для средней и для доли:
тыс. ч;
Средняя наработка до отказа всех 1000 приборов находится в пределах
тыс. ч или
Средний удельный вес приборов с наработкой до отказа не менее
12 тыс. ч в генеральной совокупности будет находиться в пределах
или
3. Средняя ошибка средней наработки прибора до отказа при R =100;
r =4; тыс. ч; составляет тыс. ч.
Для определения вероятности того, что разница средних величин наработки до отказа в выборочной и генеральной совокупности не превысит заданную предельную ошибку тыс. ч, т. е.
тыс.ч
рассчитывается гарантийный коэффициент из следующего выражения:
В таблице значений вероятностей (см.табл 1.1) значению
соответствует вероятность 0,993.
Следовательно, с вероятностью 0,993 можно гарантировать, что средняя наработка прибора до отказа в генеральной совокупности будет находиться в пределах тыс. ч.
Средняя ошибка доли приборов с наработкой до отказа не менее 12 тыс. ч при R =100; r =4; ; составляет
Для определения вероятности того, что разница удельного веса приборов с наработкой до отказа не менее 12 тыс. ч в выборочной и генеральной совокупности не превысит заданную предельную ошибку
(83,0-87,5= -4,5%; 92,0-87,5= +4,5%), т. е.
рассчитывается гарантийный коэффициент из следующего выражения:
В таблице значений вероятностей (см.табл 1.1) значению
соответствует вероятность 0,890.
Следовательно, с вероятностью 0,890 удельный вес приборов с наработкой до отказа не менее 12 тыс. ч будет находиться в пределах
2.3. Типический отбор
Задача 1. В трех районах 30 тыс. семей. В первом районе - 15 тыс.; во втором - 12 тыс. и в третьем - 3 тыс. семей. Для определения числа детей в семье была проведена 10%-я типическая выборка с отбором единиц пропорционально численности единиц типических групп. Внутри групп применялся метод случайного бесповторного отбора. Результаты выборочного обследования семей в трех районах представлены в табл.2.8
Таблица 2.8
Номер района |
Число семей в районе |
Среднее число детей в семье |
Среднее квадратическое отклонение |
1 2 3 |
15000 12000 3000 |
1,3 1,8 0,8 |
1,2 2,5 0,5 |
С вероятностью 0,997 определить предел, в котором находится среднее число детей в семье в трех районах.
Решение.
Средняя ошибка выборочной средней при типическом бесповторном отборе (см.табл.1.2) определяется следующим образом:
где – средняя из групповых дисперсий выборочной средней;
n – численность выборочной совокупности по всем типическим группам (районам);
N> > – численность генеральной совокупности (число семей во всех
районах).
Объем выборки в каждой типической группе (районе) n>j>
где N>j > - число семей в j - м районе;
Число семей, выбранных для обследования в каждом районе при условии, что численность выборочной совокупности n по трем районам равна 3000 семей
семей;
семей;
семей.
Среднее число детей в семье по трем районам в выборочной совокупности (выборочная средняя) с учетом численности отобранных групп
чел.
Средняя из групповых дисперсий (внутригрупповая дисперсия)
Средняя ошибка выборочной средней при типической выборке (средняя ошибка среднего числа детей в семье)
чел.
Предельная ошибка средней с вероятностью 0,997 (гарантийный коэффициент) составит
чел.
С вероятностью 0,997 можно утверждать, что в трех районах среднее число детей в семье находится в пределах
Задача 2. Для выявления причин простоев была проведена фотография рабочего дня 10% рабочих четырех различных цехов. Отбор рабочих внутри цехов производился методом случайного бесповторного отбора. В результате анализа выборочных данных была выявлена доля простоев из-за несвоевременного поступления комплектующих изделий (табл.2.9)
Таблица 2.9
Номер цеха |
Число рабочих в выборке, чел. |
Удельный вес простоев из-за несвоевременного поступления комплектующих изделий, % |
1 2 3 4 |
20 36 14 30 |
5 10 15 2 |
Итого |
100 |
- |
С вероятностью 0,954 определить пределы, в которых находится доля простоев на предприятии из-за несвоевременного поступления комплектующих изделий.
Решение.
Средняя ошибка выборочной доли при типическом бесповторном отборе (см.табл.1.2) определяется следующим образом:
где – средняя из групповых дисперсий выборочной доли.
Средняя выборочная доля простоев из-за несвоевременного поступления комплектующих изделий в четырех цехах
Дисперсия выборочной доли в i -й типической группе определяется по формуле
Для первого цеха -
для второго -
для третьего -
для четвертого -
Средняя из групповых дисперсий выборочной доли
Средняя ошибка выборочной доли
Предельная ошибка выборочной доли с вероятностью 0,954 (гарантийный коэффициент)
С вероятностью 0,954 можно утверждать, что доля простоев из-за несвоевременного поступления комплектующих изделий находится в пределах
Задача 3. В трех населенных пунктах 10 тыс. семей. В первом - 5 тыс.; во втором - 1 тыс.; в третьем - 4 тыс. семей. Для определения среднего размера семьи в трех населенных пунктах проектируется типическая выборка со случайным бесповторным отбором внутри типических групп.
Определить объем выборки (количество семей), чтобы с вероятностью 0,987 ошибка выборки при определении среднего размера семьи не превышала 0,5 человека, если на основе предыдущих обследований известно, что дисперсия равна 9.
Решение.
Численность типической выборки (при вероятности 0,987 гарантийный коэффициент)
семьи.
Задача 4. Для выявления причин простоев 1000 рабочих предприятия необходимо провести типическую выборку по различным цехам.
Определить количество рабочих, которое необходимо обследовать, чтобы с вероятностью 0,997 ошибка выборки (ошибка доли) не превышала 5%, если на основе предыдущих исследований известно, что дисперсия типической выборки равна 0,16.
Решение.
Необходимая численность выборки (при вероятности 0,997 гарантийный коэффициент)
чел.
Задача 5. На предприятии работает 1000 рабочих, из них в возрасте до 30 лет - 400 человек, свыше 30 лет - 600 человек. Для изучения среднедневной выработки и установления доли мужчин проведена 10%-я типическая выборка с отбором единиц пропорционально численности рабочих по указанным группам (внутри групп применялся случайный метод отбора).
На основе обследования получены следующие данные (табл.2.10):
Таблица 2.10
Группы рабочих по возрасту, лет |
Общая числен-ность рабочих N>j> , чел. |
Число обследован-ных рабочих n>j> , чел. |
Средне-дневная выра-ботка , шт. |
Диспер-сия выработ-ки, |
Число мужчин в выборке m>j>> >, чел. |
Доля мужчин в выборке, |
До 30 лет Св. 30 |
400 600 |
40 60 |
25 30 |
81 64 |
32 54 |
0,8 0,9 |
Итого |
1000 |
100 |
- |
- |
- |
- |
Определить:
- с вероятностью 0,954 предельную ошибку выборки и границы, в которых будет находиться среднедневная выработка для всех рабочих предприятия;
- с вероятностью 0,954 пределы удельного веса мужчин в общей численности рабочих предприятия.
Решение.
Средняя ошибка выборочной средней при типическом бесповторном отборе) определяется по формуле
Средняя из групповых дисперсий (внутригрупповая дисперсия)
Средняя ошибка среднедневной выработки рабочих в выборке (средняя
ошибка выборочной средней)
шт.
Предельная ошибка средней с вероятностью 0,954 (гарантийный коэффициент) составит
шт.
Для определения возможных пределов среднедневной выработки всех рабочих предприятия рассчитывается среднедневная выработка в выборочной совокупности по средней арифметической взвешенной
шт.
С вероятностью 0,954 можно утверждать, что среднедневная выработка всех рабочих предприятия находится в пределах
Средняя ошибка выборочной доли при типическом бесповторном отборе определяется по формуле
Средняя из групповых дисперсий выборочной доли. рассчитывается следующим образом:
Расчет представлен в табл.2.11
Таблица 2.11
Группы рабочих по возрасту, лет |
Число рабочих n>j>> >, чел. |
Доля мужчин |
Доля женщин |
Дисперсия доли |
Взвешенный показатель дисперсии |
До 30 лет Свыше 30 |
40 60 |
0,8 0,9 |
0,2 0,1 |
0,16 0,09 |
6,4 5,4 |
Итого |
100 |
11,8 |
Тогда
Средняя ошибка репрезентативности для выборочной доли
Предельная ошибка выборочной доли с вероятностью 0,954 (гарантийный коэффициент )
Для определения пределов доли мужчин рассчитывается средняя доля для выборочной совокупности
С вероятностью 0,954 можно утверждать, что доля мужчин на предприятии находится в пределах
Библиографический список
1. Богородская Н.А. Статистика. Методы анализа статистической
информации: Текст лекций / СПбГААП. СПб., 1997. 80 с.
2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики.
Учебник. М.: ИНФРА-М, 1998. 416 с.
3. Статистика: Курс лекций / Л.П.Харченко, В.Г.Долженкова, В.Г. Ионин и
др.; Под ред. В.Г.Ионина. Новосибирск: Изд-во НГАЭиУ, 1996. 310 с.
4. Общая теория статистики: Статистическая методология в изучении
коммерческой деятельности. Учебник /А.И.Харламов, О.Э.Башина,
В.Т.Бабурин и др.; Под ред. А.А.Спирина, О.Э.Башиной. М.: Финансы
статистика, 1994. 296 с.
5. Гусаров В.М. Теория статистики. М.: Аудит, 1998. 247 с.
6. Елисеева И.И., Юзбашев М.М. Общая теория статистики. М.: Финансы и
статистика, 1998. 367 с.
7. Теория статистики. Учебник / Под ред. Р.А.Шмойловой. М.: Финансы и
статистика, 1998. 576 с.
8. Практикум по теории статистики: Учеб. пособие / Под ред.
Р.А.Шмойловой. М.: Финансы и статистика, 1998. 416 с.
9. Громыко Г.Л. Общая теория статистики: Практикум. М.: ИНФРА-М,
1999. 139 с.
10. Сборник задач по общей теории статистики: Учеб. пособие для
студентов вузов, обучающихся по специальности “Статистика” /
В.Е.Овсиенко, Н.В.Голованова, Ю.Г.Королев и др. 2-е изд., перераб. и
доп. М.: Финансы и статистика, 1986. 191 с.
Содержание
1. МЕТОДИЧЕСКИЕ УКАЗАНИЯ К РЕШЕНИЮ ЗАДАЧ ПО ТЕМЕ
"ВЫБОРОЧНЫЕ НАБЛЮДЕНИЯ" . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Выборочное исследование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Виды отбора при выборочном наблюдении . . . . . . . . . . . . . . . . 1
1.3. Ошибки выборочного отбора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1. Ошибка выборочной доли . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4.3.2. Ошибка выборочной средней . . . . . . . . . . . . . . . . . . . . . . . 7
1.4. Объем выборки . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . 8
2. ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . 10
2.1. Механический и собственно-случайный отбор . . . . . . . . . . . . . . . . 10
2.2. Серийный отбор . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . 19
2.3. Типический отбор . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . 25
Библиографический список . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31