Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона
Федеральное агентство по образованию РФ
Сибирская государственная автомобильно-дорожная академия (СибАДИ)
Кафедра: «Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Тема: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона»
Выполнила: студентка 23ЭУТ
Хасянова А.Ф.
Проверил: Матвеева С.В
Дата_______________
Оценка_____________
Омск-2010
Содержание
1. Введение. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х
5. Оценки числовых характеристик и параметров выдвинутого закона
6. Теоретическая функция плотности рассматриваемого закона распределения «Построение ее на гистограмме»
7. Проверка критерия Пирсона
Вывод
1. Исходные данные варианта №20
Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.
Таблица 1
79,02 |
79,70 |
74,68 |
20,47 |
11,70 |
44,64 |
40,75 |
8,59 |
96,42 |
6,17 |
91,75 |
93,29 |
77,57 |
81,25 |
76,59 |
51,84 |
6,17 |
42,79 |
80,87 |
92,81 |
48,04 |
14,70 |
100,64 |
69,83 |
94,56 |
70,42 |
47,93 |
47,48 |
66,79 |
42,12 |
20,27 |
51,36 |
62,51 |
66,86 |
87,99 |
99,29 |
5,96 |
60,38 |
62,53 |
75,50 |
46,55 |
83,53 |
55,65 |
59,26 |
77,05 |
101,10 |
29,93 |
102,21 |
86,11 |
45,92 |
90,93 |
24,30 |
9,76 |
90,25 |
36,72 |
84,96 |
20,50 |
81,99 |
56,29 |
31,75 |
43,61 |
68,70 |
80,47 |
100,66 |
29,98 |
48,88 |
40,37 |
67,46 |
91,46 |
59,11 |
90,75 |
4,64 |
36,53 |
32,39 |
6,99 |
8,41 |
30,85 |
37,30 |
64,44 |
25,60 |
18,00 |
84,27 |
98,88 |
36,39 |
34,64 |
49,49 |
10,53 |
50,97 |
39,40 |
3,59 |
100,39 |
18,57 |
9,27 |
10,89 |
65,91 |
35,62 |
75,45 |
37,86 |
89,74 |
4,57 |
Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.
2. Построение вариационного ряда
Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.
Проранжировав статистические данные, получаем вариационный ряд (табл. 2).
Таблица 2
3,59 |
9,76 |
24,30 |
36,53 |
44,64 |
51,84 |
66,68 |
77,05 |
84,96 |
93,29 |
4,57 |
10,53 |
25,60 |
36,72 |
45,92 |
55,65 |
66,79 |
77,75 |
86,11 |
94,56 |
4,64 |
10,89 |
29,93 |
37,30 |
46,55 |
56,29 |
67,46 |
79,02 |
87,99 |
96,42 |
5,96 |
11,70 |
29,98 |
37,86 |
47,48 |
59,11 |
68,78 |
79,70 |
89,74 |
98,88 |
6,17 |
14,70 |
30,85 |
39,40 |
47,93 |
59,26 |
69,83 |
80,47 |
90,25 |
99,29 |
6,17 |
18,00 |
31,75 |
40,37 |
48,04 |
60,38 |
70,42 |
80,87 |
90,75 |
100,39 |
6,99 |
18,57 |
32,39 |
40,75 |
48,88 |
62,51 |
74,68 |
81,25 |
90,93 |
100,46 |
8,41 |
20,27 |
34,64 |
42,12 |
49,49 |
62,53 |
75,45 |
81,99 |
91,46 |
100,66 |
8,59 |
20,47 |
35,62 |
42,79 |
50,97 |
64,44 |
75,50 |
83,53 |
91,75 |
101,10 |
9,27 |
20,50 |
36,39 |
43,61 |
51,36 |
65,71 |
76,59 |
84,27 |
92,81 |
102,21 |
3. Построение интервального вариационного ряда
Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.
Численность отдельной
группы сгруппированного ряда опытных
данных называется выборочной частотой
соответствующей варианты x(i)
и обозначается mi;
при этом
,
где n
– объем выборки.
Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,
т.е.
–
число (частота) попаданий значений X
в i-й
разряд,
n –
объем выборки.
Т.к. согласно теореме
Бернулли имеем, что
т.е. выборочная относительная частота
сходится по вероятности соответствующей
вероятности, тогда из условия:
Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С.В. с соответствующими им частотами или относительными частотами.
Для построения интервального вариационного ряда выполняем следующие действия.
Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .
Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса:
где n – объем выборки, К– число частичных интервалов .
,
∆=
10
Определяем начало первого частичного интервала
После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3).
Таблица 3
Разряды
|
mi |
|
|
|
|
1 |
[3.5-13.5) |
14 |
0.14 |
0.014 |
8.5 |
2 |
[13.5-23.5) |
6 |
0.06 |
0.006 |
18.5 |
3 |
[23.5-33.5) |
7 |
0.07 |
0.007 |
28.5 |
4 |
[33.5-43.5) |
12 |
0.12 |
0.012 |
38.5 |
5 |
[43.5-53.5) |
12 |
0.12 |
0.012 |
48.5 |
6 |
[53.5-63.5) |
7 |
0.07 |
0.007 |
58.5 |
7 |
[63.5-73.5) |
8 |
0.08 |
0.008 |
68.5 |
8 |
[73.5-83.5) |
12 |
0.12 |
0.012 |
78.5 |
9 |
[83.5-93.5) |
13 |
0.13 |
0.013 |
88.5 |
10 |
[93.5-103.5) |
9 |
0.09 |
0.009 |
98.5 |
Контроль |
|
|
Где
-плотность
относительной частоты
-середина
частичных интервалов
Построение гистограммы
Гистограммой частот
называют ступенчатую фигуру, состоящую
из прямоугольников, основаниями которых
служат частичные интервалы длины
,
а высоты равны отношению
– плотность частоты (или
– плотность частности).
По данным таблицы 4 строим гистограмму (рис. 1).
Гистограмма частот
является статистическим аналогом
дифференциальной функции распределения
(плотности)
случайной величины Х. Площадь гистограммы
равна единице.
Выдвижение гипотезы о законе распределения генеральной совокупности
По данным наблюдений
статистическое среднее
и выборочное среднее квадратическое
отклонение у* по
значению почти совпадают. Учитывая
данный факт, а также вид гистограммы
можно предположить, что случайная
величина имеет равномерное распределение.
По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.
Оценка числовых характеристик и параметров закона распределения
Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.
Оценка называется точечной, если она определяется числом или точкой на числовой оси.
Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.
При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:
где n - объем выборки,
–
i-й элемент выборки
Составим таблицу для
нахождения
и
Таблица 4
i |
|
|
1 |
|
8.5*14=119 |
2 |
|
18.5*6=111 |
3 |
|
28.5*7=199.5 |
4 |
|
38.5*12=462 |
5 |
|
48.5*12=582 |
6 |
|
58.5*7=409.5 |
7 |
|
68.5*8=548 |
8 |
|
78.5*12=942 |
9 |
|
88.5*13=1150.5 |
10 |
|
98.5*9=886.5 |
|
|
6. Равномерный закон
интервальный вариационный генеральный совокупность
Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону
найдем функцию плотности
равномерного закона
вычислив оценки параметров
и
,
Т.к М(x)=
,
,
D(x)=
Таблица 5
i |
|
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
6 |
|
7 |
|
8 |
|
9 |
|
10 |
|
|
После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности
Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона
В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.
Пирсон доказал, что значение
статистического критерия не зависит
от функции
и от числа опытов n, а
зависит от числа частичных интервалов
интервального вариационного ряда. При
увеличении ч2, и находится по формуле:
К =
или К =
Дальнейшие вычисления, необходимые
для определения расчетного значения
выборочной статистики
,
проведем в таблице 5.
Таблица 6
i |
|
|
|
|
|
|
1 |
0.14 |
14 |
0.1029 |
10.29 |
|
13.76/10.37=1.33 |
2 |
0.06 |
6 |
0.1 |
10 |
|
16/10=1.6 |
3 |
0.07 |
7 |
0.1 |
10 |
|
16/10=1.6 |
4 |
0.12 |
12 |
0.1 |
10 |
|
16/10=1.6 |
5 |
0.12 |
12 |
0.1 |
10 |
|
16/10=1.6 |
6 |
0.07 |
7 |
0.1 |
10 |
|
16/10=1.6 |
7 |
0.08 |
8 |
0.1 |
10 |
|
16/10=1.6 |
8 |
0.12 |
12 |
0.1 |
10 |
|
16/10=1.6 |
9 |
0.13 |
13 |
0.1 |
10 |
|
16/10=1.6 |
10 |
0.09 |
9 |
0.1149 |
11.49 |
|
6.3/11.49=0.548 |
|
|
|
|
Чтобы найти значение
надо
воспользоваться табличными распределениями
в которых значение сл. величины находят
по заданному уровню значимости
и вычисленному числу степеней свободы
R-
число частичных интервалов в таблице
1 но если в некоторых из интервалов
значения
то
надо объединить расположенные рядом
интервалы так, чтобы
тогда число
R-это число из необъединенных интервалов
i- число неизвестных параметров
В рассматриваемом эмпирическом
распределении не имеются частоты,
меньшие 5. Случайная величина ч2 (мера
расхождения) независимо от вида закона
распределения генеральной совокупности
при (n ≥ 50) имеет распределение
ч2 с числом степеней свободы
1) К =
уровень значимости б =1–=0,05
,
найдем по таблице значений
критическое значение для б = 0,05 и
=9
Имеем
=16.9.
Так как
то предполагаемая гипотеза о показательном
законе распределения генеральной
совокупности не противоречит опытным
данным и принимается на уровне значимости
б.
2)=
,
=
3) M(x)=
,
M(x)=
4) D(x)=
D(x.1)=
5) Таким образом, критическая
область для гипотезы задается неравенством
;
P(
)=
Это означает, что нулевую гипотезу можно
считать правдоподобной и гипотеза Но
принимается
Вывод: В ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по критерию Пирсона. Определили параметры и числовые характеристики закона и построили для них доверительные интервалы.