Математическая статистика (работа 4)
Министерство образования и науки Российской Федерации.
Федеральное агентство по образованию.
Государственное образовательное учреждение высшего профессионального
образования.
Самарский государственный технический университет.
Кафедра высшей математике
Курсовая работа
студент
руководитель: .
ассистент: Н.
Самара
2004 г.
Пусть случайные величины Х и Y принимают значение, приведённые в таблице 1.
Таблица 1
|
Х |
Y |
X |
Y |
X |
Y |
X |
Y |
|
70 |
60 |
97 |
62 |
27 |
25 |
57 |
35 |
|
73 |
60 |
96 |
85 |
43 |
25 |
60 |
34 |
|
80 |
55 |
67 |
34 |
24 |
19 |
92 |
85 |
|
41 |
30 |
80 |
80 |
24 |
20 |
93 |
75 |
|
56 |
25 |
82 |
78 |
27 |
19 |
100 |
65 |
|
103 |
92 |
90 |
80 |
100 |
90 |
120 |
115 |
|
104 |
92 |
120 |
92 |
101 |
110 |
120 |
90 |
|
104 |
114 |
115 |
115 |
102 |
112 |
92 |
75 |
|
93 |
62 |
123 |
115 |
145 |
118 |
123 |
112 |
|
118 |
115 |
127 |
120 |
150 |
118 |
123 |
100 |
|
121 |
92 |
127 |
117 |
150 |
119 |
96 |
72 |
|
117 |
92 |
130 |
120 |
150 |
120 |
130 |
119 |
|
112 |
110 |
135 |
125 |
131 |
120 |
142 |
119 |
|
96 |
78 |
153 |
125 |
132 |
142 |
142 |
140 |
|
127 |
120 |
153 |
142 |
202 |
175 |
145 |
144 |
|
130 |
125 |
153 |
135 |
202 |
173 |
157 |
150 |
|
130 |
140 |
153 |
145 |
205 |
202 |
180 |
180 |
|
130 |
119 |
162 |
172 |
180 |
202 |
180 |
200 |
|
150 |
140 |
165 |
165 |
188 |
225 |
180 |
175 |
|
140 |
120 |
165 |
150 |
210 |
220 |
180 |
190 |
|
140 |
125 |
165 |
146 |
221 |
225 |
200 |
200 |
|
162 |
170 |
170 |
152 |
225 |
220 |
200 |
175 |
|
155 |
170 |
170 |
165 |
225 |
230 |
240 |
228 |
|
157 |
160 |
154 |
170 |
227 |
232 |
240 |
232 |
|
157 |
165 |
154 |
165 |
237 |
232 |
132 |
140 |
1) Находим, что

Тогда длина интервала группирования

-
число интервалов (разрядов), неформализован
и зависит от объёма и степени однородности
выборки. При
,

2) Находим границы
величины

,

3) Находим значение представителей

-
середина i-того
интервала.
4) Для графического
описания выборки по условиям задания
необходимо построить гистограмму
относительных частот (рис. 1) и эмпирическую
функцию распределения
(рис. 2)
а) На гистограмме
относительных частот высота прямоугольников
выбирается равной
,
основания прямоугольников соответствуют
интервалам разбиения. Площадь i-того
прямоугольника
равна
относительной частоте наблюдений,
попавших в i-тый
интервал.
Составляем таблицу
частот группированной выборки (табл.
2), содержащую столбцы с номерами интервала
i,
значениями нижней границы (начала
интервала) и представителя интервала
,
числами значений в i-том
интервале
,
накопленной частоты
,
относительной частоты
,
накопленной относительной частоты
.
Число строк таблицы равно числу интервалов
r.

Рис. 1. Гистограмма относительных частот
б) Эмпирическая функция распределения определяется по значениям накопленных относительных частот представителей разрядов:

Функция представляет
собой кусочно-постоянную функцию,
имеющие скачки в точках, соответствующих
серединам интервалов группировки
,
причём при
,
и при


Рис. 2. Эмпирическая
функция распределения

5) Составленную ранее
таблицу частот группированной выборки
(табл. 2) дополняем таблицей расчёта
числовых значений
и
.
Она содержит результаты промежуточных
вычислений по формулам

6) После заполнения таблицы 2 рассчитываем значение числовых оценок:


7) Определяем коэффициент вариаций

8) Определяем границы доверительного интервала для математического ожидания по формулам


При заданной доверительной
вероятности
по таблицам распределения Стьюдента
,
поэтому имеем


9) Среднеквадратичное отклонение оценки математического ожидания случайной величины Х равно


10) По виду гистограммы
выдвигаем гипотезу Н>0
>о подчинении
случайной величины Х нормальному закону
распределения. Для построения теоретической
функции
и
составляем таблицу значений (таблица
3) нормальной величины
,
определяем функцию Лапласа
,
значения функции распределения на
концах отрезков
и вероятность попадания
в i-тый
интервал по формуле

11) Рисунок 2 с эмпирической функцией распределения дополняем теоретической функцией F(x), значения которой найдены на концах интервалов.

Рис. 3. Эмпирическая
,
теоретическая
функция распределения.
12) Для проверки согласия
выдвинутой гипотезы о о законе
распределения экспериментальным данным
находим вероятность
попадания опытных данных в i-тый
интервал от
до
на основе полученных значений функции
на границах интервалов. На построенную
раньше гистограмму наносим точки с
координатами
и соединяем их плавными линиями (Рис.
4). Сравнивая вид гистограммы и плотность
распределения, необходимо убедиться в
их адекватности, близости их характеров.

Рис. 4. Гистограмма
относительных частот и теоретическая
плотность вероятности
.
13) При количественной оценке меры близости эмпирического и теоретического законов распределения можно использовать критерии Пирсона или Колмогорова.
а) по критерию Колмогорова:
Максимальное значение
модуля разности между значениями
эмпирической и теоретической функциями(см.
рис. 3) наблюдается в точке, близкой к
представителю
.
Тогда

Вычисляем величину

где r – объём выборки из представителей интервалов
,
следовательно
.
Так как
,
поэтому гипотеза о нормальном распределении
по критерию Колмогорова принимается
как не противоречащая опытным данным.
б) Для вычисления
таблицу 3 дополняем промежуточными
результатами
,
,
.
Объединяем 1,2,3 и 9,10. Тогда
.
Получаем, что
Для нормального закона
распределения
.
Тогда число степеней свободы
.
При
имеем
.
Поэтому гипотеза по критерию
Пирсона принимается.
14) Составляем точечную
диаграмму в декартовой (рис. 5) системе
координат, где по оси абсцисс откладываем
значение
,
а по оси ординат -
.
Пары значений
представляем на диаграмме в виде точек.
На диаграмму наносим сетку равноотстоящих
горизонтальных и вертикальных прямых.
Расстояние между двумя вертикальными
прямыми выражает длину
интервала по оси абсцисс, а расстояние
между горизонтальными прямыми – длину
интервала
по оси ординат.
15) Для вычисления коэффициента корреляции составляется корреляционная таблица (таблица 4). В последние две строки заносятся промежуточные результаты для вычисления точечной оценки коэффициента корреляции

16) Находим




Следовательно, линейные приближения к регрессиям имеют вид:


На рисунке 3 представлены
точечная диаграмма и линии регрессии
X
на Y
и Y
на X.
Расположение точек
на диаграмме и небольшое значение
коэффициента корреляции указывают на
слабую коррелированность случайных
величин X
и Y
между собой.
Таблица 2
|
№ интервала |
|
|
|
|
|
|
|
|
|
|
|
1 |
24 |
34,8 |
6 |
6 |
0,06 |
0,06 |
208,8 |
-99,36 |
9872,41 |
59234,46 |
|
2 |
45,6 |
56,4 |
4 |
10 |
0,04 |
0,1 |
225,6 |
-77,76 |
6046,618 |
24186,47 |
|
3 |
67,2 |
78 |
5 |
15 |
0,05 |
0,15 |
390 |
-56,16 |
3153,946 |
15769,73 |
|
4 |
88,8 |
99,6 |
16 |
31 |
0,16 |
0,31 |
1593,6 |
-34,56 |
1194,394 |
19110,3 |
|
5 |
110,4 |
121,2 |
21 |
52 |
0,21 |
0,52 |
2545,2 |
-12,96 |
167,9616 |
3527,194 |
|
6 |
132 |
142,8 |
15 |
67 |
0,15 |
0,67 |
2142 |
8,64 |
74,6496 |
1119,744 |
|
7 |
153,6 |
164,4 |
13 |
80 |
0,13 |
0,8 |
2137,2 |
30,24 |
914,4576 |
11887,95 |
|
8 |
175,2 |
186 |
6 |
86 |
0,06 |
0,86 |
1116 |
51,84 |
2687,386 |
16124,31 |
|
9 |
196,8 |
207,6 |
7 |
93 |
0,07 |
0,93 |
1453,2 |
73,44 |
5393,434 |
37754,04 |
|
10 |
218,4 |
229,2 |
7 |
100 |
0,07 |
1 |
1604,4 |
95,04 |
9032,602 |
63228,21 |
|
11 |
240 |
|
|
|
|
|
|
|
|
|
|
Сумма |
100 |
1 |
13416 |
251942,4 |
Таблица 3
|
№ интервала |
|
|
|
|
|
|
|
|
|
1 |
24 |
-2,18368 |
-0,4854 |
0,0146 |
0,0255 |
2,55 |
3,8025 |
0,224336 |
|
2 |
45,6 |
-1,75551 |
-0,4599 |
0,0401 |
0,0517 |
5,17 |
||
|
3 |
67,2 |
-1,32733 |
-0,4082 |
0,0918 |
0,0923 |
9,23 |
||
|
4 |
88,8 |
-0,89916 |
-0,3159 |
0,1841 |
0,1351 |
13,51 |
6,2001 |
0,458927 |
|
5 |
110,4 |
-0,47099 |
-0,1808 |
0,3192 |
0,1648 |
16,48 |
20,4304 |
1,239709 |
|
6 |
132 |
-0,04282 |
-0,016 |
0,484 |
0,164 |
16,4 |
1,96 |
0,119512 |
|
7 |
153,6 |
0,385355 |
0,148 |
0,648 |
0,143 |
14,3 |
1,69 |
0,118182 |
|
8 |
175,2 |
0,813527 |
0,291 |
0,791 |
0,1015 |
10,15 |
17,2225 |
1,696798 |
|
9 |
196,8 |
1,241699 |
0,3925 |
0,8925 |
0,06 |
6 |
25,8064 |
2,893094 |
|
10 |
218,4 |
1,669871 |
0,4525 |
0,9525 |
0,0292 |
2,92 |
||
|
11 |
240 |
2,098043 |
0,4817 |
0,9817 |
|
|
|
|
Пусть случайные величины Х и Y принимают значение, приведённые в таблице 1.
Таблица 1
|
Х |
Y |
X |
Y |
X |
Y |
X |
Y |
|
70 |
60 |
97 |
62 |
27 |
25 |
57 |
35 |
|
73 |
60 |
96 |
85 |
43 |
25 |
60 |
34 |
|
80 |
55 |
67 |
34 |
24 |
19 |
92 |
85 |
|
41 |
30 |
80 |
80 |
24 |
20 |
93 |
75 |
|
56 |
25 |
82 |
78 |
27 |
19 |
100 |
65 |
|
103 |
92 |
90 |
80 |
100 |
90 |
120 |
115 |
|
104 |
92 |
120 |
92 |
101 |
110 |
120 |
90 |
|
104 |
114 |
115 |
115 |
102 |
112 |
92 |
75 |
|
93 |
62 |
123 |
115 |
145 |
118 |
123 |
112 |
|
118 |
115 |
127 |
120 |
150 |
118 |
123 |
100 |
|
121 |
92 |
127 |
117 |
150 |
119 |
96 |
72 |
|
117 |
92 |
130 |
120 |
150 |
120 |
130 |
119 |
|
112 |
110 |
135 |
125 |
131 |
120 |
142 |
119 |
|
96 |
78 |
153 |
125 |
132 |
142 |
142 |
140 |
|
127 |
120 |
153 |
142 |
202 |
175 |
145 |
144 |
|
130 |
125 |
153 |
135 |
202 |
173 |
157 |
150 |
|
130 |
140 |
153 |
145 |
205 |
202 |
180 |
180 |
|
130 |
119 |
162 |
172 |
180 |
202 |
180 |
200 |
|
150 |
140 |
165 |
165 |
188 |
225 |
180 |
175 |
|
140 |
120 |
165 |
150 |
210 |
220 |
180 |
190 |
|
140 |
125 |
165 |
146 |
221 |
225 |
200 |
200 |
|
162 |
170 |
170 |
152 |
225 |
220 |
200 |
175 |
|
155 |
170 |
170 |
165 |
225 |
230 |
240 |
228 |
|
157 |
160 |
154 |
170 |
227 |
232 |
240 |
232 |
|
157 |
165 |
154 |
165 |
237 |
232 |
132 |
140 |
1) Находим, что

Тогда длина интервала группирования

-
число интервалов (разрядов), неформализован
и зависит от объёма и степени однородности
выборки. При
,

2) Находим границы
величины

,

3) Находим значение представителей

-
середина j-того
интервала.
4) Для графического
описания выборки по условиям задания
необходимо построить гистограмму
относительных частот (рис. 1) и эмпирическую
функцию распределения
(рис. 2)
а) На гистограмме
относительных частот высота прямоугольников
выбирается равной
,
основания прямоугольников соответствуют
интервалам разбиения. Площадь j-того
прямоугольника
равна
относительной частоте наблюдений,
попавших в j-тый
интервал.
Составляем таблицу
частот группированной выборки (табл.
2), содержащую столбцы с номерами интервала
j,
значениями нижней границы (начала
интервала) и представителя интервала
,
числами значений в j-том
интервале
,
накопленной частоты
,
относительной частоты
,
накопленной относительной частоты
.
Число строк таблицы равно числу интервалов
r.

Рис. 1. Гистограмма относительных частот
б) Эмпирическая функция распределения определяется по значениям накопленных относительных частот представителей разрядов:

Функция представляет
собой кусочно-постоянную функцию,
имеющие скачки в точках, соответствующих
серединам интервалов группировки
,
причём при
,
и при


Рис. 2. Эмпирическая
функция распределения

5) Составленную ранее
таблицу частот группированной выборки
(табл. 2) дополняем таблицей расчёта
числовых значений
и
.
Она содержит результаты промежуточных
вычислений по формулам

6) После заполнения таблицы 2 рассчитываем значение числовых оценок:


7) Определяем коэффициент вариаций

8) Определяем границы доверительного интервала для математического ожидания по формулам


При заданной доверительной
вероятности
по таблицам распределения Стьюдента
,
поэтому имеем


9) Среднеквадратичное отклонение оценки математического ожидания случайной величины Y равно


10) По виду гистограммы
выдвигаем гипотезу Н>0
>о подчинении
случайной величины нормальному закону
распределения. Для построения теоретической
функции
и
составляем таблицу значений (таблица
3) нормальной величины
,
определяем функцию Лапласа
,
значения функции распределения на
концах отрезков
и вероятность попадания
в i-тый
интервал по формуле

11) Рисунок 2 с эмпирической функцией распределения дополняем теоретической функцией F(y), значения которой найдены на концах интервалов.

Рис. 3. Эмпирическая
,
теоретическая
функция распределения.
12) Для проверки согласия
выдвинутой гипотезы о о законе
распределения экспериментальным данным
находим вероятность
попадания опытных данных в j-тый
интервал от
до
на основе полученных значений функции
на границах интервалов. На построенную
раньше гистограмму наносим точки с
координатами
и соединяем их плавными линиями (Рис.
4). Сравнивая вид гистограммы и плотность
распределения, необходимо убедиться в
их адекватности, близости их характеров.

Рис. 4. Гистограмма
относительных частот и теоретическая
плотность вероятности
.
13) При количественной оценке меры близости эмпирического и теоретического законов распределения можно использовать критерии Пирсона или Колмогорова.
а) по критерию Колмогорова
Максимальное значение
модуля разности между значениями
эмпирической и теоретической функциями(см.
рис. 2) наблюдается в точке, близкой к
представителю
.
Тогда

Вычисляем величину

где r – объём выборки из представителей интервалов
,
следовательно
.
Так как
,
поэтому гипотеза о нормальном распределении
по критерию Колмогорова принимается
как не противоречащая опытным данным.
б) Для вычисления
таблицу 3 дополняем промежуточными
результатами
,
,
.
Объединяем 1,2,3 и 9,10. Тогда
.
Получаем, что
Для нормального закона
распределения
.
Тогда число степеней свободы
.
При
имеем
.
Поэтому гипотеза по критерию
Пирсона принимается.
14) Составляем точечную
диаграмму в декартовой системе координат,
где по оси абсцисс откладываем значение
,
а по оси ординат -
.
Пары значений
представляем на диаграмме в виде точек.
На диаграмму наносим сетку равноотстоящих
горизонтальных и вертикальных прямых.
Расстояние между двумя вертикальными
прямыми выражает длину
интервала по оси абсцисс, а расстояние
между горизонтальными прямыми – длину
интервала
по оси ординат.
15) Для вычисления коэффициента корреляции составляется корреляционная таблица (таблица 4). В последние две строки заносятся промежуточные результаты для вычисления точечной оценки коэффициента корреляции

16) Находим




Следовательно, линейные приближения к регрессиям имеют вид:


На рисунке 3 представлены
точечная диаграмма и линии регрессии
X
на Y
и Y
на X.
Расположение точек
на диаграмме и небольшое значение
коэффициента корреляции указывают на
слабую коррелированность случайных
величин X
и Y
между собой.
Таблица 2
|
№ интервала |
|
|
|
|
|
|
|
|
|
|
|
1 |
19 |
29,65 |
10 |
10 |
0,1 |
0,1 |
296,5 |
-93,933 |
8823,408 |
88234,08 |
|
2 |
40,3 |
50,95 |
3 |
13 |
0,03 |
0,13 |
152,85 |
-72,633 |
5275,553 |
15826,66 |
|
3 |
61,6 |
72,25 |
10 |
23 |
0,1 |
0,23 |
722,5 |
-51,333 |
2635,077 |
26350,77 |
|
4 |
82,9 |
93,55 |
10 |
33 |
0,1 |
0,33 |
935,5 |
-30,033 |
901,9811 |
9019,811 |
|
5 |
104,2 |
114,85 |
26 |
59 |
0,26 |
0,59 |
2986,1 |
-8,733 |
76,26529 |
1982,898 |
|
6 |
125,5 |
136,15 |
10 |
69 |
0,1 |
0,69 |
1361,5 |
12,567 |
157,9295 |
1579,295 |
|
7 |
146,8 |
157,45 |
7 |
76 |
0,07 |
0,76 |
1102,15 |
33,867 |
1146,974 |
8028,816 |
|
8 |
168,1 |
178,75 |
10 |
86 |
0,1 |
0,86 |
1787,5 |
55,167 |
3043,398 |
30433,98 |
|
9 |
189,4 |
200,05 |
4 |
90 |
0,04 |
0,9 |
800,2 |
76,467 |
5847,202 |
23388,81 |
|
10 |
210,7 |
221,35 |
10 |
100 |
0,1 |
1 |
2213,5 |
97,767 |
9558,386 |
95583,86 |
|
11 |
232 |
|
|
|
|
|
|
|
|
|
|
Сумма |
100 |
1 |
12358,3 |
300429 |
Таблица 3
|
№ интервала |
|
|
|
|
|
|
|
|
|
1 |
19 |
-1,89849 |
-0,4713 |
0,0287 |
0,0368 |
3,68 |
8,4681 |
0,421508 |
|
2 |
40,3 |
-1,51183 |
-0,4345 |
0,0655 |
0,0659 |
6,59 |
||
|
3 |
61,6 |
-1,12517 |
-0,3686 |
0,1314 |
0,0982 |
9,82 |
||
|
4 |
82,9 |
-0,73852 |
-0,2704 |
0,2296 |
0,1336 |
13,36 |
11,2896 |
0,84503 |
|
5 |
104,2 |
-0,35186 |
-0,1368 |
0,3632 |
0,1488 |
14,88 |
123,6544 |
8,310108 |
|
6 |
125,5 |
0,034799 |
0,012 |
0,512 |
0,1508 |
15,08 |
25,8064 |
1,7113 |
|
7 |
146,8 |
0,421457 |
0,1628 |
0,6628 |
0,1282 |
12,82 |
33,8724 |
2,642153 |
|
8 |
168,1 |
0,808114 |
0,291 |
0,791 |
0,092 |
9,2 |
30,6916 |
1,6626 |
|
9 |
189,4 |
1,194772 |
0,383 |
0,883 |
0,0599 |
5,99 |
||
|
10 |
210,7 |
1,58143 |
0,4429 |
0,9429 |
0,0327 |
3,27 |
||
|
11 |
232 |
1,968087 |
0,4756 |
0,9756 |
||||
|
Сумма |
13,5927 |

























