Оценивание параметров и проверка гипотез о нормальном распределении (WinWord, Excel)
Кафедра математической статистики и эконометрики
Расчетная работа №1
По курсу:
“Математическая статистика”
по теме:
“Оценивание параметров
и проверка гипотез
о нормальном распределении”
Группа: ДИ 202
Студент: Шеломанов Р.Б.
Руководитель: Кацман В.Е.
Москва 1999
Содержание
ЗАДАНИЕ № 23 3
Построение интервального вариационного ряда распределения 3
Вычисление выборочных характеристик распределения 4
Графическое изображение вариационных рядов 5
Расчет теоретической нормальной кривой распределения 6
Проверка гипотез о нормальном законе распределения 7
ЗАДАНИЕ № 23
Продолжительность горения электролампочек (ч) следующая:
750 |
750 |
756 |
769 |
757 |
767 |
760 |
743 |
745 |
759 |
750 |
750 |
739 |
751 |
746 |
758 |
750 |
758 |
753 |
747 |
751 |
762 |
748 |
750 |
752 |
763 |
739 |
744 |
764 |
755 |
751 |
750 |
733 |
752 |
750 |
763 |
749 |
754 |
745 |
747 |
762 |
751 |
738 |
766 |
757 |
769 |
739 |
746 |
750 |
753 |
738 |
735 |
760 |
738 |
747 |
752 |
747 |
750 |
746 |
748 |
742 |
742 |
758 |
751 |
752 |
762 |
740 |
753 |
758 |
754 |
737 |
743 |
748 |
747 |
754 |
754 |
750 |
753 |
754 |
760 |
740 |
756 |
741 |
752 |
747 |
749 |
745 |
757 |
755 |
764 |
756 |
764 |
751 |
759 |
754 |
745 |
752 |
755 |
765 |
762 |
По выборочным данным, представленным в заданиях №1-30, требуется:
1* Построить интервальный вариационный ряд распределения;
Построение интервального вариационного ряда распределения
Max: 769
Min: 733
R=769-733=36
H= R / 1+3,32 lg n=36/(1+3,32lg100)=4,712
A1= x min - h/2=730,644
B1=A1+h; B2=A2+h
2* Вычислить выборочные характеристики по вариационному ряду:
среднюю арифметическую (x ср.), центральные моменты (мю к, к=1,4), дисперсию (S^2), среднее квадратическое отклонение (S), коэффициенты асимметрии (Ас) и эксцесса (Ек), медиану (Ме), моду (Мо), коэффициент вариации(Vs);
Вычисление выборочных характеристик распределения
i=(x>i>- x>ср>)
x>ср> = xi mi/ mi
x>ср >= 751,7539
Вспомогательная таблица ко второму пункту расчетов
Выборочный центральный момент К-го порядка равен
M k = ( xi - x)^k mi/ mi
В нашем примере:
Центр момент 1 |
0,00 |
Центр момент 2 |
63,94 |
Центр момент 3 |
-2,85 |
Центр момент 4 |
12123,03 |
Выборочная дисперсия S^2 равна центральному моменту второго порядка:
В нашем примере:
S^2= 63,94
Ввыборочное среднее квадратическое отклонение:
В нашем примере:
S= 7,996
Выборочные коэффициенты асимметрии Ас и эксцесса Fk по формулам
Ac = m3/ S^3;
В нашем примере:
Ас =-0,00557
Ek = m4/ S^4 -3;
В нашем примере:
Ek = -0,03442
Медиана Ме - значение признака x (e), приходящееся на середину ранжированного ряда наблюдений ( n = 2l -1). При четном числе наблюдений( n= 2l) медианой Ме является средняя арифметическая двух значений, расположенных в середине ранжированного ряда: Me=( x(e) + x( e+1) /2
Если исходить из интервального ряда, то медиану следует вычислять по ормуле
Me= a me +h * ( n/2 - mh( me-1) / m me
где mе- означает номер медианного интервала, ( mе -1) - интервала, редшествующего медианому.
В нашем примере:
Me=751,646
Мода Мо для совокупности наблюдений равна тому значению признака , которому соответствует наибольшая частота.
Для одномодального интервального ряда вычисление моды можно производить по формуле
Mo= a mo + h * ( m mo- m(mo-1))/2 m mo- m( mo-1) - m( mo+1)
где мо означает номер модального интервала ( интервала с наибольшей частотой), мо-1, мо+1- номера предшествующего модальному и следующего за ним интервалов.
В нашем примере:
Mo = 751,49476
Так как Х>ср>, Mo Me почти не отличаются друг от друга, есть основания предполагать теоретическое распределение нормальным.
Коэффициент вариации Vs = S/ x * 100 %= 3.06%
В нашем примере:
Vs= 1,06%
3* Построить гистограмму, полигон и кумуляту.
Графическое изображение вариационных рядов
Для визуального подбора теоретического распределения, а также выявления положения среднего значения (x ср.) и характера рассеивания (S^2 и S) вариационные ряды изображают графически.
Полигон и кумулята применяются для изображения как дискретных, так и интервальных рядов, гистограмма – для изображения только интервальных рядов. Для построения этих графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот (частостей)
Wi=mi/n, накопленных относительных частот Whi и найдем отношение Wi/h, заполнив таблицу 1.4.
Интервалы xi Wi Whi Wi/h
Ai-bi
1 2 3 4 5
4,97-5,08 5,03 0,02 0.02 0,18
5,08-5,19 5,14 0,03 0,05 0,27
5,19-5,30 5,25 0.12 0,17 1,09
5,30-5,41 5,36 0,19 0,36 1,73
5,41-5,52 5,47 0,29 0,65 2,64
5,52-5,63 5,58 0,18 0,83 1,64
5,63-5,74 5,69 0,13 0,96 1,18
5,74-5,85 5,80 0,04 1,00 0,36
- 1,00 - |
Для построения гистограммы относительных частот (частостей) на оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте Wi данного i-го интервала. Тогда высота элементарного прямоугольника должна быть равна Wi/h,. Следовательно, позади под гистограммой равна сумме всех носительных частот, т.е. единице.
Из гистограммы можно получить полигон того же распределения. Если середины верхних оснований прямоугольников соединить отрезками прямой.
4* Сделать вывод о форме ряда распределения по виду гистограммы и полигона, а также по значениям коэффициентов Ас и Ек.
4 Анализ графиков и выводы
Гистограмма и полигон являются аппроксимациями кривой плотности (дифференциальной функции) теоретического распределения (генеральной совокупности). Поэтому по их виду можно судить о гипотическом законе распределения.
Для построения кумуляты дискретного ряда по оси абсцисс откладывают значения признака xi, а по оси ординат – накопленные относительные частоты Whi. Для интервального ряда по оси абсцисс откладывают интервалы .
С кумулятой сопоставляется график интегральной функции распределения F(x).
В нашем примере коэффициенты асимметрии и эксцесса не намного отличаются от нуля. Коэффициент асимметрии оказался отрицательным (Ас=-0,005), что свидетельствует о небольшой левосторонней асимметрии данного распределения. Эксцесс оказался также отрицательным (Ек= -0,034). Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальной, имеет несколько более плоскую вершину. Гистограмма и полигон напоминают кривую нормального распределения (рис.1.1 и 1.2.). Все это дает возможность выдвинуть гипотезу о том, что распределение продолжительности горения электролампочек является нормальным.
Приечание: Кумулята, гистронрамма и полигон находятся в приложениях к работе.
5* Рассчитать плотность и интегральную функцию теоретического нормального распределения и построить эти кривые на графиках гистограммы и кумуляты соответственно.
Расчет теоретической нормальной кривой распределения
Приведем один из способов расчета теоретического нормального распределения по двум найденным выборочным характеристикам x и S эмпирического ряда.
При расчете теоретических частот m^тi за оценку математического ожидания (мю) и среднего квадратического отклонения G нормального закона распределения принимают значения соответствующих выборочных характеристик x ср. и S, т.е. (мю)=Xср.= 751,7539; G=S=7,99.
Теоретические частоты находят по формуле: M^i=npi,
где n – объем; Pi – величина попадания значения нормально распределенной случайной величины в i-й интервал.
Вероятность Pi определяется по формуле
Pi=P(ai<x<=bi)=1/2[Ф(t2i)-Ф(t1i)],
Где Ф(t)=2\ 2(пи)=интегралу с границами от (0;t) е^x2/2dx - интегральная функция Лапласа – находится по таблице для
T2i=bi-x ср.\ S
T1i=ai-x ср.\S
Таблицы Для вычисления вероятности нормальной кривой распределения
Интервалы |
Mi |
T1 |
T2 |
1/2Ф(T1) |
1/2Ф(T2) |
Pi |
|
a(i) |
b(i) |
||||||
730,644 |
735,356 |
2 |
-2,640 |
-2,051 |
0,4958 |
0,4798 |
-0,0080 |
735,356 |
740,068 |
8 |
-2,051 |
-1,461 |
0,4798 |
0,4279 |
-0,0260 |
740,068 |
744,780 |
6 |
-1,461 |
-0,872 |
0,4279 |
0,3078 |
-0,0601 |
744,780 |
749,492 |
18 |
-0,872 |
-0,283 |
0,3078 |
1,1103 |
0,4013 |
749,492 |
754,204 |
35 |
-0,283 |
0,306 |
0,0300 |
0,6619 |
0,3160 |
754,204 |
758,916 |
12 |
0,306 |
0,896 |
0,1179 |
0,3133 |
0,0977 |
758,916 |
763,628 |
11 |
0,896 |
1,485 |
0,3133 |
0,4306 |
0,0587 |
763,628 |
768,340 |
6 |
1,485 |
2,074 |
0,4306 |
0,4808 |
0,0251 |
768,340 |
773,052 |
2 |
2,074 |
2,664 |
0,4808 |
0,4960 |
0,0076 |
Pi*n |
Mi(теор) |
Mi(теор)/h |
Mi(теор)накоп |
||||
-0,8000 |
1 |
0,002 |
0,0080 |
||||
-2,5950 |
3 |
0,006 |
0,0340 |
||||
-6,0050 |
6 |
0,013 |
0,0940 |
||||
40,1250 |
40 |
0,085 |
0,4953 |
||||
31,5950 |
32 |
0,068 |
0,8153 |
||||
9,7700 |
10 |
0,021 |
0,9130 |
||||
5,8650 |
6 |
0,012 |
0,9716 |
||||
2,5100 |
3 |
0,005 |
0,9967 |
||||
0,7600 |
1 |
0,002 |
1,0000 |
||||
100 |
Сравнение гистограммы и нормальной кривой наглядно показывает согласованность между теоретическим и эмпирическим распределением.
Примечание: Построенные графики находятся в приложениях к работе.
6* Проверить гипотезу о нормальном законе распределения по критерию согласи яПирсона f^2).
Проверка гипотез о нормальном законе распределения
Частоты для проверки соответствия эмпирического ряда распределения нормальному закону используют критерий X^2, основанный на сравнении эмпирических частот mi с теоретическими m^тi, которые можно ожидать при принятии определенной нулевой гипотезы.
Значение X^2набл. – наблюдаемое значение критерия, полученное по результатам наблюдений, равно
к
F^2набл.= (mi-m^тi)
I=1 m^i
Где к – число интервалов (после объединения). M^i – теоретические частоты. Все вспомогательные расчеты, необходимые для вычисления f^2, сведем в таблицу 1.6.
Таблица 1.6.
Вычисление критерия X^2 при проверке нормальности продолжительности горения электролампочек
Интервалы |
Mi(Практ) |
Mi(теор) |
(Mi-Mi(теор))^2 |
…../Mi(теор) |
|
a(i) |
b(i) |
||||
730,644 |
735,356 |
2 |
2 |
9 |
1,29 |
735,356 |
740,068 |
8 |
5 |
||
740,068 |
744,780 |
6 |
13 |
49 |
3,88 |
744,780 |
749,492 |
18 |
21 |
9 |
0,43 |
749,492 |
754,204 |
35 |
25 |
100 |
4,01 |
754,204 |
758,916 |
12 |
21 |
81 |
3,89 |
758,916 |
763,628 |
11 |
12 |
1 |
0,08 |
763,628 |
768,340 |
6 |
5 |
1 |
0,14 |
768,340 |
773,052 |
2 |
2 |
||
X^2набл |
13,71 |
Правило проверки гипотезы заключается в следующем. Определяем по таблице распределения xu-квадрат критическое значение X^2кр.(альфа для числа степеной свободы V=к-3 и заданного уровня значимости альфа. Затем сравниваем X^2кр.
Если X^2 набл.<=X^2кр. , то выдвинутая гипотеза о законе распределения не отвергается (не противоречит опытным данным).
Если X^2 набл. >X^2кр. , то выдвинутая гипотеза о нормальном законе распределения отвергается с вероятностью ошибки .
Для нашего примера X^2набл.=13,71, =0,005, V=7-3=4 (число интервалов после объединения стало равным 7) и X^2кр. (0,005; 4) =14,9
Так как X^2набл.<X^2кр., то согласно критерию Пирсона гипотеза о нормальном законе не отвергается с вероятностью ошибки 0,005. Можно сделать вывод, что распределение продолжительности горения электролампочек является нормальным. Что подтверждают графики и значения моды и медианы.
Overview
ГистрограммаПолигон
Кумулята
Лист1
Sheet 1: Гистрограмма
Sheet 2: Полигон
Sheet 3: Кумулята
Sheet 4: Лист1
750 | 750 | 756 | 769 | 757 | 767 | 760 | 743 | 745 | 759 | |
750 | 750 | 739 | 751 | 746 | 758 | 750 | 758 | 753 | 747 | |
751 | 762 | 748 | 750 | 752 | 763 | 739 | 744 | 764 | 755 | |
751 | 750 | 733 | 752 | 750 | 763 | 749 | 754 | 745 | 747 | |
762 | 751 | 738 | 766 | 757 | 769 | 739 | 746 | 750 | 753 | |
738 | 735 | 760 | 738 | 747 | 752 | 747 | 750 | 746 | 748 | |
742 | 742 | 758 | 751 | 752 | 762 | 740 | 753 | 758 | 754 | |
737 | 743 | 748 | 747 | 754 | 754 | 750 | 753 | 754 | 760 | |
740 | 756 | 741 | 752 | 747 | 749 | 745 | 757 | 755 | 764 | |
756 | 764 | 751 | 759 | 754 | 745 | 752 | 755 | 765 | 762 | |
max | 762 | 764 | 760 | 769 | 757 | 769 | 760 | 758 | 765 | 764 |
min | 737 | 735 | 733 | 738 | 746 | 745 | 739 | 743 | 745 | 747 |
mах | 769 | |||||||||
min | 733 | |||||||||
R | 36 | |||||||||
h | 4,712 | |||||||||
A1 | 730,6439790576 | |||||||||
Интервальный вариационный ряд продолжительнсоти горения лампочек | ||||||||||
N | Интервалы | Подсчет частот | Частота | Накопл. Частота | ||||||
a(i) | b(i) | |||||||||
1 | 730,644 | 735,356 | !! | 2 | 2 | |||||
2 | 735,356 | 740,068 | !!!!!!!! | 8 | 10 | |||||
3 | 740,068 | 744,780 | !!!!!! | 6 | 16 | |||||
4 | 744,780 | 749,492 | !!!!!!!!!!!!!!!!!! | 18 | 34 | |||||
5 | 749,492 | 754,204 | !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! | 35 | 69 | |||||
6 | 754,204 | 758,916 | !!!!!!!!!!!! | 12 | 81 | |||||
7 | 758,916 | 763,628 | !!!!!!!!!!! | 11 | 92 | |||||
8 | 763,628 | 768,340 | !!!!!! | 6 | 98 | |||||
9 | 768,340 | 773,052 | !! | 2 | 100 | |||||
Вспомогательная таблица 1 | ||||||||||
N | Xi | Mi | Xi*Mi | D*Mi | D^2*Mi | D^3*Mi | D^4*Mi | |||
1 | 733,00 | 2 | 1466 | -37,51 | 703,42 | -13191,8783708821 | 247399,52 | |||
2 | 737,71 | 8 | 5901,6963350785 | -112,34 | 1577,40 | -22149,6162233764 | 311022,36 | |||
3 | 742,42 | 6 | 4454,5445026178 | -55,98 | 522,28 | -4872,7513193052 | 45462,00 | |||
4 | 747,14 | 18 | 13448,4502617801 | -83,12 | 383,83 | -1772,467002331 | 8184,90 | |||
5 | 751,85 | 35 | 26314,6858638743 | 3,30 | 0,31 | 0,0292944574 | 0,00 | |||
6 | 756,56 | 12 | 9078,722513089 | 57,68 | 277,20 | 1332,3219652028 | 6403,52 | |||
7 | 761,27 | 11 | 8373,9947643979 | 104,70 | 996,58 | 9485,8056000173 | 90288,98 | |||
8 | 765,98 | 6 | 4595,9057591623 | 85,38 | 1215,02 | 17290,1796534403 | 246045,59 | |||
9 | 770,70 | 2 | 1541,3926701571 | 37,88 | 717,63 | 13593,634277098 | 257496,17 | |||
Всего | 100 | 75175,3926701571 | 0,00 | 6393,67 | -284,74 | 1212303,04 | ||||
Xср | 751,75 | |||||||||
Центр М1 | 0,00 | |||||||||
Центр М2 | 63,94 | |||||||||
Центр М3 | -2,85 | |||||||||
Центр М4 | 12123,03 | |||||||||
Дисперсия | 63,94 | |||||||||
Среднеквадр откл | 7,996 | |||||||||
Ас | -0,0055696262 | |||||||||
Ek | -0,0344155391 | |||||||||
Ме | 751,646 | |||||||||
Mo | 751,4947643979 | |||||||||
Vs | 1,06% | |||||||||
Графическое отображение | ||||||||||
Интервалы | Хi | Mi | Wi | Wi накопл | Wi / h | |||||
a(i) | b(i) | |||||||||
730,644 | 735,356 | 733,00 | 2 | 0,02 | 0,02 | 0,004 | 0 | 2,356 | ||
735,356 | 740,068 | 737,71 | 8 | 0,08 | 0,1 | 0,017 | 4,712 | 7,068 | ||
740,068 | 744,780 | 742,42 | 6 | 0,06 | 0,16 | 0,013 | 9,424 | 11,780 | ||
744,780 | 749,492 | 747,14 | 18 | 0,18 | 0,34 | 0,038 | 14,136 | 16,492 | ||
749,492 | 754,204 | 751,85 | 35 | 0,35 | 0,69 | 0,074 | 18,848 | 21,204 | ||
754,204 | 758,916 | 756,56 | 12 | 0,12 | 0,81 | 0,025 | 23,560 | 25,916 | ||
758,916 | 763,628 | 761,27 | 11 | 0,11 | 0,92 | 0,023 | 28,272 | 30,628 | ||
763,628 | 768,340 | 765,98 | 6 | 0,06 | 0,98 | 0,013 | 32,984 | 35,340 | ||
768,340 | 773,052 | 770,70 | 2 | 0,02 | 1 | 0,004 | 37,696 | 40,052 | ||
Расчет для построения теоритических кривых нормального распределения | ||||||||||
Интервалы | Mi | T1 | T2 | 1/2Ф(T1) | 1/2Ф(T2) | Pi | ||||
a(i) | b(i) | |||||||||
730,644 | 735,356 | 2 | -2,640 | -2,051 | 0,4958 | 0,4798 | -0,0080 | |||
735,356 | 740,068 | 8 | -2,051 | -1,461 | 0,4798 | 0,4279 | -0,0260 | |||
740,068 | 744,780 | 6 | -1,461 | -0,872 | 0,4279 | 0,3078 | -0,0601 | |||
744,780 | 749,492 | 18 | -0,872 | -0,283 | 0,3078 | 1,1103 | 0,4013 | |||
749,492 | 754,204 | 35 | -0,283 | 0,306 | 0,0300 | 0,6619 | 0,3160 | |||
754,204 | 758,916 | 12 | 0,306 | 0,896 | 0,1179 | 0,3133 | 0,0977 | |||
758,916 | 763,628 | 11 | 0,896 | 1,485 | 0,3133 | 0,4306 | 0,0587 | |||
763,628 | 768,340 | 6 | 1,485 | 2,074 | 0,4306 | 0,4808 | 0,0251 | |||
768,340 | 773,052 | 2 | 2,074 | 2,664 | 0,4808 | 0,4960 | 0,0076 | |||
Pi*n | Mi(теор) | Mi(теор)/h | Mi(теор)накоп | |||||||
-0,8000 | 1 | 0,002 | 0,0080 | |||||||
-2,5950 | 3 | 0,006 | 0,0340 | |||||||
-6,0050 | 6 | 0,013 | 0,0940 | |||||||
40,1250 | 40 | 0,085 | 0,4953 | |||||||
31,5950 | 32 | 0,068 | 0,8153 | |||||||
9,7700 | 10 | 0,021 | 0,9130 | |||||||
5,8650 | 6 | 0,012 | 0,9716 | |||||||
2,5100 | 3 | 0,005 | 0,9967 | |||||||
0,7600 | 1 | 0,002 | 1,0000 | |||||||
100 | ||||||||||
Расчет проверки гепотез | ||||||||||
Интервалы | Mi(Практ) | Mi(теор) | (Mi-Mi(теор))^2 | …../Mi(теор) | ||||||
a(i) | b(i) | |||||||||
730,644 | 735,356 | 2 | 2 | 9 | 1,29 | |||||
735,356 | 740,068 | 8 | 5 | |||||||
740,068 | 744,780 | 6 | 13 | 49 | 3,88 | |||||
744,780 | 749,492 | 18 | 21 | 9 | 0,43 | |||||
749,492 | 754,204 | 35 | 25 | 100 | 4,01 | |||||
754,204 | 758,916 | 12 | 21 | 81 | 3,89 | |||||
758,916 | 763,628 | 11 | 12 | 1 | 0,08 | |||||
763,628 | 768,340 | 6 | 5 | 1 | 0,14 | |||||
768,340 | 773,052 | 2 | 2 | |||||||
X^2набл | 13,71 |
Интервалы | Хi | Mi | Xi-Xср | t=(Xi-Xср)/s | F(t) | |
a(i) | b(i) | |||||
730,644 | 735,356 | 733,00 | 2 | -18,75 | 2,3449224612 | 0,0255 |
735,356 | 740,068 | 737,71 | 8 | -14,04 | 1,7556225757 | 0,0854 |
740,068 | 744,780 | 742,42 | 6 | -9,33 | 1,1663226901 | 0,2021 |
744,780 | 749,492 | 747,14 | 18 | -4,61 | 0,5770228046 | 0,3378 |
749,492 | 754,204 | 751,85 | 35 | 0,10 | 0,0122770809 | 0,3989 |
754,204 | 758,916 | 756,56 | 12 | 4,81 | 0,6015769665 | 0,3329 |
758,916 | 763,628 | 761,27 | 11 | 9,52 | 1,190876852 | 0,1963 |
763,628 | 768,340 | 765,98 | 6 | 14,23 | 1,7801767376 | 0,0818 |
768,340 | 773,052 | 770,70 | 2 | 18,95 | 2,3694766231 | 0,0241 |
Теоретич Частоты | Mi(теор)/h | Mi(теор) накопл | ||||
Исчисл | Округл | |||||
1,5958591137 | 2 | 0,0033867978 | 0,0033867978 | |||
5,3422001485 | 5 | 0,0113374366 | 0,0147242344 | |||
12,6364890652 | 13 | 0,0268176763 | 0,0415419107 | |||
21,1209457267 | 21 | 0,0448237388 | 0,0863656495 | |||
24,9448535833 | 25 | 0,0529389932 | 0,1393046427 | |||
20,817531073 | 21 | 0,0441798198 | 0,1834844625 | |||
12,2760358454 | 12 | 0,0260527077 | 0,2095371701 | |||
5,1152602944 | 5 | 0,0108558156 | 0,2203929857 | |||
1,5061145084 | 2 | 0,0031963381 | 0,2235893238 |