Оценивание параметров и проверка гипотез о нормальном распределении (WinWord, Excel)

Кафедра математической статистики и эконометрики

Расчетная работа №1

По курсу:

“Математическая статистика”

по теме:

“Оценивание параметров

и проверка гипотез

о нормальном распределении”

Группа: ДИ 202

Студент: Шеломанов Р.Б.

Руководитель: Кацман В.Е.

Москва 1999

Содержание

ЗАДАНИЕ № 23 3

Построение интервального вариационного ряда распределения 3

Вычисление выборочных характеристик распределения 4

Графическое изображение вариационных рядов 5

Расчет теоретической нормальной кривой распределения 6

Проверка гипотез о нормальном законе распределения 7

ЗАДАНИЕ № 23

Продолжительность горения электролампочек (ч) следующая:

750

750

756

769

757

767

760

743

745

759

750

750

739

751

746

758

750

758

753

747

751

762

748

750

752

763

739

744

764

755

751

750

733

752

750

763

749

754

745

747

762

751

738

766

757

769

739

746

750

753

738

735

760

738

747

752

747

750

746

748

742

742

758

751

752

762

740

753

758

754

737

743

748

747

754

754

750

753

754

760

740

756

741

752

747

749

745

757

755

764

756

764

751

759

754

745

752

755

765

762

По выборочным данным, представленным в заданиях №1-30, требуется:

1* Построить интервальный вариационный ряд распределения;

Построение интервального вариационного ряда распределения

Max: 769

Min: 733

R=769-733=36

H= R / 1+3,32 lg n=36/(1+3,32lg100)=4,712

A1= x min - h/2=730,644

B1=A1+h; B2=A2+h



2* Вычислить выборочные характеристики по вариационному ряду:

среднюю арифметическую (x ср.), центральные моменты (мю к, к=1,4), дисперсию (S^2), среднее квадратическое отклонение (S), коэффициенты асимметрии (Ас) и эксцесса (Ек), медиану (Ме), моду (Мо), коэффициент вариации(Vs);

Вычисление выборочных характеристик распределения

i=(x>i>- x>ср>)

x>ср> = xi mi/ mi

x>ср >= 751,7539

Вспомогательная таблица ко второму пункту расчетов

Выборочный центральный момент К-го порядка равен

M k = ( xi - x)^k mi/ mi

В нашем примере:

Центр момент 1

0,00

Центр момент 2

63,94

Центр момент 3

-2,85

Центр момент 4

12123,03

Выборочная дисперсия S^2 равна центральному моменту второго порядка:

В нашем примере:

S^2= 63,94

Ввыборочное среднее квадратическое отклонение:

В нашем примере:

S= 7,996

Выборочные коэффициенты асимметрии Ас и эксцесса Fk по формулам

Ac = m3/ S^3;

В нашем примере:

Ас =-0,00557

Ek = m4/ S^4 -3;

В нашем примере:

Ek = -0,03442

Медиана Ме - значение признака x (e), приходящееся на середину ранжированного ряда наблюдений ( n = 2l -1). При четном числе наблюдений( n= 2l) медианой Ме является средняя арифметическая двух значений, расположенных в середине ранжированного ряда: Me=( x(e) + x( e+1) /2

Если исходить из интервального ряда, то медиану следует вычислять по ормуле

Me= a me +h * ( n/2 - mh( me-1) / m me

где mе- означает номер медианного интервала, ( mе -1) - интервала, редшествующего медианому.

В нашем примере:

Me=751,646

Мода Мо для совокупности наблюдений равна тому значению признака , которому соответствует наибольшая частота.

Для одномодального интервального ряда вычисление моды можно производить по формуле

Mo= a mo + h * ( m mo- m(mo-1))/2 m mo- m( mo-1) - m( mo+1)

где мо означает номер модального интервала ( интервала с наибольшей частотой), мо-1, мо+1- номера предшествующего модальному и следующего за ним интервалов.

В нашем примере:

Mo = 751,49476

Так как Х>ср>, Mo Me почти не отличаются друг от друга, есть основания предполагать теоретическое распределение нормальным.

Коэффициент вариации Vs = S/ x * 100 %= 3.06%

В нашем примере:

Vs= 1,06%

3* Построить гистограмму, полигон и кумуляту.

Графическое изображение вариационных рядов

Для визуального подбора теоретического распределения, а также выявления положения среднего значения (x ср.) и характера рассеивания (S^2 и S) вариационные ряды изображают графически.

Полигон и кумулята применяются для изображения как дискретных, так и интервальных рядов, гистограмма – для изображения только интервальных рядов. Для построения этих графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот (частостей)

Wi=mi/n, накопленных относительных частот Whi и найдем отношение Wi/h, заполнив таблицу 1.4.

Интервалы xi Wi Whi Wi/h

Ai-bi

1 2 3 4 5

4,97-5,08 5,03 0,02 0.02 0,18

5,08-5,19 5,14 0,03 0,05 0,27

5,19-5,30 5,25 0.12 0,17 1,09

5,30-5,41 5,36 0,19 0,36 1,73

5,41-5,52 5,47 0,29 0,65 2,64

5,52-5,63 5,58 0,18 0,83 1,64

5,63-5,74 5,69 0,13 0,96 1,18

5,74-5,85 5,80 0,04 1,00 0,36

- 1,00 -

Для построения гистограммы относительных частот (частостей) на оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте Wi данного i-го интервала. Тогда высота элементарного прямоугольника должна быть равна Wi/h,. Следовательно, позади под гистограммой равна сумме всех носительных частот, т.е. единице.

Из гистограммы можно получить полигон того же распределения. Если середины верхних оснований прямоугольников соединить отрезками прямой.

4* Сделать вывод о форме ряда распределения по виду гистограммы и полигона, а также по значениям коэффициентов Ас и Ек.

4 Анализ графиков и выводы

Гистограмма и полигон являются аппроксимациями кривой плотности (дифференциальной функции) теоретического распределения (генеральной совокупности). Поэтому по их виду можно судить о гипотическом законе распределения.

Для построения кумуляты дискретного ряда по оси абсцисс откладывают значения признака xi, а по оси ординат – накопленные относительные частоты Whi. Для интервального ряда по оси абсцисс откладывают интервалы .

С кумулятой сопоставляется график интегральной функции распределения F(x).

В нашем примере коэффициенты асимметрии и эксцесса не намного отличаются от нуля. Коэффициент асимметрии оказался отрицательным (Ас=-0,005), что свидетельствует о небольшой левосторонней асимметрии данного распределения. Эксцесс оказался также отрицательным (Ек= -0,034). Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальной, имеет несколько более плоскую вершину. Гистограмма и полигон напоминают кривую нормального распределения (рис.1.1 и 1.2.). Все это дает возможность выдвинуть гипотезу о том, что распределение продолжительности горения электролампочек является нормальным.

Приечание: Кумулята, гистронрамма и полигон находятся в приложениях к работе.

5* Рассчитать плотность и интегральную функцию теоретического нормального распределения и построить эти кривые на графиках гистограммы и кумуляты соответственно.

Расчет теоретической нормальной кривой распределения

Приведем один из способов расчета теоретического нормального распределения по двум найденным выборочным характеристикам x и S эмпирического ряда.

При расчете теоретических частот m^тi за оценку математического ожидания (мю) и среднего квадратического отклонения G нормального закона распределения принимают значения соответствующих выборочных характеристик x ср. и S, т.е. (мю)=Xср.= 751,7539; G=S=7,99.

Теоретические частоты находят по формуле: M^i=npi,

где n – объем; Pi – величина попадания значения нормально распределенной случайной величины в i-й интервал.

Вероятность Pi определяется по формуле

Pi=P(ai<x<=bi)=1/2[Ф(t2i)-Ф(t1i)],

Где Ф(t)=2\ 2(пи)=интегралу с границами от (0;t) е^x2/2dx - интегральная функция Лапласа – находится по таблице для

T2i=bi-x ср.\ S

T1i=ai-x ср.\S

Таблицы Для вычисления вероятности нормальной кривой распределения

Интервалы

Mi

T1

T2

1/2Ф(T1)

1/2Ф(T2)

Pi

a(i)

b(i)

730,644

735,356

2

-2,640

-2,051

0,4958

0,4798

-0,0080

735,356

740,068

8

-2,051

-1,461

0,4798

0,4279

-0,0260

740,068

744,780

6

-1,461

-0,872

0,4279

0,3078

-0,0601

744,780

749,492

18

-0,872

-0,283

0,3078

1,1103

0,4013

749,492

754,204

35

-0,283

0,306

0,0300

0,6619

0,3160

754,204

758,916

12

0,306

0,896

0,1179

0,3133

0,0977

758,916

763,628

11

0,896

1,485

0,3133

0,4306

0,0587

763,628

768,340

6

1,485

2,074

0,4306

0,4808

0,0251

768,340

773,052

2

2,074

2,664

0,4808

0,4960

0,0076

Pi*n

Mi(теор)

Mi(теор)/h

Mi(теор)накоп

-0,8000

1

0,002

0,0080

-2,5950

3

0,006

0,0340

-6,0050

6

0,013

0,0940

40,1250

40

0,085

0,4953

31,5950

32

0,068

0,8153

9,7700

10

0,021

0,9130

5,8650

6

0,012

0,9716

2,5100

3

0,005

0,9967

0,7600

1

0,002

1,0000

100

Сравнение гистограммы и нормальной кривой наглядно показывает согласованность между теоретическим и эмпирическим распределением.

Примечание: Построенные графики находятся в приложениях к работе.

6* Проверить гипотезу о нормальном законе распределения по критерию согласи яПирсона f^2).

Проверка гипотез о нормальном законе распределения

Частоты для проверки соответствия эмпирического ряда распределения нормальному закону используют критерий X^2, основанный на сравнении эмпирических частот mi с теоретическими m^тi, которые можно ожидать при принятии определенной нулевой гипотезы.

Значение X^2набл. – наблюдаемое значение критерия, полученное по результатам наблюдений, равно

к

F^2набл.= (mi-m^тi)

I=1 m^i

Где к – число интервалов (после объединения). M^i – теоретические частоты. Все вспомогательные расчеты, необходимые для вычисления f^2, сведем в таблицу 1.6.

Таблица 1.6.

Вычисление критерия X^2 при проверке нормальности продолжительности горения электролампочек

Интервалы

Mi(Практ)

Mi(теор)

(Mi-Mi(теор))^2

…../Mi(теор)

a(i)

b(i)

730,644

735,356

2

2

9

1,29

735,356

740,068

8

5

740,068

744,780

6

13

49

3,88

744,780

749,492

18

21

9

0,43

749,492

754,204

35

25

100

4,01

754,204

758,916

12

21

81

3,89

758,916

763,628

11

12

1

0,08

763,628

768,340

6

5

1

0,14

768,340

773,052

2

2

X^2набл

13,71

Правило проверки гипотезы заключается в следующем. Определяем по таблице распределения xu-квадрат критическое значение X^2кр.(альфа для числа степеной свободы V=к-3 и заданного уровня значимости альфа. Затем сравниваем X^2кр.

Если X^2 набл.<=X^2кр. , то выдвинутая гипотеза о законе распределения не отвергается (не противоречит опытным данным).

Если X^2 набл. >X^2кр. , то выдвинутая гипотеза о нормальном законе распределения отвергается с вероятностью ошибки .

Для нашего примера X^2набл.=13,71, =0,005, V=7-3=4 (число интервалов после объединения стало равным 7) и X^2кр. (0,005; 4) =14,9

Так как X^2набл.<X^2кр., то согласно критерию Пирсона гипотеза о нормальном законе не отвергается с вероятностью ошибки 0,005. Можно сделать вывод, что распределение продолжительности горения электролампочек является нормальным. Что подтверждают графики и значения моды и медианы.


Overview

Гистрограмма
Полигон
Кумулята
Лист1


Sheet 1: Гистрограмма



Sheet 2: Полигон



Sheet 3: Кумулята



Sheet 4: Лист1


750 750 756 769 757 767 760 743 745 759

750 750 739 751 746 758 750 758 753 747

751 762 748 750 752 763 739 744 764 755

751 750 733 752 750 763 749 754 745 747

762 751 738 766 757 769 739 746 750 753

738 735 760 738 747 752 747 750 746 748

742 742 758 751 752 762 740 753 758 754

737 743 748 747 754 754 750 753 754 760

740 756 741 752 747 749 745 757 755 764

756 764 751 759 754 745 752 755 765 762
max 762 764 760 769 757 769 760 758 765 764
min 737 735 733 738 746 745 739 743 745 747

mах 769

min 733

R 36

h 4,712

A1 730,6439790576
Интервальный вариационный ряд продолжительнсоти горения лампочек
N Интервалы Подсчет частот Частота Накопл. Частота
a(i) b(i)
1 730,644 735,356 !! 2 2
2 735,356 740,068 !!!!!!!! 8 10
3 740,068 744,780 !!!!!! 6 16
4 744,780 749,492 !!!!!!!!!!!!!!!!!! 18 34
5 749,492 754,204 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 35 69
6 754,204 758,916 !!!!!!!!!!!! 12 81
7 758,916 763,628 !!!!!!!!!!! 11 92
8 763,628 768,340 !!!!!! 6 98
9 768,340 773,052 !! 2 100
Вспомогательная таблица 1
N Xi Mi Xi*Mi D*Mi D^2*Mi D^3*Mi D^4*Mi
1 733,00 2 1466 -37,51 703,42 -13191,8783708821 247399,52
2 737,71 8 5901,6963350785 -112,34 1577,40 -22149,6162233764 311022,36
3 742,42 6 4454,5445026178 -55,98 522,28 -4872,7513193052 45462,00
4 747,14 18 13448,4502617801 -83,12 383,83 -1772,467002331 8184,90
5 751,85 35 26314,6858638743 3,30 0,31 0,0292944574 0,00
6 756,56 12 9078,722513089 57,68 277,20 1332,3219652028 6403,52
7 761,27 11 8373,9947643979 104,70 996,58 9485,8056000173 90288,98
8 765,98 6 4595,9057591623 85,38 1215,02 17290,1796534403 246045,59
9 770,70 2 1541,3926701571 37,88 717,63 13593,634277098 257496,17
Всего
100 75175,3926701571 0,00 6393,67 -284,74 1212303,04



Xср 751,75

Центр М1 0,00

Центр М2 63,94

Центр М3 -2,85

Центр М4 12123,03
Дисперсия 63,94
Среднеквадр откл 7,996

Ас -0,0055696262

Ek -0,0344155391

Ме 751,646

Mo 751,4947643979

Vs 1,06%

Графическое отображение


Интервалы Хi Mi Wi Wi накопл Wi / h

a(i) b(i)

730,644 735,356 733,00 2 0,02 0,02 0,004 0 2,356

735,356 740,068 737,71 8 0,08 0,1 0,017 4,712 7,068

740,068 744,780 742,42 6 0,06 0,16 0,013 9,424 11,780

744,780 749,492 747,14 18 0,18 0,34 0,038 14,136 16,492

749,492 754,204 751,85 35 0,35 0,69 0,074 18,848 21,204

754,204 758,916 756,56 12 0,12 0,81 0,025 23,560 25,916

758,916 763,628 761,27 11 0,11 0,92 0,023 28,272 30,628

763,628 768,340 765,98 6 0,06 0,98 0,013 32,984 35,340

768,340 773,052 770,70 2 0,02 1 0,004 37,696 40,052


Расчет для построения теоритических кривых нормального распределения


Интервалы Mi T1 T2 1/2Ф(T1) 1/2Ф(T2) Pi

a(i) b(i)

730,644 735,356 2 -2,640 -2,051 0,4958 0,4798 -0,0080

735,356 740,068 8 -2,051 -1,461 0,4798 0,4279 -0,0260

740,068 744,780 6 -1,461 -0,872 0,4279 0,3078 -0,0601

744,780 749,492 18 -0,872 -0,283 0,3078 1,1103 0,4013

749,492 754,204 35 -0,283 0,306 0,0300 0,6619 0,3160

754,204 758,916 12 0,306 0,896 0,1179 0,3133 0,0977

758,916 763,628 11 0,896 1,485 0,3133 0,4306 0,0587

763,628 768,340 6 1,485 2,074 0,4306 0,4808 0,0251

768,340 773,052 2 2,074 2,664 0,4808 0,4960 0,0076


Pi*n Mi(теор) Mi(теор)/h Mi(теор)накоп

-0,8000 1 0,002 0,0080



-2,5950 3 0,006 0,0340



-6,0050 6 0,013 0,0940



40,1250 40 0,085 0,4953



31,5950 32 0,068 0,8153



9,7700 10 0,021 0,9130



5,8650 6 0,012 0,9716



2,5100 3 0,005 0,9967



0,7600 1 0,002 1,0000




100



Расчет проверки гепотез


Интервалы Mi(Практ) Mi(теор) (Mi-Mi(теор))^2 …../Mi(теор)

a(i) b(i)

730,644 735,356 2 2 9 1,29

735,356 740,068 8 5

740,068 744,780 6 13 49 3,88

744,780 749,492 18 21 9 0,43

749,492 754,204 35 25 100 4,01

754,204 758,916 12 21 81 3,89

758,916 763,628 11 12 1 0,08

763,628 768,340 6 5 1 0,14

768,340 773,052 2 2





X^2набл 13,71
Интервалы Хi Mi Xi-Xср t=(Xi-Xср)/s F(t)
a(i) b(i)
730,644 735,356 733,00 2 -18,75 2,3449224612 0,0255
735,356 740,068 737,71 8 -14,04 1,7556225757 0,0854
740,068 744,780 742,42 6 -9,33 1,1663226901 0,2021
744,780 749,492 747,14 18 -4,61 0,5770228046 0,3378
749,492 754,204 751,85 35 0,10 0,0122770809 0,3989
754,204 758,916 756,56 12 4,81 0,6015769665 0,3329
758,916 763,628 761,27 11 9,52 1,190876852 0,1963
763,628 768,340 765,98 6 14,23 1,7801767376 0,0818
768,340 773,052 770,70 2 18,95 2,3694766231 0,0241



Теоретич Частоты Mi(теор)/h Mi(теор) накопл
Исчисл Округл
1,5958591137 2 0,0033867978 0,0033867978
5,3422001485 5 0,0113374366 0,0147242344
12,6364890652 13 0,0268176763 0,0415419107
21,1209457267 21 0,0448237388 0,0863656495
24,9448535833 25 0,0529389932 0,1393046427
20,817531073 21 0,0441798198 0,1834844625
12,2760358454 12 0,0260527077 0,2095371701
5,1152602944 5 0,0108558156 0,2203929857
1,5061145084 2 0,0031963381 0,2235893238