Методика обработки экспериментальных данных (работа 1)

Задание на курсовую работу

  1. Построить вариационный ряд

  2. Рассчитать числовые характеристики статистического ряда:

а) Размах варьирования.

б) Среднее арифметическое значение.

в) Оценки дисперсии.

г) Оценки среднеквадратического отклонения.

д) Мода.

е) Медиана.

ж) Коэффициент вариации.

  1. Построить полигон и гистограмму относительных частот.

  2. Построить эмпирическую функцию распределения.

  3. Построить статистическую проверку гипотезы по нормальному распределению с помощью критерии Пирсона или Колмогорова.

  4. Вычислить асимметрию и эксцесс.

  5. Построить доверительные интервалы, для математического ожидания и среднеквадратического отклонения для надежности 95%.

  6. Выводы.

Данные по выборке вариант 34

-678

-752

-624

-727

-612

-632

-704

-697

-627

-727

-561

-748

-686

-676

-676

-696

-717

-694

-700

-707

-680

-681

-687

-656

-692

-644

-805

-758

-695

-722

-706

-704

-681

-608

-647

-699

-658

-686

-689

-643

-701

-716

-731

-623

-693

-703

-731

-700

-765

-697

-662

-705

-667

-677

-701

-678

-667

-673

-697

-701

-597

-716

-689

-694

-695

-729

-700

-717

-647

-673

-690

-578

-703

-688

-666

-670

-671

-693

-688

-646

-667

-689

-711

-731

-604

-691

-675

-686

-670

-703

-696

-702

-660

-662

-681

-666

-677

-645

-746

-685

1. Построение вариационного ранжированного ряда

Сортируем экспериментальные данные по возрастанию. Получаем вариационный ряд.

Таблица 1

-805

-727

-705

-700

-695

-689

-681

-673

-662

-632

-765

-727

-704

-700

-694

-688

-680

-671

-660

-627

-758

-722

-704

-700

-694

-688

-678

-670

-658

-624

-752

-717

-703

-699

-693

-687

-678

-670

-656

-623

-748

-717

-703

-697

-693

-686

-677

-667

-647

-612

-746

-716

-703

-697

-692

-686

-677

-667

-647

-608

-731

-716

-702

-697

-691

-686

-676

-667

-646

-604

-731

-711

-701

-696

-690

-685

-676

-666

-645

-597

-731

-707

-701

-696

-689

-681

-675

-666

-644

-578

-729

-706

-701

-695

-689

-681

-673

-662

-643

-561

Вывод: Вариационный ряд послужит нам для облегчения дальнейших расчетов, и для определения относительных частот и разделения на интервалы и расчета ряда числовых характеристик.

2. Расчет числовых характеристик статистического ряда

2.1 Размах варьирования

Размах варьирования вычисляется по формуле:

(2.1)

где R – размах варьирования;

x>max> – максимальный элемент вариационного ряда;

x>min>> >– минимальный элемент вариационного ряда;

x>max>= – 561

x>min>> >= -805

R = -561+805=244

2.2 Среднеарифметическое значение статистического ряда



(2.2)

где n>i> – частота варианты x>i>;

x>i> – варианта выборки;

n = ∑ n>i> – объем выборки;

Распределение выборки представлено в таблице 2.

Таблица 2

Xi

n

Xi

n

Xi

n

Xi

n

Xi

n

Xi

n

Xi

n

-805

1

-717

2

-700

3

-689

3

-675

1

-647

2

-608

1

-765

1

-716

2

-699

1

-688

2

-673

2

-646

1

-604

1

-758

1

-711

1

-697

3

-687

1

-671

1

-645

1

-597

1

-752

1

-707

1

-696

2

-686

3

-670

2

-644

1

-578

1

-748

1

-706

1

-695

2

-685

1

-667

3

-643

1

-561

1

-746

1

-705

1

-694

2

-681

3

-666

2

-632

1

-731

3

-704

2

-693

2

-680

1

-662

2

-627

1

-729

1

-703

3

-692

1

-678

2

-660

1

-624

1

-727

2

-702

1

-691

1

-677

2

-658

1

-623

1

-722

1

-701

3

-690

1

-676

2

-656

1

-612

1

2.3 Оценка дисперсии

(2.3)

где s2 – несмещенная оценка генеральной дисперсии;

2.4 Оценка среднего квадратического отклонения

(2.4)

2.5 Определение моды

Модой называют варианту с наибольшей частотой повторений.

Из таблицы 2 находим, что наибольшую частоту n=3 имеют варианты x = -731, x = -703, x = -701, x = -700, x = -697, x = -689, x = -686, x = -681, x = -667.

2.6 Определение медианы

Если количество вариант число четное, то медиана вычисляется по формуле:

М>В>=(x>k>+x>k>>+1>)/2 (2.5.)

где x>k> – пятидесятый член вариационного ряда;

x>k+1> – пятьдесят первый член вариационного ряда;

nКоличество вариант и n=2*k

М>В>=(x>k>+x>k>>+1>)/2=(-689–689)/2= -689

2.7 Расчет коэффициента вариации

Расчет коэффициента вариации проведем по формуле:

(2.6)

Вывод:

Размах варьирования является простейшей характеристикой рассеяния вариационного ряда.

Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводные характеристики – генеральную дисперсию и средним квадратическим отклонением.

Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент больше (эта величина безразмерная поэтому он пригоден для сравнения вариационных рядов, варианты которых имеют различную размерность.

В целом числовые характеристики служат для сравнения рассеяния вариационных рядов в сравнении с аналогичными числовыми характеристиками других вариационных рядов.

3. Построение полигона и гистограммы относительных частот

Для построения гистограммы и полигона относительных частот поделим вариационный ряд (табл. 1) на частичные интервалы. Результаты занесем в таблицу 3.

Таблица 3

Номер интервала

I

Частичный интервал x>i>–x>x>>+1>

Сумма относительных частот

w>i>

Плотность частот

x>i>

x>x>>+1>

1

-805

-780,6

0,01

0,00041

2

-780,6

-756,2

0,02

0,00082

3

-756,2

-731,8

0,03

0,00123

4

-731,8

-707,4

0,12

0,00492

5

-707,4

-683

0,4

0,01639

6

-683

-658,6

0,24

0,00984

7

-658,6

-634,2

0,08

0,00328

8

-634,2

-609,8

0,05

0,00205

9

-609,8

-585,4

0,03

0,00123

10

-585,4

-561

0,02

0,00082

По таб. 3 строим гистограмму относительных частот (рис. 1).

Полигон получаем соединением вершин столбцов гистограммы. (рис. 1) Полигон получаем соединением вершин столбцов гистограммы.

Рис 1.

Вывод: Полигон и гистограмму – графики статистического распределения строят для наглядности относительных частот в выборке.

4. Построение эмпирической функции распределения

Эмпирическая функция распределения выборки находится по формуле:

(4.1)

где n>x> – число вариант меньших х;

n объем выборки.

По формуле (4.1) построим эмпирическую функцию распределения.

Для более точного и правильного построения возьмем середины интервалов:

F(x)

Интервал

0

X<

-792,8

0,01

-792,8

<x<

-768,4

0,02

-768,4

<x<

-744

0,03

-744

<x<

-719,6

0,05

-719,6

<x<

-695,2

0,08

-695,2

<x<

-670,8

0,12

-670,8

<x<

-646,4

0,19

-646,4

<x<

-622

0,27

-622

<x<

-597,6

0,41

-597,6

<x<

-573,2

0,67

-573,2

<x<

-548,8

1

x>

-548,8

Вывод:

Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности

5. Статистическая проверка гипотезы о нормальном распределении с помощью критерия Пирсона или Колмагорова

Проверку проводим с помощью критерия Пирсона.

В этом задании, с помощью критерии Пирсона проверим гипотезу о нормальном распределении генеральной совокупности, с этой целью будем сравнивать эмпирические и теоретические частоты.

– Среднее арифметическое значение

– Количество вариантов

– Шаг интервалов

– Оценка среднеквадратического отклонения.

Вычислим данные по таблице:

I

ni

Xi

X (i+1)

Zi

Z (I+1)

1

1

-805

-780,6

-2,7340

-0,5

-0,469

3,1

1,4226

0,3226

2

1

-780,6

-756,2

-2,7340

-2,1140

-0,469

-0,408

6,1

4,2639

0,1639

3

4

-756,2

-731,8

-2,1140

-1,4941

-0,408

-0,285

12,3

5,6008

1,3008

4

7

-731,8

-707,4

-1,4941

-0,8741

-0,285

-0,099

18,6

7,2344

2,6344

5

26

-707,4

-683

-0,8741

-0,2542

-0,099

0,1141

21,31

1,0322

31,7222

6

33

-683

-658,6

-0,2542

0,3658

0,1141

0,2939

17,98

12,5473

60,5673

7

14

-658,6

-634,2

0,3658

0,9857

0,2939

0,4131

11,92

0,3630

16,4430

8

8

-634,2

-609,8

0,9857

1,6057

0,4131

0,4713

5,82

0,8166

10,9966

9

3

-609,8

-585,4

1,6057

2,2256

0,4713

0,4927

2,14

0,3456

4,2056

10

3

-585,4

-561

2,2256

0,4927

0,5

0,73

7,0588

12,3288

СУММА

100

100

40,6851

140,6851

X2>набл>=40,685

Контроль: 140,685–100=40,685

Исходя из требований, чтобы вероятность попадания критерия в критическую область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости .

Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы – неравенством.

Уровень значимости = 0,05;

По таблице критических точек распределения χ² (приложение 3), по уровню значимости α = 0,05 и числу степеней свободы K=10–3=7 находим критическую точку правосторонней критической области χ²кр (0,05; 7) = 14,1.

Вывод: Так как X2>набл>> X2>кр,> то нулевую гипотезу отвергают, значит гипотезу о нормальном распределении отвергают.

6. Расчет асимметрии и эксцесса

Асимметрия – отношение центрального момента 3-го порядка к кубу среднего квадратического отклонения.

, где

Эксцесс – характеристика «крутости» рассматриваемой случайной величины.

, где

Значение Х>В, > вычисляем по формулам:

,

где С – Ложный нуль (варианта, которая имеет наибольшую частоту).

,

где h – шаг (разность между двумя соседними вариантами);

(условный момент второго порядка);

(условный момент первого порядка);

(условная варианта).

Расчеты занесем в таблицу 7:

X>i>

N>i>

U>i>

X>B>

M>1>

M>2>

m3

m4

A>S>

E>K>

-805

1

-2,73

-684,67

0,30

1,06

23,97

3433,28

4193007,72

0,25

12,71

-780,6

1

-2,11

-756,2

4

-1,49

-731,8

7

-0,87

-707,4

26

-0,25

-683

33

0,37

-658,6

14

0,99

-634,2

8

1,61

-609,8

3

2,23

-585,4

3

2,85

Вывод:

Т.к. асимметрия положительна то ‘длинная часть’ кривой распределения расположена справа от математического ожидания или мода.

Т.к. Эксцесс больше нуля, то кривая распределения имеет более высокую и ‘острую’ вершину, чем нормальная кривая.

7. Построение доверительного интервала для математического ожидания и среднего квадратического отклонения

Доверительный интервал для математического ожидания (с вероятностью ) находят как:

(7.1)

где n – объем выборки;

t>> – случайная величина имеющее распределение Стьюдента находим по приложению 1.

s – исправленное среднее квадратическое отклонение;

– выборочное среднее;

Найдем интервал:

по приложению 1 находим t>>> >= 1.984 при = 0.95 и n = 100;

=-684,67; s = 38,19;

Получаем

-692,25<a<-677.09

Доверительный интервал для среднего квадратического отклонения

(с надежностью ) находят как:

при q<1 (7.2)

при q>1 (7.3)

где q находят по приложению 2, по заданным n и ;

Исходя из приложения 2, n = 100 и = 0.95 находим q=0.143;

Поэтому интервал находим по формуле (7.2):

38.19(1-0.143)38.19(1+0.143) 35,58(1+0.143)


32.73   43.65

Вывод:

Итак, с надежностью 0,95 неизвестное математическое ожидание ‘а’ находится в доверительном интервале -692,25<a<-677.09, а неизвестное среднее квадратическое отклонение ‘’ находиться в доверительном интервале 32.73   43.65.

Вывод

Для представления генеральной совокупности я исследовала выборку, которая имеет объём 100 элементов.

Я нашла:

размах варьирования R=244;

среднеарифметическое значение статистического ряда =-684,67;

несмещенную оценку генеральной дисперсии s2=1458,99;

среднее квадратическое отклонение s=38,19;

медиану М>В>=-689 и коэффициент вариации V= 5,58%.

С надежностью 0.95 оценил математическое ожидание в интервале

-692,25 а  -677,09

и среднее квадратическое отклонение в интервале

32,73   43,65

Выборка имеет варианты x = -731, x = -703, x = -701, x = -700, x = -697, x = -689, x = -686, x = -681, x = -667, которые встречаются 3 раза.

На рис. 1 построила гистограмму и полигон относительных частот. По рис. 1 можно выдвинуть гипотезу о нормальном распределении генеральной совокупности.

После проверки гипотезы о нормальном распределении с помощью критерия Пирсона при =0.05, я отвергла ее. Из этого следует, что расхождения между практическими и теоретическими частотами значимо.

Асимметрия a>s>=0,25. Из этого следует, что правое крыло функции более вытянуто относительно ее моды.

Эксцесс e>k>=12,71. Из-за того, что у эксцесса положительный знак, эмпирическая функция распределения острее по сравнению с теоретическим распределением.

Список литературы

  1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высшая школа, 2001.

  1. Гмурман В.Е. Теория вероятностей и математическая статистика.

М.: Высшая школа, 2001.