Методика обработки экспериментальных данных (работа 1)
Задание на курсовую работу
Построить вариационный ряд
Рассчитать числовые характеристики статистического ряда:
а) Размах варьирования.
б) Среднее арифметическое значение.
в) Оценки дисперсии.
г) Оценки среднеквадратического отклонения.
д) Мода.
е) Медиана.
ж) Коэффициент вариации.
Построить полигон и гистограмму относительных частот.
Построить эмпирическую функцию распределения.
Построить статистическую проверку гипотезы по нормальному распределению с помощью критерии Пирсона или Колмогорова.
Вычислить асимметрию и эксцесс.
Построить доверительные интервалы, для математического ожидания и среднеквадратического отклонения для надежности 95%.
Выводы.
Данные по выборке вариант 34
-678 |
-752 |
-624 |
-727 |
-612 |
-632 |
-704 |
-697 |
-627 |
-727 |
-561 |
-748 |
-686 |
-676 |
-676 |
-696 |
-717 |
-694 |
-700 |
-707 |
-680 |
-681 |
-687 |
-656 |
-692 |
-644 |
-805 |
-758 |
-695 |
-722 |
-706 |
-704 |
-681 |
-608 |
-647 |
-699 |
-658 |
-686 |
-689 |
-643 |
-701 |
-716 |
-731 |
-623 |
-693 |
-703 |
-731 |
-700 |
-765 |
-697 |
-662 |
-705 |
-667 |
-677 |
-701 |
-678 |
-667 |
-673 |
-697 |
-701 |
-597 |
-716 |
-689 |
-694 |
-695 |
-729 |
-700 |
-717 |
-647 |
-673 |
-690 |
-578 |
-703 |
-688 |
-666 |
-670 |
-671 |
-693 |
-688 |
-646 |
-667 |
-689 |
-711 |
-731 |
-604 |
-691 |
-675 |
-686 |
-670 |
-703 |
-696 |
-702 |
-660 |
-662 |
-681 |
-666 |
-677 |
-645 |
-746 |
-685 |
1. Построение вариационного ранжированного ряда
Сортируем экспериментальные данные по возрастанию. Получаем вариационный ряд.
Таблица 1
-805 |
-727 |
-705 |
-700 |
-695 |
-689 |
-681 |
-673 |
-662 |
-632 |
-765 |
-727 |
-704 |
-700 |
-694 |
-688 |
-680 |
-671 |
-660 |
-627 |
-758 |
-722 |
-704 |
-700 |
-694 |
-688 |
-678 |
-670 |
-658 |
-624 |
-752 |
-717 |
-703 |
-699 |
-693 |
-687 |
-678 |
-670 |
-656 |
-623 |
-748 |
-717 |
-703 |
-697 |
-693 |
-686 |
-677 |
-667 |
-647 |
-612 |
-746 |
-716 |
-703 |
-697 |
-692 |
-686 |
-677 |
-667 |
-647 |
-608 |
-731 |
-716 |
-702 |
-697 |
-691 |
-686 |
-676 |
-667 |
-646 |
-604 |
-731 |
-711 |
-701 |
-696 |
-690 |
-685 |
-676 |
-666 |
-645 |
-597 |
-731 |
-707 |
-701 |
-696 |
-689 |
-681 |
-675 |
-666 |
-644 |
-578 |
-729 |
-706 |
-701 |
-695 |
-689 |
-681 |
-673 |
-662 |
-643 |
-561 |
Вывод: Вариационный ряд послужит нам для облегчения дальнейших расчетов, и для определения относительных частот и разделения на интервалы и расчета ряда числовых характеристик.
2. Расчет числовых характеристик статистического ряда
2.1 Размах варьирования
Размах варьирования вычисляется по формуле:
(2.1)
где R – размах варьирования;
x>max> – максимальный элемент вариационного ряда;
x>min>> >– минимальный элемент вариационного ряда;
x>max>= – 561
x>min>> >= -805
R = -561+805=244
2.2 Среднеарифметическое значение статистического ряда
(2.2)
где n>i> – частота варианты x>i>;
x>i> – варианта выборки;
n = ∑ n>i> – объем выборки;
Распределение выборки представлено в таблице 2.
Таблица 2
Xi |
n |
Xi |
n |
Xi |
n |
Xi |
n |
Xi |
n |
Xi |
n |
Xi |
n |
-805 |
1 |
-717 |
2 |
-700 |
3 |
-689 |
3 |
-675 |
1 |
-647 |
2 |
-608 |
1 |
-765 |
1 |
-716 |
2 |
-699 |
1 |
-688 |
2 |
-673 |
2 |
-646 |
1 |
-604 |
1 |
-758 |
1 |
-711 |
1 |
-697 |
3 |
-687 |
1 |
-671 |
1 |
-645 |
1 |
-597 |
1 |
-752 |
1 |
-707 |
1 |
-696 |
2 |
-686 |
3 |
-670 |
2 |
-644 |
1 |
-578 |
1 |
-748 |
1 |
-706 |
1 |
-695 |
2 |
-685 |
1 |
-667 |
3 |
-643 |
1 |
-561 |
1 |
-746 |
1 |
-705 |
1 |
-694 |
2 |
-681 |
3 |
-666 |
2 |
-632 |
1 |
||
-731 |
3 |
-704 |
2 |
-693 |
2 |
-680 |
1 |
-662 |
2 |
-627 |
1 |
||
-729 |
1 |
-703 |
3 |
-692 |
1 |
-678 |
2 |
-660 |
1 |
-624 |
1 |
||
-727 |
2 |
-702 |
1 |
-691 |
1 |
-677 |
2 |
-658 |
1 |
-623 |
1 |
||
-722 |
1 |
-701 |
3 |
-690 |
1 |
-676 |
2 |
-656 |
1 |
-612 |
1 |
2.3 Оценка дисперсии
(2.3)
где s2 – несмещенная оценка генеральной дисперсии;
2.4 Оценка среднего квадратического отклонения
(2.4)
2.5 Определение моды
Модой называют варианту с наибольшей частотой повторений.
Из таблицы 2 находим, что наибольшую частоту n=3 имеют варианты x = -731, x = -703, x = -701, x = -700, x = -697, x = -689, x = -686, x = -681, x = -667.
2.6 Определение медианы
Если количество вариант число четное, то медиана вычисляется по формуле:
М>В>=(x>k>+x>k>>+1>)/2 (2.5.)
где x>k> – пятидесятый член вариационного ряда;
x>k+1> – пятьдесят первый член вариационного ряда;
n – Количество вариант и n=2*k
М>В>=(x>k>+x>k>>+1>)/2=(-689–689)/2= -689
2.7 Расчет коэффициента вариации
Расчет коэффициента вариации проведем по формуле:
(2.6)
Вывод:
Размах варьирования является простейшей характеристикой рассеяния вариационного ряда.
Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводные характеристики – генеральную дисперсию и средним квадратическим отклонением.
Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент больше (эта величина безразмерная поэтому он пригоден для сравнения вариационных рядов, варианты которых имеют различную размерность.
В целом числовые характеристики служат для сравнения рассеяния вариационных рядов в сравнении с аналогичными числовыми характеристиками других вариационных рядов.
3. Построение полигона и гистограммы относительных частот
Для построения гистограммы и полигона относительных частот поделим вариационный ряд (табл. 1) на частичные интервалы. Результаты занесем в таблицу 3.
Таблица 3
Номер интервала I |
Частичный интервал x>i>–x>x>>+1> |
Сумма относительных частот w>i> |
Плотность частот |
|
x>i> |
x>x>>+1> |
|||
1 |
-805 |
-780,6 |
0,01 |
0,00041 |
2 |
-780,6 |
-756,2 |
0,02 |
0,00082 |
3 |
-756,2 |
-731,8 |
0,03 |
0,00123 |
4 |
-731,8 |
-707,4 |
0,12 |
0,00492 |
5 |
-707,4 |
-683 |
0,4 |
0,01639 |
6 |
-683 |
-658,6 |
0,24 |
0,00984 |
7 |
-658,6 |
-634,2 |
0,08 |
0,00328 |
8 |
-634,2 |
-609,8 |
0,05 |
0,00205 |
9 |
-609,8 |
-585,4 |
0,03 |
0,00123 |
10 |
-585,4 |
-561 |
0,02 |
0,00082 |
По таб. 3 строим гистограмму относительных частот (рис. 1).
Полигон получаем соединением вершин столбцов гистограммы. (рис. 1) Полигон получаем соединением вершин столбцов гистограммы.
Рис 1.
Вывод: Полигон и гистограмму – графики статистического распределения строят для наглядности относительных частот в выборке.
4. Построение эмпирической функции распределения
Эмпирическая функция распределения выборки находится по формуле:
(4.1)
где n>x> – число вариант меньших х;
n – объем выборки.
По формуле (4.1) построим эмпирическую функцию распределения.
Для более точного и правильного построения возьмем середины интервалов:
F(x) |
Интервал |
||
0 |
X< |
-792,8 |
|
0,01 |
-792,8 |
<x< |
-768,4 |
0,02 |
-768,4 |
<x< |
-744 |
0,03 |
-744 |
<x< |
-719,6 |
0,05 |
-719,6 |
<x< |
-695,2 |
0,08 |
-695,2 |
<x< |
-670,8 |
0,12 |
-670,8 |
<x< |
-646,4 |
0,19 |
-646,4 |
<x< |
-622 |
0,27 |
-622 |
<x< |
-597,6 |
0,41 |
-597,6 |
<x< |
-573,2 |
0,67 |
-573,2 |
<x< |
-548,8 |
1 |
x> |
-548,8 |
Вывод:
Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности
5. Статистическая проверка гипотезы о нормальном распределении с помощью критерия Пирсона или Колмагорова
Проверку проводим с помощью критерия Пирсона.
В этом задании, с помощью критерии Пирсона проверим гипотезу о нормальном распределении генеральной совокупности, с этой целью будем сравнивать эмпирические и теоретические частоты.
– Среднее арифметическое значение
– Количество вариантов
– Шаг интервалов
– Оценка среднеквадратического отклонения.
Вычислим данные по таблице:
I |
ni |
Xi |
X (i+1) |
Zi |
Z (I+1) |
|||||
1 |
1 |
-805 |
-780,6 |
-2,7340 |
-0,5 |
-0,469 |
3,1 |
1,4226 |
0,3226 |
|
2 |
1 |
-780,6 |
-756,2 |
-2,7340 |
-2,1140 |
-0,469 |
-0,408 |
6,1 |
4,2639 |
0,1639 |
3 |
4 |
-756,2 |
-731,8 |
-2,1140 |
-1,4941 |
-0,408 |
-0,285 |
12,3 |
5,6008 |
1,3008 |
4 |
7 |
-731,8 |
-707,4 |
-1,4941 |
-0,8741 |
-0,285 |
-0,099 |
18,6 |
7,2344 |
2,6344 |
5 |
26 |
-707,4 |
-683 |
-0,8741 |
-0,2542 |
-0,099 |
0,1141 |
21,31 |
1,0322 |
31,7222 |
6 |
33 |
-683 |
-658,6 |
-0,2542 |
0,3658 |
0,1141 |
0,2939 |
17,98 |
12,5473 |
60,5673 |
7 |
14 |
-658,6 |
-634,2 |
0,3658 |
0,9857 |
0,2939 |
0,4131 |
11,92 |
0,3630 |
16,4430 |
8 |
8 |
-634,2 |
-609,8 |
0,9857 |
1,6057 |
0,4131 |
0,4713 |
5,82 |
0,8166 |
10,9966 |
9 |
3 |
-609,8 |
-585,4 |
1,6057 |
2,2256 |
0,4713 |
0,4927 |
2,14 |
0,3456 |
4,2056 |
10 |
3 |
-585,4 |
-561 |
2,2256 |
0,4927 |
0,5 |
0,73 |
7,0588 |
12,3288 |
|
СУММА |
100 |
100 |
40,6851 |
140,6851 |
X2>набл>=40,685
Контроль: 140,685–100=40,685
Исходя из требований, чтобы вероятность попадания критерия в критическую область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости .
Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы – неравенством.
Уровень значимости = 0,05;
По таблице критических точек распределения χ² (приложение 3), по уровню значимости α = 0,05 и числу степеней свободы K=10–3=7 находим критическую точку правосторонней критической области χ²кр (0,05; 7) = 14,1.
Вывод: Так как X2>набл>> X2>кр,> то нулевую гипотезу отвергают, значит гипотезу о нормальном распределении отвергают.
6. Расчет асимметрии и эксцесса
Асимметрия – отношение центрального момента 3-го порядка к кубу среднего квадратического отклонения.
, где
Эксцесс – характеристика «крутости» рассматриваемой случайной величины.
, где
Значение Х>В, > вычисляем по формулам:
,
где С – Ложный нуль (варианта, которая имеет наибольшую частоту).
,
где h – шаг (разность между двумя соседними вариантами);
(условный момент второго порядка);
(условный момент первого порядка);
(условная варианта).
Расчеты занесем в таблицу 7:
X>i> |
N>i> |
U>i> |
X>B> |
M>1> |
M>2> |
|
m3 |
m4 |
A>S> |
E>K> |
-805 |
1 |
-2,73 |
-684,67 |
0,30 |
1,06 |
23,97 |
3433,28 |
4193007,72 |
0,25 |
12,71 |
-780,6 |
1 |
-2,11 |
||||||||
-756,2 |
4 |
-1,49 |
||||||||
-731,8 |
7 |
-0,87 |
||||||||
-707,4 |
26 |
-0,25 |
||||||||
-683 |
33 |
0,37 |
||||||||
-658,6 |
14 |
0,99 |
||||||||
-634,2 |
8 |
1,61 |
||||||||
-609,8 |
3 |
2,23 |
||||||||
-585,4 |
3 |
2,85 |
Вывод:
Т.к. асимметрия положительна то ‘длинная часть’ кривой распределения расположена справа от математического ожидания или мода.
Т.к. Эксцесс больше нуля, то кривая распределения имеет более высокую и ‘острую’ вершину, чем нормальная кривая.
7. Построение доверительного интервала для математического ожидания и среднего квадратического отклонения
Доверительный интервал для математического ожидания (с вероятностью ) находят как:
(7.1)
где n – объем выборки;
t>> – случайная величина имеющее распределение Стьюдента находим по приложению 1.
s – исправленное среднее квадратическое отклонение;
– выборочное среднее;
Найдем интервал:
по приложению 1 находим t>>> >= 1.984 при = 0.95 и n = 100;
=-684,67; s = 38,19;
Получаем
-692,25<a<-677.09
Доверительный интервал для среднего квадратического отклонения
(с надежностью ) находят как:
при q<1 (7.2)
при q>1 (7.3)
где q находят по приложению 2, по заданным n и ;
Исходя из приложения 2, n = 100 и = 0.95 находим q=0.143;
Поэтому интервал находим по формуле (7.2):
38.19(1-0.143)38.19(1+0.143) 35,58(1+0.143)
32.73 43.65
Вывод:
Итак, с надежностью 0,95 неизвестное математическое ожидание ‘а’ находится в доверительном интервале -692,25<a<-677.09, а неизвестное среднее квадратическое отклонение ‘’ находиться в доверительном интервале 32.73 43.65.
Вывод
Для представления генеральной совокупности я исследовала выборку, которая имеет объём 100 элементов.
Я нашла:
размах варьирования R=244;
среднеарифметическое значение статистического ряда =-684,67;
несмещенную оценку генеральной дисперсии s2=1458,99;
среднее квадратическое отклонение s=38,19;
медиану М>В>=-689 и коэффициент вариации V= 5,58%.
С надежностью 0.95 оценил математическое ожидание в интервале
-692,25 а -677,09
и среднее квадратическое отклонение в интервале
32,73 43,65
Выборка имеет варианты x = -731, x = -703, x = -701, x = -700, x = -697, x = -689, x = -686, x = -681, x = -667, которые встречаются 3 раза.
На рис. 1 построила гистограмму и полигон относительных частот. По рис. 1 можно выдвинуть гипотезу о нормальном распределении генеральной совокупности.
После проверки гипотезы о нормальном распределении с помощью критерия Пирсона при =0.05, я отвергла ее. Из этого следует, что расхождения между практическими и теоретическими частотами значимо.
Асимметрия a>s>=0,25. Из этого следует, что правое крыло функции более вытянуто относительно ее моды.
Эксцесс e>k>=12,71. Из-за того, что у эксцесса положительный знак, эмпирическая функция распределения острее по сравнению с теоретическим распределением.
Список литературы
Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высшая школа, 2001.
Гмурман В.Е. Теория вероятностей и математическая статистика.
М.: Высшая школа, 2001.