Оценка погрешностей измерений
Министерство образования и науки РФ
ГОУ ВПО
Саратовский государственный технический университет
Кафедра «Электронные приборы и устройства»
Курсовая работа на тему:
«Оценка погрешностей измерений»
Саратов 2010
Задание к курсовой работе
Заданная выборка имеет вид:
72,9137 |
72,2243 |
73,2806 |
732304 |
75,6094 |
73,3917 |
72,5557 |
74,4357 |
72,448 |
72,325 |
70,5713 |
72,6716 |
71,0304 |
70,5799 |
71,767 |
71,6886 |
73,5431 |
72,9935 |
73,2538 |
72,9033 |
74,2542 |
72,959 |
73,0988 |
72,738 |
73,08 |
70,3713З |
74.9595 |
71,5632 |
73,943 |
74,5532 |
73.5407 |
71,1872 |
71,4221 |
71,2018 |
74,2139 |
73,8979 |
75,7989 |
71,4815 |
72,0882 |
70,1388 |
73,9814 |
73,1069 |
74,173 |
74,5629 |
73,654 |
73,0471 |
72,372 |
72,5726 |
70,7069 |
73,1002 |
73,9612 |
73.7216 |
73,1189 |
72,1772 |
71,1006 |
70,5482 |
73,8402 |
74,6359 |
72,7028 |
73,4373 |
74,3261 |
73,5181 |
72,0133 |
71,2549 |
75,4085 |
73,4603 |
72,1824 |
71,8583 |
72,2526 |
73,2037 |
72,6318 |
72,7662 |
72,685 |
73,8493 |
74,747 |
71,4287 |
70,565 |
74,7288 |
75,21 |
71,6711 |
72.9558 |
73,223 |
74,1516 |
74,1286 |
72,7163 |
72,1847 |
73,0784 |
72,5307 |
74,216 |
71,9055 |
72,2845 |
71,7841 |
72,27 |
71,1639 |
74,0282 |
73,3143 |
74,2181 |
73,4217 |
70,8937 |
74,6933 |
Необходимо исследовать методы определения погрешностей и методы статистической оценки распределений. Провести расчеты по заданной выборке. При анализе выборки необходимо рассмотреть следующие параметры:
объем выборки;
интервальный статистический ряд и частности для каждого интервала;
медиану распределения;
размах вариации;
выборочное среднее;
выборочную дисперсию;
среднеквадратическое отклонение;
эмпирическую функцию распределения.
Так же рекомендуется выдвинуть гипотезу о виде распределения и провести проверку данной гипотезы.
Введение
При практическом использовании тех или иных измерений важно оценить их точность. Термин "точность измерений", т. е. степень приближения результатов измерения к некоторому действительному значению, не имеет строгого определения и используется для качественного сравнения измерительных операций. Для количественной оценки используется понятие "погрешность измерений" (чем меньше погрешность, тем выше точность). Понятие "погрешность" — одно из центральных в метрологии, где используются понятия "погрешность результата измерения" и "погрешность средства измерения". Погрешность результата измерения — это разница между результатом измерения X и истинным (или действительным) значением Q измеряемой величины. Она указывает границы неопределенности значения измеряемой величины. Погрешность средства измерения — разность между показанием средства измерения и истинным (действительным) значением измеряемой физической величины. Она характеризует точность результатов измерений, проводимых данным средством.
Оценка погрешности измерений — одно из важных мероприятий по обеспечению единства измерений. Количество факторов, влияющих на точность измерения, достаточно велико, и любая классификация погрешностей измерения в известной мере условна, так как различные погрешности в зависимости от условий измерительного процесса проявляются в различных группах. По характеру проявления погрешности делятся на случайные, систематические, прогрессирующие и грубые (промахи).
Оценивание погрешностей производится с целью получения объективных данных о точности результата измерения. Погрешность измерения описывается определенной математической моделью, выбор которой обуславливается имеющимися априорными сведениями об источниках погрешности, а также данными, полученными в ходе измерений. С помощью выбранной модели определяются характеристики и параметры погрешности, используемые для количественного выражения тех или иных ее свойств.
В основу выбора оценок погрешностей положен ряд принципов. Во-первых, оцениваются отдельные характеристики и параметры выбранной модели погрешности. Это связано с тем, что модели погрешностей, как правило, сложны и описываются многими параметрами. Определение их всех весьма затруднительно, а иногда и невозможно. Кроме этого, в большинстве практических случаев полное описание модели погрешности содержит избыточную информацию, в то время как знание отдельных ее характеристик вполне достаточно для достижения цели измерения. Во-вторых, оценки погрешности определяют приближенно, с точностью, согласованной с целью измерения. Это обусловлено тем, что погрешности определяют лишь зону неопределенности результата измерения и их не требуется знать очень точно. В-третьих, погрешности оцениваются сверху, поэтому погрешность лучше преувеличить, чем преуменьшить, так как в первом случае снижается качество измерений, а во втором — возможно полное обесценивание результатов всего измерения. В-четвертых, поскольку стремятся получить реалистические значения оценки погрешности результата измерения, т.е. не слишком завышенные и не слишком заниженные, точность измерений должна соответствовать цели измерения. Излишняя точность ведет к неоправданному расходу средств и времени. Недостаточная точность в зависимости от цели измерения может привести к признанию годным в действительности негодного изделия, к принятию ошибочного решения и т. п.
Элементы теории
В основе любых измерений лежат прямые измерения, в ходе которых находят некоторое числовое значение физической величины. Каждая такая измерительная операция называется наблюдением, а получаемое при этом значение физической величины – результатом наблюдения. Получаемый опытным путем результат наблюдения подвержен случайным отклонениям от истинного значения физической величины. Такой заранее непредсказуемый в каждом данном наблюдении результат является случайной величиной. Многократное повторное проведение опыта позволяет установить статистические закономерности, которым удовлетворяет данная случайная величина.
При каждом наблюдении мы получаем некоторое возможное значение физической величины. Всё множество возможных значений измеряемой величины, которые она может принимать в эксперименте, называется генеральной совокупностью. Это множество может быть как конечным, так и бесконечным. Большинство физических величин имеет непрерывный набор возможных значений, множество которых является бесконечным. Говорят, что такие величины имеют генеральную совокупность бесконечного объёма.
Генеральная совокупность несет полную информацию об измеряемой величине и позволяет (в отсутствие невыявленных систематических погрешностей), несмотря на случайный характер результатов отдельных наблюдений, найти истинное значение x>0> физической величины. В случае физической величины с непрерывным набором значений для нахождения её истинного значения необходимо провести бесконечное число наблюдений, что невозможно. Поэтому на практике ограничиваются конечным числом наблюдений (от единиц до нескольких десятков). Полученный при этом ряд значений физической величины: x>1>, x>2>, ... x>N> называют выборкой из генеральной совокупности или просто выборкой.
Ввиду ограниченного числа наблюдений в выборке, по ней нельзя найти ни истинного значения измеряемой величины, ни истинной погрешности измерения, и задача сводится к нахождению по выборке наилучших выборочных оценок (наилучших приближенных значений) истинного значения и истинной погрешности измерения.
Чтобы получить представление о законе распределения измеряемой величины, производят группировку данных. Для этого весь интервал значений величины от x>min> до x>max> (рис. 2.1) разбивают на несколько равных интервалов, называемых интервалами группировки данных, шириной Д и центрами x>k>, так что k-й интервал (k=1, 2…K) имеет границы (x>k> – Д /2, x>k> + Д /2). Далее, распределяют значения x>1> по интервалам. Число точек N>k>, оказавшихся внутри k-го интервала, даёт число попаданий измеряемой величины в этот интервал. Общее число точек, оказавшихся внутри всех интервалов разбиения, должно быть равно полному числу N результатов наблюдений в исходной выборке.
Над каждым интервалом Д>k> строится прямоугольник высотой
f>k> = N>k>/(NД),
где N – общее число наблюдений. Совокупность таких прямоугольников называется гистограммой.
При построении гистограмм интервалы разбиения не следует брать очень большими или очень маленькими. Так, в первом случае прямоугольники на гистограмме будут иметь примерно одинаковую высоту, а во втором – могут появиться интервалы, в которые не попадет ни одного значения случайной величины. В последнем случае внутри гистограммы будут просветы. Такие гистограммы не дают представления о законе распределения случайной величины.
Высоты и площади прямоугольников на гистограмме имеют следующий смысл. Учитывая, что относительные частоты
P>k> = N>k>/N
приближенно равны вероятности попадания результата каждого отдельного наблюдения в данный интервал, высота каждого прямоугольника на гистограмме
f>k>> >= N>k>/NД= Р>k>/Д
есть вероятность, приходящаяся на единицу длины интервала разбиения или плотность вероятности попадания случайной величины в интервал Д>k> с центром в точке x>k>.
Площадь каждого прямоугольника
f>k>Д= N>k>/N= Р>k>> >
есть вероятность попадания результата в интервал Д>k>.. Сумма площадей прямоугольников, основания которых находятся внутри некоторого интервала [x>1>, x>2>], равна вероятности для каждого отдельного наугад взятого результата попасть в этот интервал.
Расчетная часть
В математической статистике исходная исследуемая случайная величина называется генеральной совокупностью, а полученный из нее набор экспериментальных данных – выборочной совокупностью, или выборкой.
Число объектов (наблюдений) в совокупности, генеральной или выборочной, называется ее объемом; обозначается соответственно через N и n. В данном случае N=100.
Числа n>i>> >, показывающие сколько раз встречаются варианты x>i>> >в ряде наблюдений, называются частотами, а отношение их к объему выборки – частостями p>i>.
, (1)
где .
Проранжируем статистические данные. Для определения оптимального значения величины интервала в первом приближении можно воспользоваться формулой Стерджеса
(2)
Воспользовавшись (2) получим , .
В соответствии с (1) и (2) составим интервальный статический ряд:
Таблица 1
Итервальный статический ряд
Интервал |
69,768-70,509 |
70,509-71,25 |
71,25-71,991 |
71,991-72,732 |
72,732-73,473 |
73,473-74,214 |
74,214-74,955 |
74,955-75,696 |
75,696-76,437 |
Частота |
2 |
11 |
11 |
20 |
24 |
16 |
11 |
4 |
1 |
Частость pi |
0,02 |
0,11 |
0,11 |
0,2 |
0,24 |
0,16 |
0,11 |
0,04 |
0,01 |
Рисунок 1. Диаграмма частоты в выбранных интервалах
Медианой вариационного ряда называется значение признака, приходящееся на середину ряда. В нашем случае имеем:
Размахом вариации называется число
,
где или – наибольший, – наименьший вариант ряда.
Выборочным средним называется среднее арифметическое всех значений выборки:
В случае интервального статистического ряда в качестве следует брать середины интервалов, а - соответствующие им частости.
Выборочной дисперсией D>в>> >называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней, т.е.
Выборочное среднеквадратическое отклонение выборки определяется формулой:
Эмпирической (статистической) функцией распределения называется функция , определяющая для каждого значения x частость события : . Для нахождения эмпирической функции записывают в виде:
где n – объем выборке, n>x>> >– число наблюдений, меньших х. Согласно (7) определим значения эмпирической функции распределения в выбранных интервалах.
График эмпирической функции распределения имеет вид.
Одной из важных задач математической статистики является установление теоретического закона распределения случайной величины, характеризующей изучаемый признак по эмпирическому распределению, представляющему вариационный ряд.
Проверим при уровне значимости гипотезу о том, что исследуемая выборка подчиняется нормальному закону распределения.
Рисунок 2. График эмпирической функции распределения
Число наблюдений в крайних интервалах меньше 5, поэтому объединим их с соседними. Получим следующий ряд распределения ( n=100).
Интервалы |
Частота k |
Середина интервала Xcp |
69,768-71,25 |
13 |
70,694 |
71,25-71,991 |
11 |
71,62 |
71,991-72,732 |
20 |
72,362 |
72,732-73,473 |
24 |
73,102 |
73,473-74,214 |
16 |
73,844 |
74,214-74,955 |
11 |
74,584 |
74,955-76,437 |
5 |
75,377 |
Вычислим параметры, определяющие нормальный закон распределения.
Так как случайная величина имеет нормальное распределение, то для расчета вероятностей попадания случайной величины X в интервал используем функцию Лапласа в соответствии со свойствами нормального распределения:
Полученные результаты приведем в следующей таблице:
X>i>, X>i+1> |
69,768-71,25 |
71,25-71,991 |
71,991-72,732 |
72,732-73,473 |
73,473-74,214 |
74,214-74,955 |
74,955-76,437 |
n>i> |
13 |
11 |
20 |
24 |
16 |
11 |
5 |
n`=n∙p>i> |
10,2 |
14,5 |
20,92 |
22,46 |
17,69 |
9,03 |
5,2 |
Определим критерий Пирсона:
Находим число степеней свободы. По выборке рассчитаны два параметра, значит . Количество интервалов . Следовательно, . Зная, что , по таблице находим . Поскольку считаем гипотезу верной.
Осуществим разбиение выборки на произвольное число интервалов, тем самым визуализировав вид плотности распределения случайной величины.
Таблица 2
Разбиение выборки на 20 и 30 интервалов
№ интервала |
Интервал |
Частота, ki |
Интервал |
Частота, ki |
1 |
70,138-70,327 |
1 |
70,138-70,422 |
2 |
2 |
70,327-70,516 |
1 |
70,422-70,705 |
4 |
3 |
70,516-70,705 |
4 |
70,705-70,988 |
2 |
4 |
70,705-70,893 |
1 |
70,988-71,271 |
6 |
5 |
70,836-71,082 |
2 |
71,271-71,554 |
3 |
6 |
71,082-71,271 |
5 |
71,554-71,837 |
5 |
7 |
71,271-71,459 |
2 |
71,837-72,120 |
4 |
8 |
71,,459-71,648 |
2 |
72,120-72,403 |
9 |
9 |
71,648-71,837 |
4 |
72,403-72,686 |
6 |
10 |
71,837-72,026 |
3 |
72,686-72,969 |
9 |
11 |
72,026-72,214 |
4 |
72,969-73,252 |
11 |
12 |
72,214-72,403 |
6 |
73,252-73,535 |
8 |
13 |
72,403-72,592 |
4 |
73,535-73,818 |
4 |
14 |
72,592-72,781 |
7 |
73,818-74,101 |
7 |
15 |
72,781-72,969 |
4 |
74,101-74,384 |
8 |
16 |
72,969-73,158 |
8 |
74,384-74,667 |
4 |
17 |
73,158-73,347 |
6 |
74,667-74,950 |
3 |
18 |
73,347-73,536 |
5 |
74,950-75,233 |
2 |
19 |
73,536-73,725 |
4 |
75,233-75,517 |
1 |
20 |
73,725-73,913 |
3 |
75,517-75,8 |
2 |
21 |
73,913-74,102 |
4 |
||
22 |
74,102-74,291 |
7 |
||
23 |
74,291-74,480 |
2 |
||
24 |
74,480-74,668 |
3 |
||
25 |
74,668-74,857 |
3 |
||
26 |
74,857-75,04 |
1 |
||
27 |
75,04-75,23 |
1 |
||
28 |
75,23-75,423 |
1 |
||
29 |
75,423-75,612 |
1 |
||
30 |
75,612-75,801 |
1 |
Рисунок 3. Диаграмма плотности распределения случайной величины с 20-и интервальным разбиением
Рисунок 4. Диаграмма плотности распределения случайной величины с 30-и интервальным разбиением
Рассчитаем основные параметры выборки для 20 интервалов:
Рассчитаем основные параметры выборки для 30 интервалов:
Вывод:
В ходе работы были изучены методы статистической оценки распределения случайной величины. Осуществлены расчеты по представленной выборке, рассмотрены числовые характеристики случайной величины: объем выборки, медиана распределения, размах вариации, выборочное среднее, выборочная дисперсия и среднеквадратическое отклонение.
Построена эмпирическая функция распределения, определяющая частность события для каждого значения случайной величины x.
Установлен теоретический закон распределения с.в. Рассматриваемая случайная величина имеет нормальное распределение, что подтверждает критерий Пирсона.
Выборка также разбита на 20 и 30 интервалов. Соответствующие гистограммы дают визуальное представление о виде плотности распределения с.в. Основные числовые параметры выборки при увеличении числа интервалов практически не меняются.
Библиографический список
1) Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистики / Письменный Д.Т. - М.: Айрис пресс, 2004. - 252с.
2) Колде Я.К. Практикум по теории вероятностей и математической статистике / Колде Я.К. - М.: Высш. школа, 1991. a - 157с.
3) Сергеев А.Г., Крохин В.В. Метрология: Учеб. пособие для вузов / Сергеев А.Г., Крохин В.В. - М.: Логос, 2001. - 408 с.: ил.
4) Аристов А.И. Метрология, стандартизация, сертификация / Аристов А.И. - М.: Академия, 2008. - 384с.
5) Радкевич Я.М. Метрология, стандартизация, сертификация / Радкевич Я.М. - М.: Высшая школа, 2010 - 792 с.
6) Димов Ю.В. Метрология, стандартизация и сертификация / Димов Ю.В. - СпБ.: Питер, 2010- 464с