Элементы математической статистики

Содержание

Введение

1. Элементы математической статистики

1.1 Оценки параметров распределения

1.2 Наиболее важные распределения, применяемые в математической статистике

1.2.1 Нормальное распределение

1.2.2 Распределение Пирсона (х2 распределение)

1.2.3 Распределение Стьюдента

1.2.4 Распределение Фишера

2. Организация эксперимента

2.1 Задачи предварительного эксперимента. Факторное пространство

2.2 Формулирование цели эксперимента и выбор откликов

2.3 Выбор и кодирование факторов

Список литературы

Приложение (таблица критических точек критерия Фишера)

Введение

К важнейшим направлениям научно-технического прогресса относятся автоматизация производства, широкое применение компьютеров и роботов, создание гибких автоматизированных устройств и т.д. Во всех этих направлениях ведущая роль принадлежит электронике.

При создании электронной и электромеханической аппаратуры основные трудозатраты приходятся на ее настройку, снятие характеристик и испытания. При этом нередко используется малоэффективный традиционный метод однофакторного эксперимента, недостаточно внимания уделяется организации и планированию эксперимента и вероятностно-статистическому анализу получаемых данных. Чтобы повысить производительность труда в данной области, специалистам необходимо знать основы математической теории эксперимента и успешно применить ее на практике.

  1. Элементы математической статистики

1.1 Оценки параметров распределения

Математическая статистика изучает массовые, случайные явления. Ее основной задачей является изучение распределений случайных величин или ее числовых характеристик (параметров распределения) на основе экспериментальных данных. Среди параметров распределения наиболее часто используются математическое ожидание , дисперсия и среднее квадратическое отклонение . По результатам эксперимента можно вычислить точечные и интервальные оценки этих параметров.

Точечные оценки определяют приближенные значения неизвестных параметров.

Пусть в результате экспериментов были получены следующие значения выходной переменной .

Оценкой математического ожидания является выборочная средняя:

Оценка дисперсии определяется формулой:

Для среднего квадратического отклонения получим:

Если среди результатов попадаются одинаковые значения, то есть значения встретилось раз, то точечные оценки определяются формулами:

,

где -число различных значений .

Интервальные оценки указывают интервал, в который с заданной вероятностью попадает значение неизвестного параметра.

Для математического ожидания доверительный интервал оценивается следующим образом:

,

где -значение критерия Стьюдента. , -число степеней свободы, -уровень значимости.

Среднее квадратическое отклонение имеет доверительный интервал:

,

где - значение критерия Пирсона для уровня значимости , - для уровня значимости , -число степеней свободы.

1.2 Наиболее важные распределения, применяемые в математической статистике

1.2.1 Нормальное распределение

Случайная величина , распределенная по нормальному закону, описывается плотностью вероятности:

.

Нормальное распределение определяется двумя параметрами – математическим ожиданием и среднеквадратическим отклонением .

Случайная величина имеет математическое ожидание и среднеквадратичное отклонение и называется нормированной нормально распределенной случайной величиной. Ее плотность вероятности:

,

График плотности распределения приведен на рисунке 1.

Функция распределения табулирована.

Вероятность попадания в интервал :

Вероятность попадания в интервал [-3;3] длиной по правилу “3-х сигм” принимается за единицу. Это равносильно предположению, что все значения z заключены в интервал [-3;3].

Рис.1. График функции плотности нормированной нормально распределенной случайной величины

1.2.2 Распределение Пирсона (х2 распределение)

Это распределение используется для построения доверительных интервалов, проверки соответствия эмпирического распределения некоторой теоретической зависимости, проверки согласованности мнений экспертов.

Пусть имеется независимых, нормированных, нормально распределенных случайных величин . Сумма их квадратов образует новую случайную величину .

Число степеней свободы равно числу независимых слагаемых в сумме. Если на слагаемые наложено связей, то число степеней свободы будет равно .

Распределение является асимптотически нормальным и зависит только от числа степеней свободы . Значение табулированы.

1.2.3 Распределение Стьюдента

Для построения доверительных интервалов и для проверки статистических гипотез часто используется -распределение (распределение Стьюдента).

- оценка математического ожидания,

- оценка СКО, рассчитанные по результатам опытов, случайной величины , распределенной по нормальному закону с параметрами .

Распределение Стьюдента определяется числом степеней свободы , является симметричным, унимодальным и асимптотически нормальным. При оно практически совпадает с нормальным. Таблица распределения имеет два входа – число степеней свободы и уровень значимости . На пересечении находится значение , которое удовлетворяет условию .

1.2.4 Распределение Фишера

Это распределение, как и два предыдущие, используются при анализе результатов эксперимента, имеющих нормальное распределение. - распределение задается следующим образом:

,

где - случайные величины с числом степеней свободы , причем величина в числителе должна быть больше величины в знаменателе.

Путем тождественных преобразований приведем, к отношению двух оценок дисперсии некоторой случайной величины .

Пусть на основе результатов двух серий экспериментов с числом опытов соответственно были получены -оценки дисперсии с числом степеней свободы . Заметим что,

,

тогда можно записать:

.

Отсюда . Предполагается, что .

-распределение определяется двумя параметрами – числами степеней свободы большей дисперсии и меньшей дисперсии . Критические значения -распределения, соответствующие уровню значимости даны в приложении. Таблица содержит значения , удовлетворяющие условию

2. Организация эксперимента

2.1 Задачи предварительного эксперимента. Факторное пространство

Непосредственному проведению основного эксперимента предшествует подготовительная работа – предпланирование, которое состоит из следующих этапов:

    Изучение объекта и формулировка цели экспериментального исследования;

    выбор откликов (выходных переменных);

    выбор факторов (входных переменных) и их интервалов варьирования;

    разработка экспериментальной установки и метрологического обеспечения или программ для ЭВМ;

    составление таблицы условий и плана эксперимента.

Примером многооткликового объекта является импульсное устройство, в котором откликами могут быть ширина и амплитуда импульса, временное запаздывание. Эти параметры – отклики зависят от внутренних параметров устройства и различных внешних воздействий: напряжения питания, температуры окружающей среды, внешних электромагнитных полей.

На рис.2 показана схема многофакторного эксперимента, которую иногда называют схемой черного ящика. Выходные переменные, определяющие состояние объекта (переменные состояния), обозначены буквами . Они зависят от трех типов воздействий обозначаемых векторами .

Первая группа - это контролируемые и управляемые в процессе эксперимента, независимые между собой переменные, которые называют факторами.

Вторая группа воздействий - наблюдаемые, но неуправляемые переменные.

Третья группа воздействий - ненаблюдаемые и неуправляемые переменные.

Задача эксперимента состоит в том, чтобы получить зависимость вектора отклика от воздействия факторов :

.

Воздействия являются шумом или возмущениями, которые могут искажать искомую зависимость. Чтобы ослабить действие возмущений на используют обычные методы стабилизации условий эксперимента и защиты объекта от помех.

Рис 2. Объект исследования многофакторного эксперимента

Пространство, образованное координатами , называется факторным. Каждому набору значений факторов соответствует точка в факторном пространстве и некоторое значение отклика .

2.2 Формулирование цели эксперимента и выбор откликов

При построении однооткликовой модели требуется найти зависимость .

Зависимость заранее не известна, но предполагается что в окрестности некоторой она может быть разложена в ряд Тейлора, т.е. поверхность отклика является достаточно гладкой. В этом случае в окрестности точки разложения зависимость можно представить в виде полинома первой, второй и реже более высокой степени.

Точность аппроксимации зависит от размеров области эксперимента. При большой кривизне поверхности с увеличением размеров области необходимо увеличивать степень полинома, что усложняет эксперимент и обработку его результатов. Но если область мала, то изменение факторов могут незначимо влиять на отклики, что приведет к неточной модели.

Рассмотрим требования, предъявляемые к откликам.

На практике, как правило, встречаются многоткликовые объекты, и целью эксперимента является оптимизация объекта или получение моделей для нескольких откликов, т.е. задача является многокритериальной. В этом случае надо искать компромиссные решения. Здесь широко применяют метод проб и ошибок, итеративные процедуры др. Иногда несколько откликов можно свести в один общий. В дальнейшем будут рассматриваться только однооткликовые объекты.

Отклик определяется объектом исследования и целью эксперимента. Он должен удовлетворять следующим требованиям:

    Быть количественной величиной, доступной непосредственному или косвенному измерению с необходимой точностью. Если его нельзя измерить, могут применяться ранговые подходы.

    Иметь простой физический смысл.

    Обладать однозначностью, т.е. данному набору факторов должно соответствовать одно, с точностью до ошибки опыта, значение отклика.

    Быть достаточно универсальными, т.е. наиболее полно характеризовать объект, его функциональное значение, тактическо-технологические требования.

2.3 Выбор и кодирование факторов

Факторы делятся на количественные и качественные.

Количественные –факторы, которые являются физическими и могут быть измерены.

Качественные – факторы, которые не выражаются количественно (сорт или класс некоторого продукта, квалификация оператора, радиоэлементы различных партий или заводов изготовителей).

При постановке эксперимента, учитывается все факторы, существенно влияющие на отклик. При проведении эксперимента факторы должны отвечать следующим требованиям:

    При изменении любого фактора остальные не изменяют своих значений, т.е. являются функционально и статически независимыми.

    В процессе эксперимента каждый фактор принимает два или более дискретных значения устанавливаемых оператором. Поэтому выбираются переменные, которые могут регулироваться.

    Количественные факторы принимаются не случайными величинами, а точно известными. При этом точность измерения факторов должна быть на порядок выше точности измерения отклика.

    Факторы должны обладать свойствами совместимости в факторном пространстве, чтобы не проводить устройства к аварийным ситуациям.

Перечисленным требованиям не всегда удовлетворяют параметры некоторых радиоэлементов. В частности, параметры активных элементов (радиоламп и транзисторов) сильно коррелированны и нет конструктивных возможностей устанавливать им различные значения. Иногда параметры связаны функционально. Так сила тока, сопротивление и напряжение связаны законом Ома.

Планирование и обработка результатов эксперимента осуществляется не в физических, а в кодированных переменных

; j = 1,…,n,

где -основной уровень j-того фактора; -интервал варьирования.

Основным или нулевым уровнем фактора называется то его значение, при котором в предварительном эксперименте получено наилучшие значения переменной отклика. Интервалом варьирования называется половина диапазона, в котором изменяется фактор:

.

,-значения верхнего и нижнего уровней j-того фактора.

.

В кодированных переменных получим:

Основной уровеньопределяет центр области эксперимента. Обычно эта область номинальных значений параметров электрорадиоэлементов, нагрузок, источников питания. В качестве нулевых уровней выбираются номинальные или расчетные значения указанных величин.

Интервалы варьирования определяют размер области экспериментирования и влияют на достоверность или информативность экспериментальных данных, на адекватность модели.

С точки зрения информативности надо брать достаточно большим, т.е. на порядок больше СКО() для фактора. Однако при увеличении реальная поверхность отклика может сильно отличатся от экспериментально полученной аппроксимирующей поверхности.

Пример. Необходимо выбрать основной уровень и интервал варьирования питающего напряжения усилителя на микросхеме 140-й серии. Обозначим напряжение . Номинальное напряжение питания U для данной серии составляет . Возьмем . Так как исследуется влияние питающего напряжения на коэффициент усиления, в качестве нулевого уровня выбирается номинальное значение . Точность измерения напряжения (СКО) определяется по формуле , где - максимальная ошибка измерения данного прибора на выбранной шкале измерения.

Если -класс точности прибора (%), -шкала или диапазон измерения то .

Положим =20В, =2,5%. Тогда

.

Следовательно, интервал варьирования не должен быть меньше . С другой стороны, из условия устойчивой работы усилителя напряжения питания не может быть меньше 8В. Поэтому выбираем . Тогда в процессе эксперимента .

Значение нулевых уровней и интервалов варьирования факторов сводятся в таблицу условий эксперимента. Примером является таблица 1.

Таблица 1. Условия эксперимента

Величина

Фактор

Сопротивление

,Ом,

Емкость ,мкФ,

Напряжение,

,В,

Основной уровень

140

20

12

Интервал варьирования

30

5

3

Нижний уровень

110

15

9

Верхний уровень

170

25

15

После выбора факторов возникают следующие задачи предварительного эксперимента:

    Исключение грубых ошибок;

    проверка воспроизводимости опытов (однородности дисперсии);

    проверка нормального закона распределения ошибок эксперимента;

    проверка согласованности мнений специалистов;

    установление корреляционных связей между факторами и откликами.

Список литературы

    Егоров А.Е., Азаров Г.Н., Коваль А.В. Исследование устройств и систем автоматики методом планирования эксперимента. – К.: Вища школа, 1986.

    Бондарь А.Г., Статюха Г.А. Планирование эксперимента в химической технологии. – К.: Вища школа, 1978.

    Кафаров В.В. Методы кибернетики в химии и химической технологии. – М.: Химия, 1971.

    Колде Я.К. Практикум по теории вероятностей и математической статистике. – М.: Высшая школа, 1991.

    Твердохлебов Г.Н., Бродский А.Л., Старобина Е.К., Кутакова Д.А. Методические указания по математическим методам анализа и планирования эксперимента для студентов всех химических специальностей. Ворошиловград, 1985.

Приложение (таблица критических точек критерия Фишера)

(F – распределение для уровня значимости q=0.05)

f>2>

f>1>

1

2

3

4

5

8

12

24

1

2

3

4

5

6

7

8

10

12

16

20

60

164

18.5

10.1

7.71

6.61

5.99

5.50

5.32

4.96

4.75

4.49

4.35

4.00

3.84

199

19.0

9.55

6.94

5.79

5.14

4.74

4.46

4.10

3.88

3.63

3.49

3.15

2.99

215

19.2

9.28

6.59

5.41

4.76

4.35

4.07

3.71

3.49

3.24

3.10

2.76

2.60

224

19.2

9.12

6.39

5.19

4.53

4.12

3.84

3.48

3.26

3.01

2.87

2.52

2.37

234

19.3

8.94

6.16

4.95

4.28

3.87

3.58

3.22

3.00

2.74

2.60

2.25

2.09

239

19.4

8.84

6.04

4.82

4.15

3.73

3.44

3.07

2.85

2.59

2.45

2.10

1.94

243

19.4

8.74

5.91

4.68

4.00

3.57

3.28

2.91

3.69

2.42

2.28

1.92

1.75

249

19.4

8.64

5.77

4.53

3.84

3.41

3.12

2.74

2.50

2.24

2.08

1.70

1.52

254

19.5

8.53

5.63

4.36

3.67

3.23

2.93

2.54

2.30

2.01

1.84

1.39

1.00

Примечание. f>1> – число степеней свободы большей дисперсии, f>2> – число степеней свободы меньшей дисперсии.