Нахождение полиноминальной аппроксимации методом наименьших квадратов

Московский Авиационный Институт

(государственный технический университет)

Курсовая работа по

«теории вероятностей и математической статистике»

на тему:

Нахождение полиноминальной аппроксимации методом наименьших квадратов

Вариант №2

Выполнила: Студентка группы 05-202

Андреева Виктория

Принял: Преподаватель кафедры 804

Молчанов Игорь Иванович

Москва

2010 г.

ЗАДАНИЕ (вариант № 2) : Даны результаты измерений случайного процесса в равноотстоящие моменты времени (реализация временного ряда).

13,393 13,207 13,477 11,911 14,311 14,979 14,437 14,957 13,044 12,142

12,000 11,496 12,927 11,849 11,612 10,401 8,755 8,185 9,681 9,644

9,073 8,535 9,062 7,602 9,164 6,913 7,749 5,543 5,901 5,901

6,760 4,593 6,131 3,651 3,796 3,663 3,068 3,008 2,809 0,333

1,730 -0,072 0,479 -3,180 -2,962 -5,849 -6,153 -7,911 -10,134 -11,662

Измерения производятся с шагом по аргументу 0,08

ЦЕЛЬ РАБОТЫ: Требуется найти полиноминальную аппроксимацию этого процесса методом наименьших квадратов.

Теоретическая часть

Математическая статистика – наука о математических методах, позволяющих по статистическим данным, например по реализацией случайной величины (СВ), построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка.

Выборка

Однородной выборкой (выборкой) объема n при называется случайный вектор , компоненты которого , называемые элементами выборки, являются независимыми СВ с одной и той же функцией распределения F(x). Будем говорить, что выборка соответствует функции распределения F(x).

Реализацией выборки называется неслучайный вектор , компонентами которого являются реализации соответствующих элементов выборки .

Из вышеописанных определений вытекает, что реализацию выборки можно также рассматривать как последовательность из n реализаций одной и той же СВ X, полученных в серии из n независимых одинаковых опытов, проводимых в одинаковых условиях. Поэтому можно говорить, что выборка порождена наблюдаемой СВ X, имеющей распределение.

Если компоненты вектора независимы, но их распределения различны, то такую выборку называют неоднородной.

Множество S всех реализаций выборки называется выборочным пространством.

Выборочное пространство может быть всем n-мерным евклидовым пространством или его частью, если СВ X непрерывна, а также может состоять из конечного или счетного числа точек из , если СВ X дискретна.

На практике при исследовании конкретного эксперимента распределения СВ редко бывают известны полностью. Часто априори (до опыта) можно лишь утверждать, что распределение случайного вектора принадлежит некоторому классу (семейству) .

Пара (S,F) называется статистической моделью описания серии опытов, порождающих выборку .

Если распределение из класса F определены с точностью до некоторого векторного параметра , то такая статистическая модель называется параметрической и обозначается .

В некоторых случаях выборочное пространство может не зависеть от неизвестного параметра распределения .

В зависимости от вида статистической модели в математической статистике формулируются соответствующие задачи по обработке информации, содержащейся в выборке.

СВ , где - произвольная функция, определенная на выборочном пространстве S и не зависящая от распределения , называется статистикой.

Кривая регрессии.

регрессия вероятность статистический опыт

Условное математическое ожидание СВ как функция параметра называется регрессией на . График функции называется кривой регрессии на .

Точечная оценка.

Точечной (выборочной) оценкой неизвестного параметра распределения называется произвольная статистика построенная на выборке и принимающая значения в множестве .

Оценка параметра называется несмещенной, если ее МО равно , т. е. для любого .

Оценка параметра называется состоятельной, если она сходится по вероятности к , т. е. при для любого .

Оценка параметра называется сильно состоятельной, если она сходится почти наверное к , т. е. при для любого .

Очевидно, что если оценка сильно состоятельная, то она является также состоятельной.

Доверительный интервал.

Чтобы дать представление о точности и надежности оценки , в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.

Пусть для параметра получена из опыта несмещенная оценка . Назначим некоторую достаточно большую вероятность (например, или 0,99) такую, что событие с вероятностью можно считать практически достоверным, и найдем такое значение , для которого

Тогда диапазон практически возможных значений ошибки, возникающей при замене на , будет ; большие по абсолютной величине ошибки будут появляться только с малой вероятностью

Вероятность принято называть доверительной вероятностью, а интервал - доверительным интервалом. Границы интервала : и называются доверительными границами.

Интервальные оценки.

Пусть имеется параметрическая статическая модель , и по выборке , соответствующей распределению наблюдаемой СВ , требуется определить неизвестный параметр . Вместо точечных оценок, рассмотренных ранее, рассмотрим другой тип оценок неизвестного параметра .

Интервал со случайными концами, «накрывающий» с вероятностью , , неизвестный параметр , т. е.

,

называется доверительным интервалом (или интервальной оценкой) уровня надежности параметра .

Число называется доверительной вероятностью или уровнем доверия.

Уровень значимости.

Уровнем значимости статистического критерия называется вероятность ошибки 1-го рода . Вероятность ошибки 1-го рода может быть вычислена, если известно распределение .

Ошибки 1 и 2-го рода.

Ошибкой 1-го рода называется событие, состоящее в том, что гипотеза отвергается, когда она верна.

Ошибкой 2-го рода называется событие, состоящее в том, что принимается гипотеза , когда верна гипотеза .

Проверка статистических гипотез.

Статистической гипотезой H или просто гипотезой называется любое предположение относительно параметров или закона распределения СВ , проверяемое по выборке .

Проверяемая гипотеза называется основной (или нулевой) и обозначается . Гипотеза, конкурирующая с , называется альтернативной и обозначается .

Статистическая гипотеза называется простой, если она однозначно определяет параметр или распределение СВ . В противном случае гипотеза называется сложной.

Статистическим критерием (критерием согласия, критерием значимости или решающим правилом) проверки гипотезы называется правило, в соответствии с которым по реализации статистики гипотеза принимается или отвергается.

Критической областью статистического критерия называется область реализаций статистики , при которых гипотеза отвергается.

Доверительной областью статистического критерия называется область значений статистики , при которых гипотеза принимается.

Практическая часть.

Этап 1 (Вычисление оценок , неизвестных коэффициентов регрессии , ):

;

;

- оценка полезного сигнала (кривая регрессии);

- ошибка;

Формулируем все ошибки:

.

Находим наименьшую ошибку. Для этого продифференцируем уравнение по a и по b, приравняем к 0, получив систему:

- система нормальных уравнений.

Решаем систему методом Крамера:

Расчетная схема для оценок по методу наименьших квадратов.

Номер

Y

X

y^2

X*Y

x^2

δ^2=(y-at-b)^2

1

13,393

-2

179,37245

-26,786

4

84,52154547

2

13,207

-1,92

174,42485

-25,3574

3,6864

77,33345969

3

13,477

-1,84

181,62953

-24,7977

3,3856

63,01706699

4

11,911

-1,76

141,87192

-20,9634

3,0976

79,54344995

5

14,311

-1,68

204,80472

-24,0425

2,8224

35,20165139

6

14,979

-1,6

224,37044

-23,9664

2,56

21,89755599

7

14,437

-1,52

208,42697

-21,9442

2,3104

21,49126227

8

14,957

-1,44

223,71185

-21,5381

2,0736

12,46267515

9

13,044

-1,36

170,14594

-17,7398

1,8496

23,59662672

10

112,142

-1,28

12575,828

-143,542

1,6384

8991,966406

11

12

-1,2

144

-14,4

1,44

22,3767305

12

11,496

-1,12

132,15802

-12,8755

1,2544

21,61124277

13

12,927

-1,04

167,10733

-13,4441

1,0816

6,928339322

14

11,849

-0,96

140,3988

-11,375

0,9216

9,762864991

15

11,612

-0,88

134,83854

-10,2186

0,7744

7,705858746

16

10,401

-0,8

108,1808

-8,3208

0,64

11,56902772

17

8,755

-0,72

76,650025

-6,3036

0,5184

19,90687251

18

8,185

-0,64

66,994225

-5,2384

0,4096

19,76777254

19

9,681

-0,56

93,721761

-5,42136

0,3136

5,590769531

20

9,644

-0,48

93,006736

-4,62912

0,2304

3,29736681

21

9,073

-0,4

82,319329

-3,6292

0,16

3,244500827

22

8,535

-0,32

72,846225

-2,7312

0,1024

3,075233208

23

9,062

-0,24

82,119844

-2,17488

0,0576

0,410905071

24

7,602

-0,16

57,790404

-1,21632

0,0256

2,296447057

25

9,164

-0,08

83,978896

-0,73312

0,0064

0,399692323

26

6,913

0

47,789569

0

0

1,067444888

27

9,749

0,08

95,043001

0,77992

0,0064

5,704661232

28

5,543

0,16

30,724849

0,88688

0,0256

1,517679181

29

5,901

0,24

34,821801

1,41624

0,0576

0,083131718

30

5,901

0,32

34,821801

1,88832

0,1024

0,088381223

31

6,76

0,4

45,6976

2,704

0,16

3,034234095

32

4,593

0,48

21,095649

2,20464

0,2304

0,025766932

33

6,131

0,56

37,589161

3,43336

0,3136

5,217278758

34

3,651

0,64

13,329801

2,33664

0,4096

0,151906494

35

3,796

0,72

14,409616

2,73312

0,5184

1,255222992

36

3,663

0,8

13,417569

2,9304

0,64

2,474275069

37

3,068

0,88

9,412624

2,69984

0,7744

2,444839854

38

3,008

0,96

9,048064

2,88768

0,9216

4,364814626

39

2,809

1,04

7,890481

2,92136

1,0816

6,129731157

40

0,333

1,12

0,110889

0,37296

1,2544

0,342745729

41

1,73

1,2

2,9929

2,076

1,44

6,59493426

42

-0,072

1,28

0,005184

-0,09216

1,6384

1,827027788

43

0,479

1,36

0,229441

0,65144

1,8496

6,191594234

44

-3,18

1,44

10,1124

-4,5792

2,0736

0,34233389

45

-2,962

1,52

8,773444

-4,50224

2,3104

0,047752061

46

-5,849

1,6

34,210801

-9,3584

2,56

4,338314281

47

-6,153

1,68

37,859409

-10,337

2,8224

3,244489064

48

-7,911

1,76

62,583921

-13,9234

3,0976

8,842481446

49

-10,134

1,84

102,69796

-18,6466

3,3856

21,26146404

50

-11,662

1,92

136,00224

-22,391

3,6864

30,84025156

Сумма

411,949

-2

16631,368

-504,296

66,72

9666,40808

Подставив найденные суммы в систему, получаем оценки :

=-7,320193878

=7,946172245

Этап 2 (Вычисление оценки неизвестной дисперсии шумов ):

, где

n – число измерений;

m – число неизвестных параметров.

Этап 3:

По таблице находим квантиль Стьюдента.

m/a

0.85

0.9

0.95

0.975

47

1.0480

1.2998

1.6779

2.0117

48

1.0478

1.2994

1.6772

2.0106

49

1.0475

1.2991

1.6766

2.0096

50

1.0473

1.2987

1.6759

2.0086

Фрагмент таблицы 1

При λ=0,975 , квантиль Стьюдента 2.0086

Уровень доверия

;;

;

0,95

69,0225

30,7545

ymin

ymax

25,9848632

19,188257

25,077453

18,924436

24,1700428

18,660615

23,2626327

18,396794

22,3552225

18,132973

21,4478123

17,869153

20,5404021

17,605332

19,632992

17,341511

18,7255818

17,07769

17,8181716

16,813869

16,9107614

16,550048

16,0033513

16,286227

15,0959411

16,022407

14,1885309

15,758586

13,2811208

15,494765

12,3737106

15,230944

11,4663004

14,967123

10,5588902

14,703302

9,65148007

14,439482

8,7440699

14,175661

7,83665973

13,91184

6,92924956

13,648019

6,02183939

13,384198

5,11442921

13,120377

4,20701904

12,856556

3,29960887

12,592736

2,3921987

12,328915

1,48478853

12,065094

0,57737835

11,801273

-0,3300318

11,537452

-1,237442

11,273631

-2,1448522

11,009811

-3,0522623

10,74599

-3,9596725

10,482169

-4,8670827

10,218348

-5,7744928

9,9545271

-6,681903

9,6907063

-7,5893132

9,4268854

-8,4967234

9,1630646

-9,4041335

8,8992437

-10,311544

8,6354229

-11,218954

8,371602

-12,126364

8,1077812

-13,033774

7,8439603

-13,941184

7,5801395

-14,848595

7,3163186

-15,756005

7,0524978

-16,663415

6,788677

-17,570825

6,5248561

-18,478235

6,2610353

Список литературы

    Е.С. Кочетков “Метод наименьших квадратов”, Москва, МАИ, 1993.

    А.И. Кибзун “Теория вероятностей и математическая статистика. Базовый курс с примерами и задачами”, Москва, «Физматлит», 2002.

    Е.С. Вентцель “ Теория вероятностей ”, Москва, «Высшая школа», 1999.

1