Зависимость потребления бензина от количества автомобилей
Кафедра высшей математики
Курсовая работа
по теории вероятностей и математической статистике
на тему:
« Зависимость потребления бензина от количества автомобилей »
Дубна, 2003
Оглавление
ВВЕДЕНИЕ
ПОСТАНОВКА ЗАДАЧИ
ДИАГРАММА РАССЕИВАНИЯ
ПОСТРОЕНИЕ ПРЯМОЙ Y=AX+B, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI)В СРЕДНЕМ КВАДРАТИЧНОМ
ПОСТРОЕНИЕ КРИВОЙ Y=PX2+QX+R, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI) В СРЕДНЕМ КВАДРАТИЧНОМ
АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ И ВЫВОД О ЗАВИСИМОСТИ XI И YI
ВЫВОД
СПИСОК ЛИТЕРАТУРЫ
Введение
В данной работе исследуется зависимость потребления бензина в городе от количества автомобилей с помощью методов математической статистики.
Бензин – смесь легких углеводородов с t>кип> 30-205 °C; прозрачная жидкость, плотность 0,70-0,78 г/см3. Получают главным образом перегонкой или крекингом нефти. Топливо для карбюраторных авто- и авиадвигателей; экстрагент и растворитель для жиров, смол, каучуков.
Автомобиль – транспортная безрельсовая машина главным образом на колесном ходу, приводимая в движение собственным двигателем (внутреннего сгорания, электрическим или паровым). Различают автомобили пассажирские (легковые и автобусы), грузовые, специальные (пожарные, санитарные и др.) и гоночные. Скорость легковых автомобилей до 300 км/ч, гоночных до 1020 км/ч (1993), грузоподъемность грузовых автомобилей до 180 т.
Обычно в любой области науки при изучении двух величин проводятся эксперименты, и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.
Если мы рассматриваем слабо формализованные системы, которые трудно поддаются однозначным и точным описаниям, связь между величинами X и Y изначально корреляционная. Это связано, что Y зависит не только от X, но и от других параметров.
В этом случае, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможным способом была бы близка к экспериментальным точкам. Такая функция называется функцией регрессии.
Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.
Постановка задачи
Даны выборки
– количество автомобилей, – потребление бензина.
Задача состоит в изучении характера зависимости
1. Изобразить точки () на плоскости (на миллиметровой бумаге и в виде точечного графика на компьютере)
2. Методом наименьших квадратов определить числа такие, что прямая наименее уклоняется от точек () в среднем квадратичном.
3. Методом наименьших квадратов определить числа такие, что парабола наименее уклоняется от точек () в среднем квадратичном.
4. Сравнить между собой результаты пунктов 2. и 3.
5. С помощью сравнения статистик
где объем выборки, ответить на вопросы:
1) Подтвердилась ли гипотеза о том, что зависимость между и близка к линейной ?
2) Подтвердилась ли гипотеза о том, что зависимость между и
близка к квадратичной?
3) Какая из двух кривых - прямая или парабола - меньше отклоняется от точек выборки () ?
Диаграмма рассеивания
Даны выборки и , которые можно интерпретировать следующим образом: — потребление бензина, — количество автомобилей. Задача состоит в изучении характера зависимости между и . Исходные выборки представлены в таблице:
-
X
Y
X
Y
X
Y
X
Y
8,64558
116,76
22,2483
112,8
35,3723
113,328
48,6586
125,396
9,30954
115,72
22,38
114,03
35,8685
119,397
49,2468
126,783
9,54538
109,996
22,743
114,952
36,0494
124,624
49,0515
125,652
9,91695
126,634
23,0127
117,027
36,5302
118,734
49,7645
119,88
10,3459
112,28
23,9216
110,664
36,7256
126,531
50,6983
129,604
11,1794
115,564
24,7213
120,474
37,2568
125,601
50,4538
125,877
12,0403
116,048
25,2151
120,749
38,6184
121,974
51,7368
124,935
12,4383
114,524
25,5633
125,365
38,669
123,196
52,3859
121,572
12,8887
114,716
26,5224
117,494
39,2617
119,925
52,932
127,416
13,3673
107,328
26,654
112,982
40,1783
122,293
53,1557
123,507
13,5643
114,422
26,7975
112,34
40,239
120,465
54,0261
128,29
14,4435
118,925
27,6272
127,172
41,1804
122,419
54,4972
136,727
14,4909
123,297
28,2653
121,229
40,8874
127,014
54,3892
125,732
15,3408
119,606
28,6799
119,246
42,0704
133,402
55,475
124,107
15,5866
116,443
28,9424
113,728
42,7372
136,142
55,7691
128,79
16,9966
119,384
29,8652
124,189
42,8423
123,36
55,912
139,417
17,4323
116,428
30,2303
131,775
43,6994
128,363
56,6281
127,151
17,2341
123,058
30,6092
113,164
44,4041
118,225
57,6097
130,697
17,7988
116,349
31,6162
122,517
45,0372
126,604
57,3441
142,839
18,5831
116,665
32,1788
117,256
45,1258
127,831
58,699
134,079
19,4722
118,844
32,7243
114,794
45,4427
122,39
59,0407
130,316
19,8208
123,205
32,7933
130,624
46,3461
129,182
59,3109
129,148
20,6594
109,789
33,1236
133,529
46,5863
127,344
59,8175
135,398
20,8651
118,634
34,0453
123,582
47,3429
124,694
60,3217
131,061
21,0348
110,347
34,9061
135,169
47,7225
117,103
61,2562
126,388
Изобразим эти точки в виде точечного графика с соответствующими координатами (, ); для этого надо найти размах выборки по X и Y и выбрать соответствующий масштаб. Сначала находим и , затем размах выборки по X, которая вычисляется по формуле и в результате равна 52,61062. Аналогично и , а размах выборки поY получим равный 35,511. Глядя на размах выборок по X и по Y, выбираем масштаб диаграммы рассеивания и строим её.
рис.1. Диаграмма рассеивания
По формуле где
можно найти коэффициент корреляции:
Он не равен нулю, следовательно, зависимость между X и Y существует.
Построение прямой y=ax+b, наименее отклоняющейся от точек (X>i>;Y>i>)в среднем квадратичном
Для построения прямой y = ax + b, наименее отклоняющейся от точек в среднем квадратичном, необходимо методом наименьших квадратов определить числа a, b такие, что функция двух переменных принимает минимальное значение. Данная функция имеет вид:
.
Зная, что необходимым условием минимума функции является равенство нулю ее первых частных производных, имеем следующую систему для нахождения значений :
,
Данная система может быть представлена в виде:
,
где
В результате получим что:
Докажем теперь, что в точке функция имеет минимум. Достаточным условием существования экстремума функции двух переменных является следующее неравенство:
.
Для доказательства введем следующие обозначения:
Составим дискриминант . Тогда, если , то функция имеет в точке экстремум, а именно минимум при А>0 (или С>0). Из системы видно, что эти условия выполняются: = , С=200>0.
То есть точка действительно является точкой минимума.
Следовательно, функция при данных значениях имеет следующий график:
рис.2. График уравнения линейной регрессии
Построение кривой y=px2+qx+r, наименее отклоняющейся от точек (X>i>;Y>i>) в среднем квадратичном
Для построения кривой , наименее отклоняющейся от точек в среднем квадратичном, необходимо методом наименьших квадратов определить числа , и такие, что функция трех переменных принимает минимальное значение. Данная функция имеет вид:
Аналогично нахождению значений для прямой составляем систему трех линейных уравнений, которая является необходимым условием минимума функции:
Данная система является системой линейных однородных уравнений. Решая эту систему методом Крамера и зная, что:
составляем определители, состоящие из коэффициентов при и столбца свободных членов.
Значения находим делением соответствующих определителей.
= = =
Докажем теперь, что в точке функция имеет минимум. Достаточным условием существования минимума функции трех переменных является следующее неравенство:
d.
Получаем следующее уравнение:
Воспользуемся критерием Сильвестра, т.е. найдем миноры 1-ого, 2-ого и 3-ого порядков и докажем, что они положительные.
==
Найдем миноры первого, второго и третьего порядков для этого определителя:
Так как все миноры положительны, то по критерию Сильвестра d, и функция имеет минимум в точке .
Таким образом, парабола имеет следующий график:
рис.3. График уравнения параболической регрессии
Анализ полученных результатов и вывод о зависимости X>i> и Y>i>
рис.4. Сравнение линейной и параболической регрессий
Для сравнения полученных результатов построения кривых и определим значения статистик:
Поскольку и , можно говорить о том, что зависимость между и близка и к линейной, и к квадратичной. При этом парабола меньше отклоняется от точек и , чем прямая
Вывод
Зависимость потребления бензина от количества автомобилей близка к линейной и к квадратичной. Однако видно, что разница между значениями статистик небольшая. Следовательно, с практической точки зрения удобнее приближать точки выборки и к прямой . Выявление зависимости между потреблением бензина и количеством автомобилей пригодится для понимания ситуации, которая складывается у нас на дорогах и влияет на природу, поскольку потребление бензина всегда сопровождается вредными выбросами.
Список литературы
Гмурман В.Е. Теория вероятностей и математическая статистика. — М.: Высшая школа 1998.
Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике — М.: Высшая школа 1998.
Ивашев-Мусатов О. С. Теория вероятностей и математическая статистика — М.: Наука 1979.
Мазный Г.Л., Прогулова Т.Б. Методическое пособие к курсовому проектированию по ВМ и информатике. — Дубна: Кафедра ВМ и САУ, 1996.