Проверка истинности моделей множественной регрессии
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего профессионального образования
АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ им. И.И. ПОЛЗУНОВА
ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ РЕГИОНАЛЬНЫМ РАЗВИТИЕМ
Расчётное задание
по дисциплине: Эконометрика
Проверка истинности моделей множественной регрессии
Выполнил:
Филатов М.И.
2010
Исходные данные
|
Численность студентов (на 1000 человек населения) |
Динамика Валового Внутреннего Продукта (в постоянных ценах) |
Динамика валового накопления основного капитала (в постоянных ценах) |
|
x1 |
y |
x2 |
Россия |
64 |
131,2 |
103 |
Австралия |
50 |
123 |
169 |
Австрия |
29 |
117 |
115 |
Азербайджан |
22 |
177,3 |
103,4 |
Армения |
34 |
184,1 |
263,5 |
Беларусь |
195 |
164,9 |
162,2 |
Бельгия |
39 |
115 |
120 |
Венгрия |
42 |
139 |
178 |
Германия |
28 |
110 |
102 |
Грузия |
42 |
169,3 |
112,4 |
Дания |
40 |
114 |
134 |
Италия |
34 |
111 |
125 |
Казахстан |
61 |
163,4 |
126,7 |
Канада |
42 |
121 |
156 |
Киргизия |
46 |
134,7 |
83,3 |
Китай |
15 |
184 |
420 |
Мексика |
22 |
122 |
175 |
Нидерланды |
33 |
119 |
129 |
Норвегия |
47 |
120 |
130 |
Польша |
54 |
140 |
154 |
Республика Молдова |
34 |
129,1 |
134,1 |
Румыния |
32 |
115 |
132 |
Соединенное Королевство Великобритания |
38 |
122 |
146 |
США |
58 |
117 |
143 |
Таджикистан |
21 |
116,4 |
143,5 |
Украина |
51 |
122,7 |
122,6 |
Финляндия |
58 |
130 |
154 |
Франция |
36 |
115 |
129 |
Швеция |
48 |
121 |
129 |
Япония |
32 |
105 |
91¹ |
Все данные взяты за 2003 год. Данные взяты из статистического сборника Регионы России Социально-экономические показатели.
2003. Федеральная служба государственной статистики Построение модели множественной регрессии
Расчет параметров
Рассчитаем необходимые параметры:
Признак |
Ср. знач. |
СКО |
Характеристики тесноты связи |
β>i> |
b>i> |
Коэф-ты частной корр. |
F-критерий фактический |
Табличный F-критерий |
|
y |
131,77 |
22,74 |
R>yx1x2>=0,5963 |
||||||
x1 |
44,9 |
30,41 |
r>yx1>=0,2152 |
0,2639 |
0,1973 |
0,0672 |
r>yx1>>х2>=0,3112 |
F>x1>>факт>=2,8954 |
4,21 |
x2 |
146,19 |
60,57 |
r>yx2>=0,5353 |
0,5583 |
0,2097 |
0,2326 |
r>yx>>2х1>=0,5695 |
F>x>>2факт>=12,95 |
4,21 |
r>x1x2>=-0,0872 |
a=92,26 |
r>x1>>х2у>=-0,2453 |
F>факт>=7,45 |
3,35 |
Уравнение регрессии в стандартизованном масштабе:
t>y>> >=2639t>x>>1>+0,5583t>x>>2>
Уравнение множественной регрессии в естественной форме:
y>теор> =92,26+0,1973x>1 >+0,2097x>2>
Рассчитаем по этой формуле теоретические значения динамики ВВП и определим среднюю ошибку аппроксимации. Она равна 9,5254.
Выбор фактора, оказывающего большее влияние
1. Динамика валового накопления основного капитала оказывает большее влияние на динамику ВВП, чем численность студентов, так как
|β>2>|=0,5583 > |β>1>|=0,2639.
2. С помощью средних коэффициентов эластичности можно оценить относительную силу влияния динамики валового накопления основного капитала (х>2>) и числа студентов (х1) на динамику ВВП (у):
=0,0672, =0,2326,
следовательно, с увеличением валового накопления основного капитала на 1% от их среднего значения, динамика ВВП возрастает на 0,23% от своего среднего значения. А при увеличении числа студентов на 1% от своего среднего значения, динамика ВВП увеличится на 0,067% от своего среднего значения. Очевидно, что сила влияния второго фактора (динамики валового накопления основного капитала) на результативный признак (динамику ВВП) значительно больше, чем сила влияния первого фактора (числа студентов).
3.Сравнивая коэффициенты парной и частной корреляции
r>yx1> |
0,2152 |
r>yx2> |
0,5353 |
r>yx1x2> |
0,3112 |
r>yx2x1> |
0,5695 |
Коэффициенты парной и частной корреляции отличаются незначительно что говорит о слабой межфакторной связи. Связь между динамикой валового накопления основного капитала и динамикой валового внутреннего продукта (связь прямая и средне тесная) выше, чем связь между числом студентов и динамикой ВВП (связь прямая слабая).
4. По коэффициенту множественной корреляции: R>уx1x2>=0,5963 можно сделать вывод, что зависимость динамики ВВП от динамики валового накопления основного капитала и числа студентов характеризуется как средне тесная, в которой 59,63% вариации результативного признака определяется вариацией учтённых в модели факторов. Прочие факторы, не включённые в модель, составляют соответственно 35,56% от общей вариации.
4. Так как F – критерий Фишера превышает табличное значение:
F>факт>=7,45> >>F>табл>=3,35
то можно говорить о статистической значимости и надёжности уравнения регрессии.
5. Сравнивая частные F – критерии фактические с пороговой константой F>табл>=4,21, делаем вывод: F>х2факт>=12,95 > F>табл>, следовательно статистически подтверждена целесообразность включения в модель динамики валового накопления основного капитала, после числа студентов, т.к. этот фактор оказывает большее влияние.
Построение парных моделей регрессии
Представим данные полученные при построении парных моделей в таблице:
Модель |
Aср. |
r (ρ) |
Уравнение |
F>факт> |
Линейная |
10,89 |
0,5353 |
у=102,38+0,201х>1> |
11,24 |
Степенная |
11,008 |
0,4934 |
у=38,26×х>1>0,2481 |
9,01 |
Показательная |
10,47 |
0,5350 |
у=106,53×1,001х1 |
11,23 |
Гиперболическая |
12,59 |
0,3786 |
у=165,92-4546,04/х>1> |
4,68 |
Определение лучшей модели
1. Недопустимую ошибку аппроксимации имеют все 4 модели, однако у показательной модели она наименьшая, это говорит о том что линейная модель лучше аппроксимирует исходные данные чем остальные модели.
2. У линейной модели теснота связи самая сильная по сравнению с другими моделями. Это говорит о том, что показательная модель лучше подходит к нашим данным.
3. Проверив гипотезу о стат. значимости и надежности, получив значения F>факт> больше табличного во всех случаях, получаем, что все 4 уравнения являются стат. значимыми и надежными. Хотя линейная модель имеет наибольшее F>факт> по сравнению с другими моделями, это говорит о большей точности линейной модели.
По двум показателям линейная модель лучше остальных, это говорит о том, что линейная модель лучше аппроксимирует исходные данные. Однако множественная модель, на мой взгляд, лучше аппроксимирует данные, чем линейная, потому что множественная модель имеет допустимую ошибку аппроксимации и большую тесноту связи.
Проверка предпосылок МНК
1.Первую предпосылку проверим путём вычисления суммы значений остатков:
x1 |
x2 |
y |
x1x2 |
yx1 |
yx2 |
y^x |
y-y^x |
64 |
103 |
131,2 |
6592 |
8396,8 |
13513,6 |
126,48 |
4,72 |
50 |
169 |
123 |
8450 |
6150 |
20787 |
137,56 |
-14,56 |
29 |
115 |
117 |
3335 |
3393 |
13455 |
122,09 |
-5,09 |
22 |
103,4 |
177,3 |
2274,8 |
3900,6 |
18332,82 |
118,28 |
59,02 |
34 |
263,5 |
184,1 |
8959 |
6259,4 |
48510,35 |
154,21 |
29,89 |
195 |
162,2 |
164,9 |
31629 |
32155,5 |
26746,78 |
164,75 |
0,15 |
39 |
120 |
115 |
4680 |
4485 |
13800 |
125,11 |
-10,11 |
42 |
178 |
139 |
7476 |
5838 |
24742 |
137,87 |
1,13 |
28 |
102 |
110 |
2856 |
3080 |
11220 |
119,17 |
-9,17 |
42 |
112,4 |
169,3 |
4720,8 |
7110,6 |
19029,32 |
124,11 |
45,19 |
40 |
134 |
114 |
5360 |
4560 |
15276 |
128,25 |
-14,25 |
34 |
125 |
111 |
4250 |
3774 |
13875 |
125,18 |
-14,18 |
61 |
126,7 |
163,4 |
7728,7 |
9967,4 |
20702,78 |
130,86 |
32,54 |
42 |
156 |
121 |
6552 |
5082 |
18876 |
133,25 |
-12,25 |
46 |
83,3 |
134,7 |
3831,8 |
6196,2 |
11220,51 |
118,80 |
15,90 |
15 |
420 |
184 |
6300 |
2760 |
77280 |
183,27 |
0,73 |
22 |
175 |
122 |
3850 |
2684 |
21350 |
133,29 |
-11,29 |
33 |
129 |
119 |
4257 |
3927 |
15351 |
125,82 |
-6,82 |
47 |
130 |
120 |
6110 |
5640 |
15600 |
128,79 |
-8,79 |
54 |
154 |
140 |
8316 |
7560 |
21560 |
135,20 |
4,80 |
34 |
134,1 |
129,1 |
4559,4 |
4389,4 |
17312,31 |
127,08 |
2,02 |
32 |
132 |
115 |
4224 |
3680 |
15180 |
126,25 |
-11,25 |
38 |
146 |
122 |
5548 |
4636 |
17812 |
130,37 |
-8,37 |
58 |
143 |
117 |
8294 |
6786 |
16731 |
133,69 |
-16,69 |
21 |
143,5 |
116,4 |
3013,5 |
2444,4 |
16703,4 |
126,49 |
-10,09 |
51 |
122,6 |
122,7 |
6252,6 |
6257,7 |
15043,02 |
128,03 |
-5,33 |
58 |
154 |
130 |
8932 |
7540 |
20020 |
135,99 |
-5,99 |
36 |
129 |
115 |
4644 |
4140 |
14835 |
126,41 |
-11,41 |
48 |
129 |
121 |
6192 |
5808 |
15609 |
128,78 |
-7,78 |
32 |
91 |
105 |
2912 |
3360 |
9555 |
117,65 |
-12,65 |
сумма |
0,0000 |
2.Случайный характер остатков. Проверим графически:
Из графика зависимости остатков ε>i> от теоретических значений результативного признака видно, что точки распределены случайно, следовательно, ε>i>> >представляют собой случайные величины и МНК оправдан.
3. Наличие гомоскедастичности. Воспользуемся методом Гольдфельда – Квандта. Число исключаемых центральных наблюдений примем равным 8. Тогда в каждой группе будет по 11 наблюдений. Результаты расчетов представим в таблице:
x1 |
x2 |
y |
x1x2 |
yx1 |
yx2 |
y^x |
y-y^x |
Ai |
(y-y^x)^2 |
46 |
83,3 |
134,7 |
3831,8 |
6196,2 |
11220,51 |
132,15 |
2,55 |
1,8961 |
6,52 |
32 |
91 |
105 |
2912 |
3360 |
9555 |
128,41 |
-23,41 |
22,2973 |
548,13 |
28 |
102 |
110 |
2856 |
3080 |
11220 |
127,98 |
-17,98 |
16,3451 |
323,27 |
64 |
103 |
131,2 |
6592 |
8396,8 |
13513,6 |
139,08 |
-7,88 |
6,0058 |
62,09 |
22 |
103,4 |
177,3 |
2274,8 |
3900,6 |
18332,82 |
126,24 |
51,06 |
28,7972 |
2606,87 |
42 |
112,4 |
169,3 |
4720,8 |
7110,6 |
19029,32 |
133,02 |
36,28 |
21,4308 |
1316,41 |
29 |
115 |
117 |
3335 |
3393 |
13455 |
129,22 |
-12,22 |
10,4468 |
149,40 |
39 |
120 |
115 |
4680 |
4485 |
13800 |
132,65 |
-17,65 |
15,3447 |
311,40 |
51 |
122,6 |
122,7 |
6252,6 |
6257,7 |
15043,02 |
136,51 |
-13,81 |
11,2549 |
190,71 |
34 |
125 |
111 |
4250 |
3774 |
13875 |
131,48 |
-20,48 |
18,4460 |
419,23 |
61 |
126,7 |
163,4 |
7728,7 |
9967,4 |
20702,78 |
139,87 |
23,53 |
14,4012 |
553,73 |
0,0000 |
15,1514 |
6487,74 |
x1 |
x2 |
y |
x1x2 |
yx1 |
yx2 |
y^x |
y-y^x |
Ai |
(y-y^x)^2 |
21 |
143,5 |
116,4 |
3013,5 |
2444,4 |
16703,4 |
119,32 |
-2,92 |
2,5060 |
8,51 |
38 |
146 |
122 |
5548 |
4636 |
17812 |
124,14 |
-2,14 |
1,7530 |
4,57 |
58 |
154 |
130 |
8932 |
7540 |
20020 |
131,22 |
-1,22 |
0,9407 |
1,50 |
54 |
154 |
140 |
8316 |
7560 |
21560 |
130,25 |
9,75 |
6,9625 |
95,01 |
42 |
156 |
121 |
6552 |
5082 |
18876 |
127,90 |
-6,90 |
5,7020 |
47,60 |
195 |
162,2 |
164,9 |
31629 |
32155,5 |
26746,78 |
166,75 |
-1,85 |
1,1203 |
3,41 |
50 |
169 |
123 |
8450 |
6150 |
20787 |
133,47 |
-10,47 |
8,5103 |
109,57 |
22 |
175 |
122 |
3850 |
2684 |
21350 |
128,35 |
-6,35 |
5,2041 |
40,31 |
42 |
178 |
139 |
7476 |
5838 |
24742 |
134,04 |
4,96 |
3,5697 |
24,62 |
34 |
263,5 |
184,1 |
8959 |
6259,4 |
48510,35 |
155,95 |
28,15 |
15,2883 |
792,18 |
15 |
420 |
184 |
6300 |
2760 |
77280 |
195,01 |
-11,01 |
5,9854 |
121,29 |
0,0000 |
5,2311 |
1248,57 |
Величина R=0,1924 (1248,57/6487,74), меньше табличного значения F-критерия, следовательно, наличие гомоскедастичности и отсутствие гетероскедастичности.
4.Отсутствие автокорреляции. Тест Дарбина–Уотсона:
x1 |
x2 |
y |
y^ |
lу-у^l |
(lу-у^l/у)*100 |
у-у^ |
ei-ei-1 |
(ei-ei-1)^2 |
(у-у^)^2 |
64 |
103 |
131 |
126,48 |
4,715497 |
3,594 |
-4,715 |
-4,7155 |
22,2 |
22,24 |
50 |
169 |
123 |
137,56 |
14,55865 |
11,836 |
14,559 |
19,27414 |
371,5 |
211,95 |
29 |
115 |
117 |
122,09 |
5,093094 |
4,353 |
5,093 |
-9,46555 |
89,6 |
25,94 |
22 |
103 |
177 |
118,28 |
59,02032 |
33,288 |
-59,020 |
-64,1134 |
4110,5 |
3483,40 |
34 |
264 |
184 |
154,21 |
29,88682 |
16,234 |
-29,887 |
29,13349 |
848,8 |
893,22 |
195 |
162 |
165 |
164,75 |
0,151302 |
0,092 |
-0,151 |
29,73552 |
884,2 |
0,02 |
39 |
120 |
115 |
125,11 |
10,11485 |
8,796 |
10,115 |
10,26615 |
105,4 |
102,31 |
42 |
178 |
139 |
137,87 |
1,133281 |
0,815 |
-1,133 |
-11,2481 |
126,5 |
1,28 |
28 |
102 |
110 |
119,17 |
9,170267 |
8,337 |
9,170 |
10,30355 |
106,2 |
84,09 |
42 |
112 |
169 |
124,11 |
45,18646 |
26,690 |
-45,186 |
-54,3567 |
2954,7 |
2041,82 |
40 |
134 |
114 |
128,25 |
14,24733 |
12,498 |
14,247 |
59,43379 |
3532,4 |
202,99 |
34 |
125 |
111 |
125,18 |
14,17636 |
12,771 |
14,176 |
-0,07097 |
0,0 |
200,97 |
61 |
127 |
163 |
130,86 |
32,53879 |
19,914 |
-32,539 |
-46,7152 |
2182,3 |
1058,77 |
42 |
156 |
121 |
133,25 |
12,25437 |
10,128 |
12,254 |
44,79316 |
2006,4 |
150,17 |
46 |
83,3 |
135 |
118,80 |
15,89794 |
11,802 |
-15,898 |
-28,1523 |
792,6 |
252,74 |
15 |
420 |
184 |
183,27 |
0,725914 |
0,395 |
-0,726 |
15,17202 |
230,2 |
0,53 |
22 |
175 |
122 |
133,29 |
11,29077 |
9,255 |
11,291 |
12,01669 |
144,4 |
127,48 |
33 |
129 |
119 |
125,82 |
6,817621 |
5,729 |
6,818 |
-4,47315 |
20,0 |
46,48 |
47 |
130 |
120 |
128,79 |
8,790167 |
7,325 |
8,790 |
1,972546 |
3,9 |
77,27 |
54 |
154 |
140 |
135,20 |
4,796736 |
3,426 |
-4,797 |
-13,5869 |
184,6 |
23,01 |
34 |
134 |
129 |
127,08 |
2,015804 |
1,561 |
-2,016 |
2,780932 |
7,7 |
4,06 |
32 |
132 |
115 |
126,25 |
11,24923 |
9,782 |
11,249 |
13,26503 |
176,0 |
126,55 |
38 |
146 |
122 |
130,37 |
8,368454 |
6,859 |
8,368 |
-2,88077 |
8,3 |
70,03 |
58 |
143 |
117 |
133,69 |
16,68649 |
14,262 |
16,686 |
8,318035 |
69,2 |
278,44 |
21 |
144 |
116 |
126,49 |
10,08938 |
8,668 |
10,089 |
-6,59711 |
43,5 |
101,80 |
51 |
123 |
123 |
128,03 |
5,32814 |
4,342 |
5,328 |
-4,76124 |
22,7 |
28,39 |
58 |
154 |
130 |
135,99 |
5,992662 |
4,610 |
5,993 |
0,664522 |
0,4 |
35,91 |
36 |
129 |
115 |
126,41 |
11,40967 |
9,921 |
11,410 |
5,417008 |
29,3 |
130,18 |
48 |
129 |
121 |
128,78 |
7,777864 |
6,428 |
7,778 |
-3,63181 |
13,2 |
60,50 |
32 |
91 |
105 |
117,65 |
12,65349 |
12,051 |
12,653 |
4,875628 |
23,8 |
160,11 |
19110,43 |
10002,65 |
Исходя из статистики Дарбина-Уотсона, можно сделать вывод, что автокорреляция отсутствует, так как 1,91 находится в промежутке (1,339;2,661) (d>2>; 4-d>2>). Следовательно, значения остатков распределены независимо друг от друга. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.
Таким образом, не все предпосылки выполнились, это говорит о недостаточной надежности уравнения множественной регрессии. Возможно, можно было бы и получить надежную модель, если исключить из данных страны значение динамики ВВП, которых сильно отличается от других.