Выдержка из текста работы
Модель |
Пробег, тыс. км |
Год выпуска |
Мощность, л.с. |
Объём двигателя |
Стоимость, тыс. руб. |
|
X1 |
X2 |
X3 |
X4 |
Y |
||
1 |
210000 |
1998 |
128 |
2 |
299000 |
|
2 |
250000 |
1996 |
145 |
2 |
240 000 |
|
3 |
260000 |
1998 |
132 |
2 |
325000 |
|
4 |
260000 |
1998 |
145 |
2 |
295000 |
|
5 |
120000 |
2008 |
150 |
2 |
820000 |
|
6 |
87000 |
2008 |
166 |
2,4 |
870000 |
|
7 |
85000 |
2008 |
150 |
2 |
810000 |
|
8 |
67000 |
2009 |
150 |
2 |
828000 |
|
9 |
260000 |
1998 |
132 |
2 |
325000 |
|
10 |
90000 |
2008 |
166 |
2,4 |
899000 |
|
11 |
10000 |
2012 |
166 |
2,4 |
1230000 |
|
12 |
30000 |
2012 |
150 |
2 |
1100000 |
|
13 |
106000 |
2008 |
150 |
2 |
750000 |
|
14 |
91000 |
2008 |
166 |
2,4 |
830000 |
|
15 |
240000 |
1998 |
132 |
2 |
295000 |
|
16 |
28000 |
2011 |
166 |
2,4 |
1200000 |
|
17 |
99000 |
2007 |
150 |
2 |
750000 |
|
18 |
310000 |
1996 |
130 |
2 |
235000 |
|
19 |
80000 |
2008 |
150 |
2 |
800000 |
|
20 |
30000 |
2011 |
150 |
2 |
1080000 |
|
21 |
63000 |
2011 |
150 |
2 |
950000 |
|
22 |
120000 |
2004 |
150 |
2 |
575000 |
|
23 |
88000 |
2009 |
166 |
2,4 |
930000 |
|
24 |
277000 |
1998 |
140 |
2 |
205000 |
|
25 |
192000 |
1997 |
128 |
2 |
320000 |
|
26 |
210000 |
1998 |
128 |
2 |
280000 |
|
27 |
87000 |
2007 |
150 |
2 |
758000 |
|
28 |
86000 |
2007 |
150 |
2 |
711000 |
|
29 |
130000 |
2009 |
166 |
2,2 |
525000 |
|
30 |
200000 |
1996 |
150 |
2 |
265000 |
Задача состоит в построении линейной модели зависимости цены автомобиля от его пробега, года выпуска, мощности и объёма двигателя.
Цена автомобиля — это зависимая переменная Y. В качестве независимых, объясняющих переменных были выбраны: пробег (км) X1, год выпуска X2, мощность двигателя (л.с.) X3, объём двигателя (л) X4.
1) Корреляция
Корреляция (корреляционная зависимость). Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются распространенными показателями тесноты связи при статистическом анализе данных.
Действия для выполнения корреляционного анализа:
· Выбрать команду «Формулы — Фставить функцию».
· В диалоговом окне функций выберите инструмент Корреляция, а затем щелкнуть на кнопке ОК.
· В диалогом окне Корреляция необходимо ввести диапазон ячеек, содержащих исходные данные (значения Х1 и У) и так для каждой переменной.
Таблица №2
Матрица парных коэффициентов корреляции
Пробег, тыс. км (X1) |
Год выпуска (X2) |
Мощность, л.с. (X3) |
Объём двигателя (X4) |
Стоимость, тыс. руб. (Y) |
||
Пробег, тыс. км (X1) |
1 |
|||||
Год выпуска (X2) |
-0,949144523 |
1 |
||||
Мощность, л.с. (X3) |
-0,734488215 |
0,77209142 |
1 |
|||
Объём двигателя (X4) |
-0,429421734 |
0,45203331 |
0,75924021 |
1 |
||
Стоимость, тыс. руб. (Y) |
-0,950561029 |
0,95387207 |
0,74541927 |
0,52197113 |
1 |
Значения коэффициентов корреляции лежат в интервале [-1,1]. Положительное значение коэффициента свидетельствует о положительной связи между показателями, т.е. при увеличении одного из показателей второй показатель также статистически возрастает. Отрицательное значение коэффициента свидетельствует об отрицательной связи между показателями, т.е. при увеличении одного показателя второй статистически уменьшается. Чем ближе абсолютное значение коэффициента к 1, тем теснее связь между показателями.
Связь считается достаточно сильной, если коэффициент корреляции по абсолютной величине больше 0,7, и слабой, если меньше 0,4. Если значение коэффициента равно нулю, то связь между показателями отсутствует. Этот коэффициент дает объективную статистическую оценку тесноты связи между показателями.
Проанализируем связь между зависимой переменной Y и факторами:
r(Y;X1) = -0,950561029 — связь сильная и обратная, с увеличением пробега автомобиля, зависимая переменная Y, т.е. цена автомобиля уменьшается.
r(Y;X2) = 0,95387207 — сильная и прямая, с увеличением года выпуска автомобиля, его цена увеличивается.
r(Y;X3) = 0,74541927 — связь больше средней и прямая, с увеличением мощности двигателя автомобиля, его цена увеличивается.
r(Y;X4) = 0,52197113 — связь средняя и прямая, с увеличением объёма двигателя автомобиля, его цена увеличивается.
Проанализируем связь между факторами:
r(X1;X2) = -0,949144523 — связь между факторами X1 и X2 сильная и обратная.
r(X1;X3) = -0,734488215 — связь между факторами X1 и X3 средняя и обратная.
r(X1;X4) = -0,429421734 — связь между факторами X1 и X4 средняя и прямая
r(X2;X3) = 0,77209142 — связь между факторами X2 и X3 сильная и прямая.
r(X2;X4) = 0,45203331 — связь между факторами X2 и X4 средняя и обратная.
r(X3;X4) = 0,75924021 — связи между факторами X3 и X4 сильная и прямая.
2) Множественная регрессия
Множественная регрессия — уравнение связи с несколькими независимыми переменными.
Действия для выполнения регрессионного анализа:
· Выбрать команду «Сервис — Анализ данных».
· Выберем инструмент Регрессия, а затем ОК.
· В поле Входной интервал У введем адрес значений У из заданной таблицы. В поле Входной интервал Х — адрес значений Х.
Таблица №3
Регрессионная статистика |
||
Множественный R |
0,97392084 |
|
R-квадрат |
0,948521803 |
|
Нормированный R-квадрат |
0,940285292 |
|
Стандартная ошибка |
78880,02577 |
|
Наблюдения |
30 |
Таблица №4
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
4 |
2,86614E+12 |
7,16536E+11 |
115,1606239 |
1,01022E-15 |
|
Остаток |
25 |
1,55551E+11 |
6222058466 |
|||
Итого |
29 |
3,0217E+12 |
Таблица №5
Показатели качества модели
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-63491995,27 |
17366279,82 |
-3,656050458 |
0,001191486 |
-99258517,77 |
-27725472,77 |
-99258517,77 |
-27725472,77 |
|
Переменная X 1 |
-1,697586114 |
0,533652284 |
-3,181071578 |
0,003892246 |
-2,796663558 |
-0,59850867 |
-2,796663558 |
-0,59850867 |
|
Переменная X 2 |
32046,06567 |
8674,941071 |
3,694096065 |
0,001081994 |
14179,69024 |
49912,4411 |
14179,69024 |
49912,4411 |
|
Переменная X 3 |
-5085,609336 |
2626,4833 |
-1,936280857 |
0,064216372 |
-10494,95291 |
323,7342344 |
-10494,95291 |
323,7342344 |
|
Переменная X 4 |
428928,5801 |
145582,7861 |
2,946286382 |
0,006867326 |
129095,222 |
728761,9381 |
129095,222 |
728761,9381 |
Таблица №6
Коэффициенты |
||
Y-пересечение |
-63491995,27 |
|
Переменная X 1 |
-1,697586114 |
|
Переменная X 2 |
32046,06567 |
|
Переменная X 3 |
-5085,609336 |
|
Переменная X 4 |
428928,5801 |
3) Уравнение множественной регрессии
Уравнение множественной регрессии — метод определения зависимости среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости у = f(х), когда каждому значению независимой переменной х соответствует одно определенное значение величины у, при регрессионной связи одному и тому же значению х могут соответствовать в зависимости от случая различные значения величины у.
Y = a0 + a1*x1 + a2*x2 +…+ an*xn — уравнение множественной регрессии.
Уравнение будет иметь вид:
Yрасч= -63491995,27-1,697×1 +32046,06567×2 -5085,609336×3+428928,5801×4
4) Критерий Фишера
Критерий Фишера — (Значимость полученного уравнения) определение значимых различий между групповыми средними в установке дисперсионного анализа.
Фактическое значение F критерия Фишера = Fрасч =115,1606239
Таблица № 7
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
4 |
2,86614E+12 |
7,16536E+11 |
115,1606239 |
1,01022E-15 |
|
Остаток |
25 |
1,55551E+11 |
6222058466 |
|||
Итого |
29 |
3,0217E+12 |
Рассчитываем Fкр «FРАСПОБР» с заданными условиями (0,05;4;26).
Fкр = 2,75871047
Fрасч > F кр
115,1606239> 2,75871047 — Вывод: уравнение регрессии значимо.
5) T — статистика — используем для проверки значимости параметров уравнения (критерий Стьюдента)
Используем функцию «СТЬЮДРАСПОБР» с заданными условиями
(0,05/4;25).
Tкр = 2,691557635
Таблица № 8
t-статистика |
t табл.(0,05/4;25) |
|||
-3,181071578 |
< |
2,691557635 |
Не значим |
|
3,694096065 |
> |
2,691557635 |
Значим |
|
-1,936280857 |
< |
2,691557635 |
Не значим |
|
2,946286382 |
> |
2,691557635 |
Значим |
По полученным параметрам оценки адекватности коэффициентов наиболее значимым показателем будет второй аргумент Х2 (пробег автомобиля) и X4 (объём двигателя).
Вывод: Наиболее важным фактором, влияющим да переменную Y (Цена автомобиля) является X2 (Год выпуска автомобиля) и X4 (объём двигателя)
Таблица № 9
Регрессионная статистика |
||
Множественный R |
0,959286917 |
|
R-квадрат |
0,92023139 |
|
Нормированный R-квадрат |
0,914322604 |
|
Стандартная ошибка |
94484,27065 |
|
Наблюдения |
30 |
Таблица № 10
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
2 |
2,78066E+12 |
1,39033E+12 |
155,7395041 |
1,49531E-15 |
|
Остаток |
27 |
2,41036E+11 |
8927277400 |
|||
Итого |
29 |
3,0217E+12 |
Таблица № 11
Показатели качества модели
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-100588954,1 |
6695547,456 |
-15,02326057 |
1,23959E-14 |
-114327082,5 |
-86850825,64 |
-114327082,5 |
-86850825,64 |
|
X2 |
50270,40816 |
3394,951729 |
14,80739998 |
1,75891E-14 |
43304,54268 |
57236,27364 |
43304,54268 |
57236,27364 |
|
X4 |
225357,1429 |
120347,3999 |
1,872555146 |
0,071997146 |
-21575,32192 |
472289,6076 |
-21575,32192 |
472289,6076 |
Уравнение будет иметь вид:
У расч = -100588954,1+ 50270,40816х2 +225357,1429×4
а2 > 0, то связь между результативным признаком У — ценой автомобиля и фактором Х2 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 год, то цена автомобиля увеличится на 50270,40 руб.
а4 > 0, то связь между результативным признаком У — мощностью двигателя автомобиля и фактором Х4 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 л.с., то цена автомобиля увеличится на 225357,14 руб.
6) Коэффициент детерминации
Коэффициент детерминации — это доля объясненной дисперсии отклонений зависимой переменной от ее среднего значения. Зависимая переменная объясняется (прогнозируется) с помощью функции от объясняющих переменных. R2 коэффициент детерминации — показывает, какая доля дисперсии результативного признака объясняется влиянием объясняющих переменных.
Таблица № 12
Регрессионная статистика |
||
Множественный R |
0,959286917 |
|
R-квадрат |
0,92023139 |
|
Нормированный R-квадрат |
0,914322604 |
|
Стандартная ошибка |
94484,27065 |
|
Наблюдения |
30 |
R2ху = (0,959286917)2 = 0,92023139
Данный показатель 0,92023139 или 92% говорит о том, что связь сильная. На долю вариации факторных признаков приходится большая часть по сравнению с неучтенными в модели факторами, влияющими на изменение результата. Вариация стоимости Цена автомобиля, (руб.) (Y) объясняется вариациями факторов: Год выпуска автомобиля (Х2) и объём двигателя автомобиля (X4)
7) Критерий Фишера
Фактическое значение F критерия Фишера = Fрасч = 155,7395041
Таблица № 13
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
2 |
2,78066E+12 |
1,39033E+12 |
155,7395041 |
1,49531E-15 |
|
Остаток |
27 |
2,41036E+11 |
8927277400 |
|||
Итого |
29 |
3,0217E+12 |
Рассчитываем Fкр «FРАСПОБР» с заданными условиями (0,05;2;27).
Fкр = 3,354130829
Fрасч > F кр
155,7395041> 3,354130829 — Вывод: уравнение регрессии значимо.
8) T — статистика
Используем функцию «СТЬЮДРАСПОБР» с заданными условиями (0,05/2;27).
Tкр = 2,373417186
Таблица № 14
t-статистика |
t табл.(0,05/3;27) |
|||
14,80739998 |
> |
2,373417186 |
Значим |
|
1,872555146 |
< |
2,373417186 |
Не значим |
Второй коэффициент не подтвердил свою значимость, тогда как первый очень значительный.
Уравнение будет иметь вид:
У расч = -100588954,1+ 50270,40816х2
9) Средняя ошибка аппроксимации
Средняя ошибка аппроксимации — среднее отклонение расчетных значений от фактических.
Таблица 15
Y |
X2 |
Yрасч. |
Ex |
E^2 |
(E-Eср)^2 |
(Et — Et-1)^2 |
E/Y |
(Y-Yср)^2 |
|
299000 |
1998 |
302791,9463 |
-3 792 |
14 378 857 |
-3791,946308 |
— |
-0,012682095 |
1,08921E+11 |
|
240000 |
1996 |
196503,7666 |
43 496 |
1 891 922 319 |
43496,23339 |
3,52517E+18 |
0,181234306 |
57600000000 |
|
325000 |
1998 |
302791,9463 |
22 208 |
493 197 649 |
22208,05369 |
1,95643E+18 |
0,068332473 |
1,05625E+11 |
|
295000 |
1998 |
302791,9463 |
-7 792 |
60 714 427 |
-7791,946308 |
1,87042E+17 |
-0,026413377 |
87025000000 |
|
820000 |
2008 |
834232,8448 |
-14 233 |
202 573 872 |
-14232,84482 |
2,01241E+16 |
-0,017357128 |
6,724E+11 |
|
870000 |
2008 |
834232,8448 |
35 767 |
1 279 289 390 |
35767,15518 |
1,15932E+18 |
0,041111673 |
7,569E+11 |
|
810000 |
2008 |
834232,8448 |
-24 233 |
587 230 768 |
-24232,84482 |
4,78945E+17 |
-0,029917092 |
6,561E+11 |
|
828000 |
2009 |
887376,9347 |
-59 377 |
3 525 620 370 |
-59376,93467 |
8,63413E+18 |
-0,071711274 |
6,85584E+11 |
|
325000 |
1998 |
302791,9463 |
22 208 |
493 197 649 |
22208,05369 |
9,19559E+18 |
0,068332473 |
1,05625E+11 |
|
899000 |
2008 |
834232,8448 |
64 767 |
4 194 784 391 |
64767,15518 |
1,37017E+19 |
0,072043554 |
8,08201E+11 |
|
1230000 |
2012 |
1046809,204 |
183 191 |
33 558 867 659 |
183190,7958 |
8,62249E+20 |
0,148935606 |
1,5129E+12 |
|
1100000 |
2012 |
1046809,204 |
53 191 |
2 829 260 756 |
53190,79578 |
9,44309E+20 |
0,048355269 |
1,21E+12 |
|
750000 |
2008 |
834232,8448 |
-84 233 |
7 095 172 146 |
-84232,84482 |
1,8198E+19 |
-0,11231046 |
5,625E+11 |
|
830000 |
2008 |
834232,8448 |
-4 233 |
17 916 975 |
-4232,844815 |
5,00875E+19 |
-0,005099813 |
6,889E+11 |
|
295000 |
1998 |
302791,9463 |
-7 792 |
60 714 427 |
-7791,946308 |
1,83162E+15 |
-0,026413377 |
87025000000 |
|
1200000 |
2011 |
993665,1144 |
206 335 |
42 574 085 029 |
206334,8856 |
1,80739E+21 |
0,171945738 |
1,44E+12 |
|
750000 |
2007 |
781088,755 |
-31 089 |
966 510 685 |
-31088,75496 |
1,73119E+21 |
-0,041451673 |
5,625E+11 |
|
235000 |
1996 |
196503,7666 |
38 496 |
1 481 959 985 |
38496,23339 |
2,65688E+17 |
0,163813759 |
55225000000 |
|
800000 |
2008 |
834232,8448 |
-34 233 |
1 171 887 664 |
-34232,84482 |
9,61448E+16 |
-0,042791056 |
6,4E+11 |
|
1080000 |
2011 |
993665,1144 |
86 335 |
7 453 712 477 |
86334,88563 |
3,94613E+19 |
0,079939709 |
1,1664E+12 |
|
950000 |
2011 |
993665,1144 |
-43 665 |
1 906 642 213 |
-43665,11437 |
3,077E+19 |
-0,045963278 |
9,025E+11 |
|
575000 |
2004 |
621656,4854 |
-46 656 |
2 176 827 631 |
-46656,48541 |
7,30002E+16 |
-0,081141714 |
3,30625E+11 |
|
930000 |
2009 |
887376,9347 |
42 623 |
1 816 725 698 |
42623,06533 |
1,29673E+17 |
0,045831253 |
8,649E+11 |
|
205000 |
1998 |
302791,9463 |
-97 792 |
9 563 264 763 |
-97791,94631 |
6,00089E+19 |
-0,477033884 |
42025000000 |
|
320000 |
1997 |
249647,8565 |
70 352 |
4 949 424 101 |
70352,14354 |
2,12875E+19 |
0,219850449 |
1,024E+11 |
|
280000 |
1998 |
302791,9463 |
-22 792 |
519 472 817 |
-22791,94631 |
1,96245E+19 |
-0,081399808 |
78400000000 |
|
758000 |
2007 |
781088,755 |
-23 089 |
533 090 606 |
-23088,75496 |
1,85444E+14 |
-0,030460099 |
5,74564E+11 |
|
711000 |
2007 |
781088,755 |
-70 089 |
4 912 433 573 |
-70088,75496 |
1,91786E+19 |
-0,098577714 |
5,05521E+11 |
|
525000 |
2009 |
887376,9347 |
-362 377 |
131 317 042 778 |
-362376,9347 |
1,59781E+22 |
-0,69024178 |
2,75625E+11 |
|
265000 |
1996 |
196503,7666 |
68 496 |
4 691 733 989 |
68496,23339 |
1,6034E+22 |
0,258476352 |
70225000000 |
|
19 500 000 |
60136 |
19500000 |
0 |
272 339 655 664 |
0 |
37 655 270 478 505 700 000 000 |
0,32276 |
15 716 216 291 363 |
Аппроксимация:
Е отн = 1,0758767 или 1 %
Далее проверяем модель на наличие автокорреляции.
10) Автокорреляция
Расчет коэффициентов для проверки наличия автокорреляция
Таблица № 16
Y практ. |
Y теор. |
e=Yтеор-Yпракт |
e(t)-e(t-1) |
{e(t)-e(t-1)}^2 |
e^2 |
||
1 |
299000 |
302792 |
3792 |
3792 |
14378857 |
14378857 |
|
2 |
240000 |
196504 |
-43496 |
-47288 |
2236171939 |
1891922319 |
|
3 |
325000 |
302792 |
-22208 |
21288 |
453186595 |
493197649 |
|
4 |
295000 |
302792 |
7792 |
30000 |
900000000 |
60714427 |
|
5 |
820000 |
834233 |
14233 |
6441 |
41485174 |
202573872 |
|
6 |
870000 |
834233 |
-35767 |
-50000 |
2500000000 |
1279289390 |
|
7 |
810000 |
834233 |
24233 |
60000 |
3600000000 |
587230768 |
|
8 |
828000 |
887377 |
59377 |
35144 |
1235107051 |
3525620370 |
|
9 |
325000 |
302792 |
-22208 |
-81585 |
6656110325 |
493197649 |
|
10 |
899000 |
834233 |
-64767 |
-42559 |
1811277120 |
4194784391 |
|
11 |
1230000 |
1046809 |
-183191 |
-118424 |
14024158652 |
33558867659 |
|
12 |
1100000 |
1046809 |
-53191 |
130000 |
16900000000 |
2829260756 |
|
13 |
750000 |
834233 |
84233 |
137424 |
18885256995 |
7095172146 |
|
14 |
830000 |
834233 |
4233 |
-80000 |
6400000000 |
17916975 |
|
15 |
295000 |
302792 |
7792 |
3559 |
12667203 |
60714427 |
|
16 |
1200000 |
993665 |
-206335 |
-214127 |
45850300157 |
42574085029 |
|
17 |
750000 |
781089 |
31089 |
237424 |
56369985114 |
966510685 |
|
18 |
235000 |
196504 |
-38496 |
-69585 |
4842070605 |
1481959985 |
|
19 |
800000 |
834233 |
34233 |
72729 |
5289518817 |
1171887664 |
|
20 |
1080000 |
993665 |
-86335 |
-120568 |
14536577625 |
7453712477 |
|
21 |
950000 |
993665 |
43665 |
130000 |
16900000000 |
1906642213 |
|
22 |
575000 |
621656 |
46656 |
2991 |
8948301 |
2176827631 |
|
23 |
930000 |
887377 |
-42623 |
-89280 |
7970838181 |
1816725698 |
|
24 |
205000 |
302792 |
97792 |
140415 |
19716375494 |
9563264763 |
|
25 |
320000 |
249648 |
-70352 |
-168144 |
28272434952 |
4949424101 |
|
26 |
280000 |
302792 |
22792 |
93144 |
8675821474 |
519472817 |
|
27 |
758000 |
781089 |
23089 |
297 |
88095 |
533090606 |
|
28 |
711000 |
781089 |
70089 |
47000 |
2209000000 |
4912433573 |
|
29 |
525000 |
887377 |
362377 |
292288 |
85432379993 |
131317042778 |
|
30 |
265000 |
196504 |
-68496 |
-430873 |
185651686953 |
4691733989 |
|
Сумма |
557395825675 |
272339655664 |
|||||
Автокорреляция |
2,046693583 |
Критерий Дарбина-Уотсона определим по формуле:
Осуществим проверку автокорреляции и выполнение условия Дарбина Уотсона 1 ? DW ? 4.
В данном случае DW ~ 2, автокорреляция отсутствует.
11) Гетероскедастичность
Гетероскедастичность — различие дисперсионных случайных отклонений при различных значениях зависимой переменной. Гетероскедастичность характерна, в первую очередь, для перекрестных данных (относящихся к одному моменту времени, но к разным единицам наблюдения).
Тест Голдфельда — Куандта:
Таблица № 17
Модель |
Пробег, тыс. км |
Год выпуска |
|
Y |
X2 |
||
1 |
299000 |
1998 |
|
2 |
240000 |
1996 |
|
3 |
325000 |
1998 |
|
4 |
295000 |
1998 |
|
5 |
820000 |
2008 |
|
6 |
870000 |
2008 |
|
7 |
810000 |
2008 |
|
8 |
828000 |
2009 |
|
9 |
325000 |
1998 |
|
10 |
899000 |
2008 |
|
11 |
1230000 |
2012 |
|
12 |
1100000 |
2012 |
|
13 |
750000 |
2008 |
|
14 |
830000 |
2008 |
|
15 |
295000 |
1998 |
|
16 |
1200000 |
2011 |
|
17 |
750000 |
2007 |
|
18 |
235000 |
1996 |
|
19 |
800000 |
2008 |
|
20 |
1080000 |
2011 |
|
21 |
950000 |
2011 |
|
22 |
575000 |
2004 |
|
23 |
930000 |
2009 |
|
24 |
205000 |
1998 |
|
25 |
320000 |
1997 |
|
26 |
280000 |
1998 |
|
27 |
758000 |
2007 |
|
28 |
711000 |
2007 |
|
29 |
525000 |
2009 |
|
30 |
265000 |
1996 |
Таблица № 18
Первая половина регрессии
Модель |
Пробег, тыс. км |
Год выпуска |
|
Y |
X2 |
||
1 |
299000,0000 |
1998,0000 |
|
2 |
240000,0000 |
1996,0000 |
|
3 |
325000,0000 |
1998,0000 |
|
4 |
295000,0000 |
1998,0000 |
|
5 |
820000,0000 |
2008,0000 |
|
6 |
870000,0000 |
2008,0000 |
|
7 |
810000,0000 |
2008,0000 |
|
8 |
828000,0000 |
2009,0000 |
|
9 |
325000,0000 |
1998,0000 |
|
10 |
899000,0000 |
2008,0000 |
|
11 |
1230000,0000 |
2012,0000 |
Таблица № 19
Вторая половина регрессии
Модель |
Пробег, тыс. км |
Год выпуска |
|
Y |
X2 |
||
20 |
1080000,0000 |
2011,0000 |
|
21 |
950000,0000 |
2011,0000 |
|
22 |
575000,0000 |
2004,0000 |
|
23 |
930000,0000 |
2009,0000 |
|
24 |
205000,0000 |
1998,0000 |
|
25 |
320000,0000 |
1997,0000 |
|
26 |
280000,0000 |
1998,0000 |
|
27 |
758000,0000 |
2007,0000 |
|
28 |
711000,0000 |
2007,0000 |
|
29 |
525000,0000 |
2009,0000 |
|
30 |
265000,0000 |
1996,0000 |
Таблица № 20
Регрессионная статистика для первой половины регрессии
Множественный R |
0,983634063 |
|
R-квадрат |
0,96753597 |
|
Нормированный R-квадрат |
0,963928855 |
|
Стандартная ошибка |
64618,57026 |
|
Наблюдения |
11 |
Таблица № 21
Регрессионная статистика для второй половины регрессии
Регрессионная статистика |
||
Множественный R |
0,920186995 |
|
R-квадрат |
0,846744106 |
|
Нормированный R-квадрат |
0,829715673 |
|
Стандартная ошибка |
127482,0739 |
|
Наблюдения |
11 |
Таблица № 22
Дисперсионный анализ для первой половины регрессии
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
1,12001E+12 |
1,12001E+12 |
268,2299056 |
5,24735E-08 |
|
Остаток |
9 |
37580036598 |
4175559622 |
|||
Итого |
10 |
1,15759E+12 |
Таблица № 23
Дисперсионный анализ для второй половины регрессии
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
8,0812E+11 |
8,0812E+11 |
49,72531078 |
5,97533E-05 |
|
Остаток |
9 |
1,46265E+11 |
16251679157 |
|||
Итого |
10 |
9,54385E+11 |
Таблица № 24
Показатели качества модели для первой половины регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
-111103852,3 |
6822394,553 |
-16,2851696 |
5,51359E-08 |
|
X2 |
55763,50328 |
3404,837987 |
16,3777259 |
5,24735E-08 |
Таблица № 25
Показатели качества модели для второй половины регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
-95682709,5 |
13654030,26 |
-7,007653247 |
6,27155E-05 |
|
X2 |
48038,6812 |
6812,434243 |
7,0516176 |
5,97533E-05 |
Ряд остатков для первой половины регрессии:
E1 = У — У пересечение — Х2 пересечение * Х2
показатель корреляция регрессия матрица
Ряд остатков для второй половины регрессии:
E2 = У — У пересечение — Х2 пересечение * Х2
Таблица 26
Е1 |
Е2 |
Е1^2 |
E2^2 |
|
-12627,20848 |
156921,5992 |
159446394 |
24624388286 |
|
39899,79808 |
26921,59917 |
1591993887 |
724772501,8 |
|
13372,79152 |
-11807,6324 |
178831553 |
139420182,9 |
|
-16627,20848 |
102998,9616 |
276464061,9 |
10608786086 |
|
-49262,24129 |
-93575,54517 |
2426768417 |
8756382654 |
|
737,7587077 |
69463,13603 |
544287,9108 |
4825127268 |
|
-59262,24129 |
-18575,54517 |
3512013243 |
345050878,4 |
|
-97025,74457 |
27076,32399 |
9413995110 |
733127320,7 |
|
13372,79152 |
-19923,67601 |
178831553 |
396952865,8 |
|
29737,75871 |
-302001,0384 |
884334293 |
91204627208 |
|
137683,7456 |
62501,81724 |
18956813798 |
3906477158 |
|
Cумма |
37580036598 |
1,46265E+11 |
||
Fрасч |
0,256930966 |
|||
Fстат |
5,117355008 |
0,256930966 < 5,117355008
Fрасч < Fстат
— гетероскедастичнойсть присутсвует
Заключение
Проведенный анализ обработанных данных по автомобилям Honda CR-V с пробегом за 11.08.2013 г. Позволяет сформулировать следующие выводы.
Связь между результативным признаком У — ценой автомобиля и фактором Х2 — год выпуска автомобиля прямая, если фактор Х2 увеличить на 1 год, то цена автомобиля увеличится на 50270,40 руб.
Связь между результативным признаком У — мощностью двигателя автомобиля и фактором Х4 — годом выпуска автомобиля прямая, если фактор Х2 увеличить на 1 л.с., то цена автомобиля увеличится на 225357,14 руб., но при дальнейшем анализе данный показатель не подтвердил своей значимости.
Так как R2у = 0,950373311534228, то связь с зависимой переманенной У с факторами включенными в модель очень тесная.
Коэффициент показывает долю вариации зависимой переменной У под влиянием факторов, включенным в модель. 95% изменения цены квартиры происходит под влиянием факторов включенный в модель.
По критерию Фишера модель множественной регрессии является точной (Fрасч > F кр) и значимой.
Для факторов Х2 имеет место гетероскедастичность.
Размещено на