Выдержка из текста работы
10.С помощью модуля «Анализ данных» — «Регрессия» проверить значимость оценки коэффициента регрессии, построить доверительный интервал для коэффициента регрессии.
Таблица 1 Среднедушевые денежные доходы населения (в месяц, руб.)
Северо-Западный федеральный округ |
Доходы |
|
Республика Карелия |
2216 |
|
Республика Коми |
2922 |
|
Архангельская область |
2033 |
|
Вологодская область |
1984 |
|
Калининградская область |
1952 |
|
Ленинградская область |
1366 |
|
Мурманская область |
3387 |
|
Новгородская область |
1782 |
|
Псковская область |
1360 |
|
г. Санкт-Петербург |
2583 |
Таблица 2 Среднедушевые денежные расходы населения (в месяц, рублей)
Северо-Западный федеральный округ |
Расходы |
|
Республика Карелия |
1708 |
|
Республика Коми |
2245 |
|
Архангельская область |
1584 |
|
Вологодская область |
1617 |
|
Калининградская область |
2066 |
|
Ленинградская область |
1229 |
|
Мурманская область |
2647 |
|
Новгородская область |
1590 |
|
Псковская область |
1240 |
|
г. Санкт-Петербург |
2820 |
Решение
В таблице представлены среднедушевые денежные доходы и расходы населения Северо-Западного федерального округа (СЗФО) в 2004 г.
Таблица 3 Доходы и расходы населения СЗФО в 2004 году
X |
Y |
||||
Доходы |
Расходы |
Предсказанные значения Y |
Остатки |
||
Республика Карелия |
2216 |
1708 |
1917,1 |
-209,1 |
|
Республика Коми |
2922 |
2245 |
2439,5 |
-194,5 |
|
Архангельская область |
2033 |
1584 |
1781,7 |
-197,7 |
|
Вологодская область |
1984 |
1617 |
1745,5 |
-128,5 |
|
Калининградская область |
1952 |
2066 |
1721,8 |
344,2 |
|
Ленинградская область |
1366 |
1229 |
1288,2 |
-59,2 |
|
Мурманская область |
3387 |
2647 |
2783,6 |
-136,6 |
|
Новгородская область |
1782 |
1590 |
1596,0 |
-6,0 |
|
Псковская область |
1360 |
1240 |
1283,8 |
-43,8 |
|
г. Санкт-Петербург |
2583 |
2820 |
2188,7 |
631,3 |
Коэффициент корреляции (r) между среднедушевыми денежными доходами населения (Х) и среднедушевыми расходами населения (Y) равен 0,868 и вычисляется с помощью функции КОРРЕЛ (…).
Уравнение регрессии имеет вид: , где а=277,51 — вычисляется с помощью функции ОТРЕЗОК (…); b=0,740 — вычисляется с помощью функции НАКЛОН (…).
Предсказанные значения вычисляются в соответствии с уравнением регрессии, остатки — по формуле: .
Гистограмма доходов и расходов населения СЗФО приведена на рис. 1.
Рис. 1. Среднедушевые денежные доходы и расходы населения Северо-Западного федерального округа в 2004 г.
Наибольшие среднедушевые доходы имеет население Мурманской области, наименьшие — в Псковской. Наибольшие среднедушевые расходы — в Санкт-Петербурге, наименьшие — в Псковской области. В Калининградской области и г. Санкт-Петербург среднедушевые денежные расходы превышают доходы, что может свидетельствовать о существовании теневых доходов населения.
Диаграмма рассеивания представлена в виде точек на рис. 2. Визуально линейная зависимость между переменными существует. Коэффициент корреляции между Х и Y r=0,868, что свидетельствует о наличии линейной зависимости между Х и Y/ Зависимость — чем больше доходы (Х), тем больше расходы (Y). Уравнение для оценки регрессионной модели имеет вид: .
Уравнение регрессии строится с помощью опции “Добавить линию тренда”, возникающей при выделении точек на диаграмме и нажатии правой кнопки мыши. Отображение на графике уравнения и R2 осуществляется установкой соответствующих отметок на вкладке “Формат линии тренда”, “Параметры”.
Рис. 2. Регрессионная зависимость между среднедушевыми денежными доходами и расходами населения Северо-Западного федерального округа в 2004 г.
Предсказанные значения Y приведены в столбце 4, остатки — в столбце 5 таблицы 3. Коэффициент детерминации, близкий к 1 (R2=0,752), свидетельствует об адекватности линейной модели.
Из рисунка 2 видно, что наибольшие отклонения от линии регрессии наблюдаются для Калининградской области и Санкт-Петербурга (превышение значений среднедушевых расходов над прогнозируемыми значениями), а также для Республики Карелии и Мурманской области, где значения среднедушевых денежных расходов ниже среднего уровня, определяемого регрессионной моделью. При приросте среднедушевых доходов на 100 руб. можно ожидать возрастания среднедушевых расходов на 74 рубля.
По результатам анализа графика на рис. 3 можно сделать вывод, что остатки гомоскедастичны, а автокорреляции нет.
Рис. 3. График остатков
На рис. 4 приведены результаты регрессионного анализа с помощью модуля “Анализ данных — Регрессия”.
Рис. 4. Результаты регрессионного анализа
Нулевая гипотеза Н0: изменение среднедушевых доходов не влияет на среднедушевые расходы населения, т.е. коэффициент регрессии равен 0.
Альтернативная гипотеза Н1: изменение среднедушевых доходов влияет на среднедушевые расходы населения, т.е. коэффициент регрессии не равен 0.
Критерий Фишера, F=24,35, значимость критерия Фишера 0,00114<0,05, следовательно, в результате F-теста мы должны отклонить нулевую гипотезу и признать справедливость альтернативной гипотезы.
Р- значение=0,00114<0,5, следовательно, при уровне значимости 0,05 нулевая гипотеза может быть отвергнута. Справедлива гипотеза о регрессионной зависимости между переменными. Доверительный интервал: 0,394<b<1,086.
Поясним содержимое таблицы дисперсионного анализа для простой линейной регрессии. Дисперсию оценки можно найти из таблицы дисперсионного анализа (см. табл. 4), которую можно получить стандартными средствами Excel (Сервис-Анализ данных-Регрессия).
Величина s2 идентична среднему квадрату отклонения (остатка) от регрессии MSR. Она вычисляется как отношение остаточной суммы квадратов SSR к остаточному числу степеней свободы vR.
регрессия денежный доход расход
Таблица 4 Таблица дисперсионного анализа для простой линейной регрессии
Источник дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
F-отношение |
|
Регрессия |
vD=1 |
MSD= SSD/ vR |
FD=MSD/MSR |
||
Отклонение от регрессии |
vR=n-2 |
MSR = SSR/ vR=s2 |
— |
||
Полная дисперсия |
vT=n-1 |
— |
— |
Обусловленная регрессией сумма квадратов SSD получило такое название потому, что ее можно выразить через оценку коэффициента регрессии:
Чем больше коэффициент регрессии, тем больше сумма квадратов, “обусловленная регрессией”.
Последняя колонка таблицы, называемая F-отношение, может быть использована для проверки гипотезы, если ошибки предполагаются нормально распределенными.
Для проверки гипотезы о том, что простая линейная регрессия у по х отсутвует, то есть гипотезы H0: в=0 против альтернативной гипотезы Н1: в?0, используется F — отношение из таблицы дисперсионного анализа:
F0=MSD/MSR=MSD/s2.
Если верна нулевая гипотеза, то F имеет F-распределение с vD=1 и vR=n-2 степеням исвободы. Соответвующее критической области р-значение вычисляется стандартными средствами обработки статистических данных автоматически.
Список литературы
1. Айвазян С.А. Прикладная статистика. Основы эконометрики: Учебник для ВУЗов в 2-х т. — Т.2. — М.: ЮНИТИ — ДАНА, 2003. — 432 с.
2. Доугерти К. Введение в эконометрику: Пер. с англ. (Серия “Университетский учебник”). — М.: ИНФРА-М, 2003 — 402 c.
3. Максимова Т.Г., Верзлин Д.Н. Основы эконометрики: Учебное пособие. — СПб.: ТЭИ, 2005. — 80 с.
4. Эконометрика: Учебник/Под ред. И.И. Елисеевой. — М.: Финансы и статистика, 2001. — 344 с.: ил.
5. http://www.globpeace.ru/lekc/ikonometrik/index.htm
6. http://www.vuchebe.net/books/econometrika/print.html
Размещено на