МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
EMBED Unknown
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА ЭКОНОМИКО-МАТЕМАТИЧЕСКИХ МЕТОДОВ И МОДЕЛЕЙ

А У Д И Т О Р Н А Я Р А Б О Т А
по дисциплине
Эконометрика
Вариант 5







Липецк
2006
Вариант 5
Изучается зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 1995 г., представленным в табл.1.
Таблица 1
Принятые в таблице обозначения:
Y - средняя ожидаемая продолжительность жизни при рождении, лет;
X1 - ВВП в паритетах покупательной способности;
X2- цепные темпы прироста населения, %;
X3- цепные темпы прироста рабочей силы, %;
Х4 - коэффициент младенческой смертности, %..
Задание
Постройте матрицу парных коэффициентов корреляции, оцените статистическую значимость коэффициентов корреляции. Установите, какие факторы коллинеарны.
Постройте уравнение множественной регрессии, обосновав отбор факторов.
Постройте график остатков.
Проверьте выполнение предпосылок МНК.
Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней ожидаемой продолжительности жизни в этом уравнении?
Постройте уравнение множественной регрессии только со статистически значимыми факторами.
Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а = 0,05; а = 0,10).





Решение.
Построение матрицы коэффициентов парной регрессии выполняется с помощью табличного процессора Excel (пакет Анализ данных>Корреляция). В результате получаем следующие данные:
Таблица 2
Анализ матрицы коэффициентов парной корреляции:
- зависимая переменная y, т.е. средняя ожидаемая продолжительность жизни при рождении имеет тесную связь с ВВП в паритетах покупательной способности – х1 (ryx1=0,638668), с коэффициентом младенческой смертности – х4 (ryx4=-0,85288);
- факторы х2 и х3 коллинеарны, т.е. находятся в линейной зависимости между собой (rx2x3=0,728064), но так как и фактор х2 и фактор х3 незначимы (ryx2=-0,20745, ryx3=0,283051), то нет смысла включать их в модель.
После исключения незначимых факторов получаем k=2, т.е. в модель включаем только два фактора.
Для построения уравнения множественной регрессии применим инструмент Регрессия (Анализ данных в Excel). Уравнение регрессии зависимости ожидаемой продолжительности жизни при рождении от ВВП в паритетах покупательной способности и коэффициента младенческой смертности можно записать в следующем виде:
y=67,543+0,675х1-0,186х2.
В таблице 3 приведены вычисленные по модели значения Y и значения остаточной компоненты.

Таблица 3
На рисунке 1 приведен график остатков.
EMBED Excel.Chart.8 \s
Рис.1
Исследование остатков предполагает проверку наличия следующих пяти предпосылок МНК:
1. Случайный характер остатков. Т.к. на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения yрасч хорошо аппроксимируют фактические значения y.
2. Нулевая средняя величина остатков, не зависящая от xi. ?(y-yрасч)=0, на рис.2 и рис.3 представлены графики зависимости случайных остатков от значений хj, из которых видно, что ?i независимы от хj, т.е. вторая предпосылка выполняется.
EMBED Excel.Chart.8 \s
Рис.2
EMBED Excel.Chart.8 \s
Рис.3
3. Гомоскедастичность – дисперсия каждого отклонения ?i одинакова для всех значений х. Наличие гомоскедастичности можно видеть на графике зависимости остатков от теоретических значений yрасч (рис.4).
EMBED Excel.Chart.8 \s Рис.4
Для оценки гетероскедастичности используем метод Готфельда-Квандта. В таблице 4 приведены расчеты проверки регрессии на гетероскедастичность.
Таблица 4
Величина R=92,578/28,321=3,2689 не превышает табличное значение F-критерия, равного 5,409447, подтверждая тем самым наличие гомоскедастичности.
4. Отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга. Коэффициент корреляции между ?i и ?j, где ?i – остатки текущих наблюдений, ?j – остатки предыдущих наблюдений, может быть определен как
EMBED Equation.3 =0,264145,
что при 17 степенях свободы явно незначимо, т.е. можно сказать, что автокорреляция остаточных величин отсутствует.
5. Остатки подчиняются нормальному распределению. Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью критериев t, F.
Оценим качество всего уравнения регрессии. Значения коэффициентов детерминации можно найти в таблице Регрессионная статистика (таблица 4).
Таблица 4

Коэффициент детерминации:
EMBED Equation.3 =0,76175.
Коэффициент детерминации характеризует долю вариации результативного признака y под воздействием изучаемых факторов. Следовательно, около 84% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R:
EMBED Equation.3 0,872783.
Он показывает тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.
Оценку статистической значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера:
EMBED Equation.3 21,17676
В Excel значение F-критерия можно найти в таблице Дисперсионный анализ (табл. 5).
Таблица 5
Рассчитанные значения Fрасч сравниваем с табличным значением Fтабл. В Excel Fтабл при доверительной вероятности 0,95 при ?1=k=2 и ?2=n-k-1=20-2-1=17 находим при помощи функции FРАСПОБР:
Fтабл=3,591538.
Уравнение регрессии с вероятностью 0.95 в целом статистически значимое, т.к. Fрасч> Fтабл.
Статистическую значимость коэффициентов уравнения множественной регрессии оцениваем с помощью t-критерия Стьюдента:
taj=aj / Saj,
Saj=S? EMBED Equation.3 ,
где bjj – диагональный элемент матрицы (ХТХ)-1.
ta0 =14,288
ta1 =1,565
ta2 =-5,025

Таблица 6
Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии а1, а2 приведены в четвертом столбце таблицы 6. Критическое значение tтабл при ?=0,05 и степенях свободы (20-2-1=17) находим в Еxcel с помощью функции СТЬЮДРАСПОБР.
tтабл=2,109819.
Т.к. |ta2|> tтабл, то коэффициент а2 существенный (значим). Но |ta1|< tтабл, следовательно коэффициент а1 не значим.
Уравнение регрессии только со статистически значимыми факторами будет иметь вид:
y=267,55-3,3121x.
Для выполнения прогноза среднего значения показателя y при хпрогн=0,8*хimax используем линейную модель, полученную только со статистически значимыми факторами, для чего необходимо подставить прогнозируемое значение х в уравнение регрессии:
y=73,56-0,2196x.
хпрогн=99,2.
Yпрогн= 73,56-0,2196*99,2=51,78
Вероятность реализации точечного прогноза практически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надежностью. Расчетные данные для выполнения интервального прогноза приведены в таблице 7.

Таблица 7
EMBED Equation.3
EMBED Equation.3 =3,024907
t?=0,05=2,100924
EMBED Equation.3
EMBED Equation.3
Таким образом, прогнозное значение EMBED Equation.3 ,будет находиться в интервале [45,22;58,34]. Все результаты моделирования и исходные данные приведены на графике (рис.5).
EMBED Excel.Chart.8 \s
Рис.5