Лабораторная работа
Выбор модели методом шаговой регрессии
1. Составить множество регрессоров, включив в него факторы, квадраты факторов и их взаимные произведения:
X1, X2, X3, X4, X12, X22, X32, X42, X1X2, X1X3, X1X4, X2X3, X2X4, X3X4.
2. С помощью статистической функции КОРРЕЛ (массив1, массив2) найти коэффициенты корреляции Y со всеми регрессорами (строка 1, табл.1)
Табл.1
3.Выбрать регрессор, имеющий максимальное по модулю значение коэффициента парной корреляции с зависимой переменной Y. Включить этот регрессор в модель
Y1 = a0 + a1*X2Х4. (1)
4.Методом наименьших квадратов (МНК) с помощью статистической функции ЛИНЕЙН найти коэффициенты аi и рассчитать модельные значения Y1 по формуле (1).
5.Найти невязку (Y-Y1) и определить коэффициенты корреляции невязки со всеми регрессорами. Занести данные в табл.1.
6. Опять выбрать регрессор, имеющий максимальное значение коэффициента парной корреляции с переменной (Y-Y1). Включить этот регрессор в усложненную модель
Y2 = a0 + a1*X2Х4 + а2*Х3. (2)
7. Для модели (2) с помощью МНК рассчитать оценки а0, а1, а2.
8.Рассчитать для двух моделей (1) и (2) F-статистику
F12=k*(S - S')/S', (3)
где k - степень свободы для сложной модели, S' - остаточная сумма квадратов для сложной модели, S - остаточная сумма квадратов для простой модели.
Проверить условие Fk1,k2 > F(p,k1,k2), выполнение которого свидетельствует о целесообразности произведенного усложнения модели, что обусловило существенное увеличение точности аппроксимации моделью исходных данных.
Как только процесс пошагового усложнения модели окажется неэффективным, необходимо выполнить по t-критерию Стьюдента
EMBED Equation.3 (4)
проверку значимости оценок параметров модели, найденных на предыдущих шагах. В случае обнаружения незначимых оценок, для которых EMBED Equation.3 , исключить оценки из модели, проверив точность упрощенной модели по статистике вида (3).
11. П.п.3-5 повторяются, пока пошаговое усложнение модели будет эффективным.
12. При появлении сомнений в необходимости последующего усложнения модели производится комплексный анализ качества модели по F-, t-статистикам, по показателям коэффициента детерминации R2, по значениям стандартной ошибки оценивания Y.
13. Построить график Yp и Y с помощью Мастера диаграмм.
Табличные значения статистик F(p,k1,k2), t(p,k):