Значимость уравнения регрессии

Оценка значимости уравнения множественной регрессии

Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа. Первое же построенное по выборке уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей задачей эконометрического анализа является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки.

Итак, проверка статистического качества оцененного уравнения регрессии проводится по следующим направлениям:

  • проверка значимости уравнения регрессии;
  • проверка статистической значимости коэффициентов уравнения регрессии;
  • проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК).

Проверка значимости уравнения множественной регрессии, так же как и парной регрессии, осуществляется с помощью критерия Фишера. В данном случае (в отличие от парной регрессии) выдвигается нулевая гипотеза Н0о том, что все коэффициенты регрессии равны нулю (b1=0, b2=0, … , bm=0).

Оценка значимости уравнения регрессии и его параметров.

Критерий Фишера определяется по следующей формуле:

где Dфакт — факторная дисперсия, объясненная регрессией, на одну степень свободы; Dост- остаточная дисперсия на одну степень свободы; R2— коэффициент множественной детерминации; т — число параметров при факторах х в уравнении регрессии (в парной линейной регрессии т = 1); п — число наблюдений.

Полученное значение F-критерия сравнивается с табличным при определенном уровне значимости. Если его фактическое значение больше табличного, тогда гипотеза Но о незначимости уравнения регрессии отвергается, и принимается альтернативная гипотеза о его статистической значимости.

С помощью критерия Фишера можно оценить значимость не только уравнения регрессии в целом, но и значимость дополнительного включения в модель каждого фактора. Такая оценка необходима для того, чтобы не загружать модель факторами, не оказывающими существенного влияния на результат. Кроме того, поскольку модель состоит из несколько факторов, то они могут вводиться в нее в различной последовательности, а так как между факторами существует корреляция, значимость включения в модель одного и того же фактора может различаться в зависимости от последовательности введения в нее факторов.

Для оценки значимости включения дополнительного фактора в модель рассчитывается частный критерий Фишера Fxi. Он построен на сравнении прироста факторной дисперсии, обусловленного включением в модель дополнительного фактора, с остаточной дисперсией на одну степень свободы по регрессии в целом. Следовательно, формула расчета частного F-критерия для фактора будет иметь следующий вид:

где R2yx1x2…xi…xp — коэффициент множественной детерминации для модели с полным набором п факторов; R2yx1x2…xi-1 xi+1…xp— коэффициент множественной детерминации для модели, не включающей фактор xi; п — число наблюдений; т — число параметров при факторах x в уравнении регрессии.

Фактическое значение частного критерия Фишера сравнивается с табличным при уровне значимости 0,05 или 0,1 и соответствующих числах степеней свободы. Если фактическое значение Fxiпревышает Fтабл , то дополнительное включение фактора xi в модель статистически оправдано, и коэффициент «чистой» регрессии biпри факторе xiстатистически значим. Если же Fxiменьше Fтабл , то дополнительное включение в модель фактора существенно не увеличивает долю объясненной вариации результата у, и, следовательно, его включение в модель не имеет смысла, коэффициент регрессии при данном факторе в этом случае статистически незначим.

С помощью частного критерия Фишера можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xiвводится в уравнение множественной регрессии последним, а все остальные факторы были уже включены в модель раньше.

Оценка значимости коэффициентов «чистой» регрессии bi по критерию Стьюдента t может быть проведена и без расчета частных F-критериев. В этом случае, как и при парной регрессии, для каждого фактора применяется формула

tbi = bi / mbi ,

где bi — коэффициент «чистой» регрессии при факторе xi ; mbi— стандартная ошибка коэффициента регрессии bi .

Для множественной линейной регрессии стандартная ошибка коэффициента регрессии рассчитывается по следующей формуле:

где σy , σxi — среднее квадратическое отклонение соответственно для результата у и xi ; R2yx1x2…xi…xp— коэффициент множественной детерминации для множественной регрессии с набором из р факторов; R2xix1x2…xi-1 xi+1…xp— коэффициент детерминации для зависимости фактора xi с остальными факторами множественной регрессии.

Полученные значения t-критериев сравниваются с табличными, и на основе этого сравнения принимается или отвергается гипотеза о значимости каждого коэффициента регрессии в отдельности.

Дата добавления: 2015-10-05; просмотров: 2288;

В чем состоит проблема идентификации модели?

Итоговые тесты по эконометрике

1. Оценка значимости параметров уравнения регрессии осуществляется на основе:

+а) t — критерия Стьюдента;

б) F — критерия Фишера – Снедекора;

в) средней квадратической ошибки;

г) средней ошибки аппроксимации.

2. Коэффициент регрессии в уравнении , характеризующем связь между объемом реализованной продукции (млн. руб.) и прибылью предприятий автомобильной промышленности за год (млн. руб.) означает, что при увеличении объема реализованной продукции на 1 млн. руб. прибыль увеличивается на:

а) 0,5 %;

г) 0,5 млн. руб.;

в) 500 тыс. руб.;

+г) 1,5 млн. руб.

3. Корреляционное отношение (индекс корреляции) измеряет степень тесноты связи между Х и Y:

а) только при нелинейной форме зависимости;

+б) при любой форме зависимости;

в) только при линейной зависимости.

4. По направлению связи бывают:

а) умеренные;

+б) прямые;

в) прямолинейные.

5. По 17 наблюдениям построено уравнение регрессии: . Для проверки значимости уравнения вычислено наблюдаемое значение t — статистики: 3.9. Вывод:

+а) Уравнение значимо при a= 0,05;

б) Уравнение незначимо при a = 0,01;

в) Уравнение незначимо при a = 0,05.

Каковы последствия нарушения допущения МНК «математическое ожидание регрессионных остатков равно нулю»?

+а) Смещенные оценки коэффициентов регрессии;

б) Эффективные, но несостоятельные оценки коэффициентов регрессии;

в) Неэффективные оценки коэффициентов регрессии;

г) Несостоятельные оценки коэффициентов регрессии.

Какое из следующих утверждений верно в случае гетероскедастичности остатков?

+а) Выводы по t и F- статистикам являются ненадежными;

б) Гетероскедастичность проявляется через низкое значение статистики Дарбина-Уотсона;

в) При гетероскедастичности оценки остаются эффективными;

г) Оценки параметров уравнения регрессии являются смещенными.

На чем основан тест ранговой корреляции Спирмена?

+а) На использовании t – статистики;

б) На использовании F – статистики;

в) На использовании ;

г) На графическом анализе остатков.

На чем основан тест Уайта?

а) На использовании t – статистики;

б) На использовании F – статистики;

+в) На использовании ;

г) На графическом анализе остатков.

Каким методом можно воспользоваться для устранения автокорреляции?

+а) Обобщенным методом наименьших квадратов;

б) Взвешенным методом наименьших квадратов;

в) Методом максимального правдоподобия;

г) Двухшаговым методом наименьших квадратов.

Как называется нарушение допущения о постоянстве дисперсии остатков?

а) Мультиколлинеарность;

б) Автокорреляция;

+в) Гетероскедастичность;

г) Гомоскедастичность.

12.

1.4. Оценка значимости уравнения регрессии, его коэффициентов, коэффициента детерминации

Фиктивные переменные вводятся в:

а) только в линейные модели;

б) только во множественную нелинейную регрессию;

в) только в нелинейные модели;

+г) как в линейные, так и в нелинейные модели, приводимые к линейному виду.

13. Если в матрице парных коэффициентов корреляции встречаются , то это свидетельствует:

+а) О наличии мультиколлинеарности;

б) Об отсутствии мультиколлинеарности;

в) О наличии автокорреляции;

г) Об отсутствии гетероскедастичности.

С помощью какой меры невозможно избавиться от мультиколлинеарности?

а) Увеличение объема выборки;

б) Исключения переменных высококоррелированных с остальными;

в) Изменение спецификации модели;

+г) Преобразование случайной составляющей.

15. Если и ранг матрицы А меньше (К-1) то уравнение:

а) сверхиденцифицировано;

+б) неидентифицировано;

в) точно идентифицировано.

16.Уравнение регрессии имеет вид:

+а) ;

б) ;

в) .

В чем состоит проблема идентификации модели?

+а) получение однозначно определенных параметров модели, заданной системой одновременных уравнений;

б) выбор и реализация методов статистического оценивания неизвестных параметров модели по исходным статистическим данным;

в) проверка адекватности модели.

Оценка значимости параметров уравнения регрессии

Оценка значимости коэффициента регрессии и уравнения связи.

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

Анализ качестваэмпирического уравнения парной и множественной линейной регрессииначинаютс построения эмпирического уравнения регрессии, которое является начальным этапом эконометрического анализа. Первое же, построенное по выборке уравнение регрессии, очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей оценкой является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:

  • проверка статистической значимости коэффициентовуравнения регрессии
  • проверка общего качества уравнения регрессии
  • проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК)

Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ, как правило, проводится для ограниченной по объёму совокупности.

Поэтому параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Чтобы проверить, на сколько эти показатели характерны для всей генеральной совокупности и не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:

1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессиизначимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.

2. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.

3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.

Проверить значимость(качество) уравнения регрессии–значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации. Проверка адекватностиуравнения регрессии (модели) осуществляется с помощью средней ошибки аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).

Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели. Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной (y) от среднего значения (yср.) раскладывается на две части: «объясненную» и «необъясненную»:

Схема дисперсионного анализа имеет следующий вид:

(n –число наблюдений, m–число параметров при переменной x)

Вопрос 21. Понятие временного ряда. Виды прогнозов. Общая характеристика методов прогнозирования.

Понятие временного ряда.

Временные рядыряд последовательных значений, характеризующих изменение показателей во времени. В.р разделяются на:

моментные— ряд, уровни которого характеризуют значение показателя на определенные моменты времени.

интервальные – ряд, уровни которого характеризуют значение показателя,достигнутое за определенный период времени.

Более удобными явл. интервальные в.р, т.к они позволяют переходить от меньшего интервала к большему интервалу.

Числовые значения статистического показателя, называют уровнями рядаи обозначаются через у. Моменты или периоды времени, к которым относятся уровни, обозначаются через t.

Задачи в.р— выявить основную закономерность в изменении уровней ряда, называемую трендом.

В зависимости от вида показателей уровней ряда в.р делятся на ряды абсолютных, относительных и средних величин. Ряды абсолютных величин рассматриваются как исходные,а ряды относительных и средних величин – как производные.

Виды прогнозов.

Прогнозирование –предсказание поведения явления или объекта в будущем, на основе изучения его развития в прошлом и настоящем.

Различают прогнозы по времени:

1. Сроком не более 1 месяца ( оперативный).

2. Краткосрочные прогнозы (сроком до 1 года).

3. Среднесрочные прогнозы (сроком до 5 лет).

4. Долговременные прогнозы (сроком свыше 5 лет).

По форме составления прогнозирования различают прогнозы:

а) Поисковые. Основаны на изучении временного и динамического ряда.

б) Нормативно- целевые. При составлении н.-ц. прогнозов учитываются определенные рамки изменения признаков, которые влияют на прогнозируемую величину. Например: потребительская корзина, уровень жизни.

При составлении прогноза необходимо учесть факторы:

— Продолжительность временного ряда, на основе которого строится прогноз (чем более длительный период изучения явления, тем более надежный прогноз).

— Сопоставимость значений временного и динамического рядов.

Статистическая совокупность изменяется с течением времени и сами по себе значения признака не всегда объективно отражают изменения совокупности. Важно учитывать развитие других признаков, которые влияют на значение прогнозируемого признака.

Для составления прогноза используется сглаживание временного или динамического ряда. Сглаживание позволяет выявить тенденцию совокупности. Изменения динамического или временного ряда. Под трендом понимают тенденцию развития совокупности (рост, падение, стационарность и насыщение).

Общая характеристика методов прогнозирования.

Метод наименьших квадратов в простейшем случае (линейная функция от одного фактора) был разработан К. Гауссом в 1794—1795 гг. Могут оказаться полезными предварительные преобразования переменных, например, логарифмирование. Наиболее часто используется метод наименьших квадратов при нескольких факторах.

Метод наименьших модулей, сплайны и другие методы экстраполяции применяются реже, хотя их статистические свойства зачастую лучше. Накоплен опыт прогнозирования индекса инфляции и стоимости потребительской корзины. Оказалось полезным преобразование (логарифмирование) переменной — текущего индекса инфляции. Оценивание точности прогноза (в частности, с помощью доверительных интервалов) — необходимая часть процедуры прогнозирования.

Непараметрические методы доверительного оценивания точки наложения (встречи) двух временных рядов для оценки динамики технического уровня собственной продукции и продукции конкурентов, представленной на мировом рынке. Применяются также эвристические приемы, не основанные на вероятностно статистической теории: метод скользящих средних, метод экспоненциального сглаживания.

Многомерная регрессия, в том числе с использованием непараметрических оценок плотности распределения, — основной на настоящий момент статистический аппарат прогнозирования.

Прогнозирование на основе данных, имеющих нечисловую природу, например, прогнозирование качественных признаков основано на результатах статистики нечисловых данных.

Вопрос 22. Аналитические показатели динамики временных рядов.

Чтобы проследить за направлением и размером изменений уровней динамического ряда рассчитываются такие показатели, как:

абсолютные приросты ( изменения уровней);

темпы роста;

темпы прироста ( снижения) уровней.

В зависимости от базы сравнения эти показатели могут рассчитываться как цепные и базисные. Цепные – сравниваются уровни ряда за текущий и предыдущий периоды. Базисные – производится сравнение уровней ряда с некоторым уровнем, обычно начальным (уровень, с которым сравниваются другие уровни).

Абсолютный прирост уровней – это разность текущего и предыдущего уровней ряда( цепной) или текущего и базисного уровней (базисный):

1 , уi – у0 .

А. п показывает, на сколько уровень одного периода больше или меньше уровня предыдущего или базисного периода.

Темпы роста – относительный показатель, рассчитывается как процентное соотношение двух уровней ряда: текущего и предыдущего – цепной, а текущего и базисного – базисный.

Трц = *100; Трб = *100

Темпы роста могут выражаться в виде коэффициентов (Кр), т. е. простого кратного отношения.

Выраженные в коэффициентах темпы роста показывают, во сколько раз уровень данного периода больше уровня базы сравнения или какую часть его составляет. При процентном выражении темп роста показывает, сколько процентов составляет уровень данного периода от уровня базы сравнения.

Темп прироста – относительный показатель, показывающий, на сколько процентов данный уровень больше ( или меньше) другого, принимаемого за базу сравнения ( предыдущего или базисного). Показатель можно рассчитать двояко:

Тр ц = Т р ц — 100 , р б = Т р б – 100, или

р ц = , р б= .

Иногда для анализа рассчитывается такой показатель, как абсолютное значение% прироста— отношение абсолютного прироста уровня к темпу прироста уровня к темпу прироста ( за соответствующий период):

А= = yi-1.

Относительным ускорением – наз-ся разность следующих друг за другом темпов роста и прироста:

% = Т р i — Т р i-1 или % = Тр i- Тр i-1.

Коэффициент опережения – это отношение текущего темпа роста к предыдущему:

Копер = .

Иногда коэффициентом опережения называют отношение темпов роста или прироста по двум динамическим рядам в одинаковые отрезки времени.



admin