Персональный сайт - ТЕМА 15. Мультиколлинеарность.

175. Что такое мультиколлинеарность в эконометрике?

Смысл мультиколлинеарности.

Слово «коллинеарность» описывает линейную связь между двумя независимыми переменными, тогда как «мультиколлинеарность» – между более чем двумя переменными. На практике всегда используется один термин. Термин «мультиколлинеарность» введен Рагнаром Фришем.

Виды мультиколлинеарности

1. Строгая (perfect) мультиколлинеарность – наличие линейной функциональной связи между независимыми переменными (иногда также и зависимой).

2. Нестрогая (imperfect) мультиколлинеарность – наличие сильной линейной корреляционной связи между независимыми переменными (иногда также и зависимой).

176. В чем сущность проблемы мультиколлинеарности?

Корреляционные связи есть всегда. Проблема мультиколлинеарности – проблема силы проявления корреляционных связей.

Однозначных критериев мультиколлинеарности не существует.

Строгая мультиколлинеарность нарушает одно из основных правил Гаусса-Маркова и делает построение регрессии полностью невозможным.

Нестрогая мультиколлинеарность затрудняет работу, но не препятствует получению правильных выводов.

177. Каковы основные причины возникновения мультиколлинеарности?

1. ошибочное включение в уравнение 2х или более линейно зависимых переменных

2. две или более объясняющие переменные, в нормальной ситуации слабо коррелированные, становятся в конкретных условиях выборки сильно коррелированными.

3. в модель включается переменная, сильно коррелирующая с зависимой переменной.

178. Что такое доминантная переменная?

Это такая независимая переменная, включаемая в модель, которая сильно коррелирует с зависимой переменной. Такая переменная «забивает» влияние всех остальных переменных и их влияние становится незначимым.

179. В чем состоит интерпретация метода наименьших квадратов как метода определения вклада факторов?

МНК позволяют оценить вклад каждого фактора по отдельности даже в случае, когда переменные сильно коррелированны. (сильная мультиколлинеарность)

180. Почему мультиколлинеарность может быть охарактеризована в большей степени как проблема выборки, а не генеральной совокупности?

Потому что мультиколлинеарность в большей степени зависит от свойств самой выборки, например, количества наблюдений и величины ошибок при измерении переменных.

Мультиколлинеарность - явление, проявляющееся на уровне выборки:

1. В одной выборке мультиколлинеарность может быть сильной, в другой - слабой

2. Выборочные данные следует всесторонне предварительно исследовать.

3. Полезен расчет выборочных коэффициентов корреляции, ковариационной матрицы и ее определителя.

181. Может ли проявиться мультиколлинеарность при отсутствии явных парных корреляционных зависимостей между переменными?

Может. Так как мультиколлинеарность – ситуация линейной зависимости между объясняющими переменными. Однако вовсе необязательно это зависимость должна быть парной.

182. Каковы основные проявления и последствия мультиколлинеарности в регрессионном анализе?

Вводная информация:

2 вида мультиколлинеарности:

1) Строгая Мультиколлинеарность – наличие линейной функциональной связи между независимыми переменными (иногда также и зависимой)

2) Нестрогая мультиколлинеарность – наличие сильной линейной кореляционой связи между независимыми переменными (иногда также и зависимой)

Когда возникает мультиколлинеарность:

1. Ошибочное включение в уравнение двух или более линейно зависимых переменных

2. Две или более объясняющие переменные, в нормальной ситуации слабо коррелированные, становятся в конкретных условиях выборки сильно коррелированными.

3. В модель включается переменная, сильно коррелирующая с зависимой переменной (такая независимая переменная называется доминантной)

Последствия мультиколлинеарности

1. Оценки коэффициентов остаются несмещенными

2. Стандартные ошибки коэффициентов увеличиваются

3. Вычисленные t-статистики занижены.

4. Оценки становится очень чувствительными к изменению спецификации и изменению отдельных наблюдений.

5. Общее качество уравнения, а также оценки переменных, не связанных мультиколлинеарностью, остаются незатронутыми.

6. Чем ближе мультиколлинеарность к совершенной (строгой), тем серьезнее ее последствия.

183. Как влияет мультиколлинеарность на значимость уравнения как целого?

Наличие мультиколлинеарности не говорит о неверной спецификации модели, коэффициенты остаются несмещенными, а стандартные ошибки рассчитываются корректно. Однако из-за увеличения стандартных ошибок возрастает риск того, что уравнение будет ошибочно признано незначимым.

184. Как влияет мультиколлинеарность на значимость отдельных коэффициентов

регрессии?

При наличии мультиколлинеарности стандартные ошибки становятся больше, чем они были бы, если бы мультиколлинеарности не было, что приводит к меньшей надежности полученных оценок.

Другой вариант:

Мультиколлинеарность приводит к увеличению дисперсий оценок коэффициентов, уменьшению значений t-stat. (что приводит к неверным выводам о значимости коэффициента), может выражаться в неверном с точки зрения теории или данных знаке коэффициента (как у нас в семинаре 6). Проявляется в неустойчивости коэффициента и его дисперсии в зависимости от спецификации регрессии, объема выборки (в семинаре 6 коэффициент при располагаемом доходе сильно менялся в зависимости от наших действий и не только из-за смещения). Наличие доминантной переменной (коррелированной с зависимой переменной) делает коэффициенты при остальных объясняющих переменных незначимыми.

185. Могут ли коэффициенты множественной регрессии быть незначимыми, если уравнение в целом значимо?

Таким образом, может проявляться мультиколлинеарность в регрессии с данными объясняющими переменными, даже если модель правильно специфицирована, поскольку происходит занижение t-stat, в то время как общая значимость уравнения и значимость некоррелирующих переменных остаются незатронутыми.

186. Могут ли некоторые коэффициенты множественной регрессии быть значимыми, если уравнение в целом незначимо?

Да, могут. Например, при оценивании не имеющей смысла регрессии с 40 объясняющими переменными, каждая из которых не является действительным детерминантом зависимой переменной, F-статистика должна оказаться достаточно низкой, чтобы гипотеза H0 (модель не обладает никакой объясняющей способностью) не была отвергнута. Однако при выполнении t-теста для коэффициентов регрессии на 5%-ном уровне, существует 5%-ная вероятность допустить ошибку I рода (коэффициенты значимы - истинная гипотеза H0 (коэффициент при переменной равен 0) отвергается), поэтому в среднем можно ожидать, что 2 из 40 переменных будут иметь «значимые» коэффициенты.

187. Почему мультиколлинеарность часто вызывает появление «неправильного» знака коэффициента регрессии?

При мультиколлинеарности коэффициенты становятся неустойчивыми, поскольку становится сложно отделить влияние одной переменной от другой переменной. В результате оценки могут перейти через нуль и оказаться по другую сторону от нуля. Если это происходит, возникает неправильный знак коэффициента.

Другой вариант:

Из-за увеличения стандартных ошибок коэффициентов (дисперсии оценок коэффициентов) – оценка сильно отклоняется от теоретического значения. Такое явление часто возникает, когда коэффициенты при переменных положительны в теоретической модели, а корреляция между объясняющими переменными сильнее, чем каждой из объясняющих переменных с зависимой.

188. Как можно обнаружить наличие мультиколлинеарности?

Проблема мультиколлинеарности может возникнуть, когда существует корреляция между объясняющими переменными.

Наиболее характерные признаки мультиколлинеарности:

ü Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению коэффициентов модели.

ü Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой и обладает хорошей объясняющей способностью (хорошие значения F-статистики и R²).

ü Оценки коэффициентов имеют неправильные с точки зрения теории (и логики) знаки или неоправданно большие значения. Коэффициенты, которые по логике должны быть значимы, оказываются незначимыми.

189. Что следует предпринять в случае наличия мультиколлинеарности?

Можно попытаться уменьшить дисперсию случайного члена: если можем найти важную переменную, которая не включена в модель и, следовательно, вносит вклад в значение u, то мы уменьшим теоретическую дисперсию случайного члена, добавив эту переменную в уравнение регрессии.
Можно увеличить или изменить выборку.
Еще возможный путь смягчения проблемы мультиколлинеарности состоит в увеличении среднеквадратического отклонения объясняющих переменных (возможно на стадии проектирования опроса – например, привлекать к участию в опросе и бедное, и богатое население).
На стадии опроса нужно приложит все усилия для получения такой выборки, в которой объясняющие переменные было бы как можно меньше связаны между собой
Исключить одну из переменных
Преобразовать мультиколлинеарные переменные:
- Использовать нелинейные формы
- Использовать агрегаты (линейные комбинации нескольких переменных)
- Использовать первые разности вместо самих переменных
- Ничего не делать! (это не шуткаJ)

Сделать бесплатный сайт с uCoz