Мультиколлинеарность (определение, типы) | Топ-3 примера с объяснением

Что такое мультиколлинеарность?

Мультиколлинеарность - это статистическое явление, при котором две или более переменных в регрессионной модели зависят от других переменных таким образом, что одну можно линейно предсказать, исходя из другой с высокой степенью точности. Он обычно используется в наблюдательных исследованиях и менее популярен в экспериментальных исследованиях.

Типы мультиколлинеарности

Есть четыре типа мультиколлинеарности

  • # 1 - Совершенная мультиколлинеарность - она ​​существует, когда независимые переменные в уравнении предсказывают идеальную линейную связь.
  • # 2 - Высокая мультиколлинеарность - это относится к линейной связи между двумя или более независимыми переменными, которые не полностью коррелированы друг с другом.
  • # 3 - Структурная мультиколлинеарность - это вызвано самим исследователем, вставляя различные независимые переменные в уравнение.
  • # 4 - Мультиколлинеарность на основе данных - это вызвано экспериментами, которые плохо спланированы исследователем.

Причины мультиколлинеарности

Независимые переменные, изменение параметров переменных делают то, что небольшое изменение переменных оказывает значительное влияние на результат, а сбор данных относится к взятой выборке выбранной совокупности.

Примеры мультиколлинеарности

Пример # 1

Предположим, что компания ABC Ltd, KPO, нанята фармацевтической компанией для предоставления исследовательских услуг и статистического анализа заболеваний в Индии. Для этого компания ABC ltd выбрала возраст, вес, профессию, рост и состояние здоровья в качестве первичных параметров.

  • В приведенном выше примере существует ситуация мультиколлинеарности, поскольку независимые переменные, выбранные для исследования, напрямую коррелируют с результатами. следовательно, исследователю было бы целесообразно сначала скорректировать переменные перед тем, как начинать какой-либо проект, поскольку на результаты будут напрямую влиять выбранные здесь переменные.

Пример # 2

Предположим, что компания ABC Ltd была назначена Tata Motors, чтобы понять, в какой категории на рынке объем продаж двигателей tata будет высоким.

  • В приведенном выше примере сначала будут определены независимые переменные, на основании которых необходимо завершить исследование. это может быть ежемесячный доход, возраст. марка, низший класс. Это означает только то, что будут выбраны данные, которые поместятся во все эти вкладки, чтобы выяснить, сколько людей могут купить этот автомобиль (tata nano), даже не глядя на какой-либо другой автомобиль.

Пример # 3

Предположим, что компания ABC Ltd была нанята для предоставления отчета, чтобы узнать, сколько людей в возрасте до 50 лет склонны к сердечным приступам. для этого параметры - возраст, пол, история болезни

  • В приведенном выше примере возникает мультиколлинеарность, потому что независимую переменную «возраст» необходимо настроить на возраст до 50 лет для приглашения приложений от общественности, чтобы лица старше 50 лет автоматически фильтровались.

Преимущества

Ниже приведены некоторые из преимуществ

  • Линейная связь между независимыми переменными в уравнении.
  • Очень полезно в статистических моделях и исследовательских отчетах, подготовленных исследовательскими фирмами.
  • Прямое воздействие на желаемый результат.

Недостатки

Ниже приведены некоторые из недостатков

  • В некоторых случаях эту проблему можно решить путем сбора дополнительных данных о переменных.
  • Неправильное использование фиктивных переменных, т.е. исследователь может забыть использовать фиктивные переменные всякий раз, когда это необходимо.
  • Вставка 2 одинаковых или идентичных переменных в уравнение, например, кг и фунты в весах.
  • Вставка переменной в уравнение, которая представляет собой комбинацию 2.
  • Сложно выполнять вычисления, поскольку это статистический метод, и для его выполнения требуются статистические калькуляторы.

Вывод

Мультиколлинеарность - один из наиболее популярных статистических инструментов, часто используемых в регрессионном и статистическом анализе больших баз данных и желаемых результатов. Все крупные компании имеют в своей компании отдельный статистический отдел, который выполняет статистический регрессионный анализ продуктов или людей, чтобы предоставить стратегическое представление о рынке руководству, а также помочь им разработать свои долгосрочные стратегии с учетом этого. Графическое представление анализа дает читателю четкое представление о прямой взаимосвязи, точности и производительности.

  • Если цель исследователя - понять независимые переменные в уравнении, то мультиколлинеарность станет для него большой проблемой.
  • Исследователю необходимо внести необходимые изменения в переменные на самом этапе 0, иначе это может сильно повлиять на результаты.
  • Мультиколлинеарность может быть сделана путем изучения корреляционной матрицы.
  • Лечебные меры играют важную роль в решении проблем мультиколлинеарности.