Регрессия против ANOVA | 7 главных отличий (с инфографикой)

Разница между регрессией и дисперсионным анализом

И регрессия, и дисперсионный анализ представляют собой статистические модели, которые используются для прогнозирования непрерывного результата, но в случае регрессии непрерывный результат прогнозируется на основе одной или более чем одной непрерывной переменной-предиктора, тогда как в случае дисперсионного анализа непрерывный результат является прогнозируется на основе одной или нескольких категориальных переменных-предикторов.

Регрессия - это статистический метод для установления взаимосвязи между наборами переменных, чтобы делать прогнозы зависимой переменной с помощью независимых переменных, ANOVA, с другой стороны, представляет собой статистический инструмент, применяемый к несвязанным группам, чтобы выяснить, есть ли у них обычное средство.

Что такое регресс?

Регрессия - очень эффективный статистический метод для установления взаимосвязи между наборами переменных. Переменные, для которых выполняется регрессионный анализ, - это зависимая переменная и одна или несколько независимых переменных. Это метод понимания влияния на зависимую переменную одной или нескольких независимых переменных.

  • Предположим, например, что компания по производству красок использует одну из производных сырой растворителя и мономеров в качестве сырья, мы можем провести регрессионный анализ между ценой этого сырья и ценой на нефть марки Brent.
  • В этом примере цена сырья является зависимой переменной, а цена Brent - независимой переменной.
  • Поскольку цена растворителей и мономеров увеличивается и уменьшается с ростом и падением цен на нефть марки Brent, цена сырья является зависимой переменной.
  • Аналогичным образом, любое бизнес-решение для проверки гипотезы о том, что конкретное действие приведет к увеличению прибыльности подразделения, может быть проверено на основе результата регрессии между зависимыми и независимыми переменными.

Что такое Анова?

ANOVA - это краткая форма дисперсионного анализа. ANOVA - это статистический инструмент, который обычно используется для случайных величин. В нем участвуют группы, не связанные напрямую друг с другом, чтобы выяснить, существуют ли какие-либо общие средства.

  • Простой пример, чтобы понять этот момент, - запустить ANOVA для серии оценок студентов из разных колледжей, чтобы попытаться выяснить, лучше ли один студент из одной школы, чем другой.
  • Другой пример: две отдельные исследовательские группы исследуют разные продукты, не связанные друг с другом. ANOVA поможет найти, какой из них дает лучшие результаты. Три популярных метода ANOVA - это случайный эффект, фиксированный эффект и смешанный эффект.

Регрессия против ANOVA Инфографика

Ключевые различия между регрессией и ANOVA

  • Регрессия применяется к переменным, которые в основном являются фиксированными или независимыми по своей природе, а ANOVA применяется к случайным величинам.
  • Регрессия в основном используется в двух формах: линейная регрессия и множественная регрессия, хотя теоретически присутствуют и другие формы регрессии, эти типы наиболее широко используются на практике, с другой стороны, есть три популярных типа дисперсионного анализа, они являются случайными. эффект, фиксированный эффект и смешанный эффект.
  • Регрессия в основном используется для того, чтобы делать оценки или прогнозы для зависимой переменной с помощью одной или нескольких независимых переменных, а ANOVA используется для нахождения общего среднего между переменными разных групп.
  • В случае регрессии количество членов ошибки равно единице, но в случае ANOVA количество членов ошибки больше единицы.

Сравнительная таблица

ОсноваРегрессANOVA
ОпределениеРегрессия - очень эффективный статистический метод для установления взаимосвязи между наборами переменных.ANOVA - это краткая форма дисперсионного анализа. Он применяется к несвязанным группам, чтобы узнать, есть ли у них общее среднее значение.
Природа переменнойРегрессия применяется к независимым переменным или фиксированным переменным.ANOVA применяется к переменным, которые являются случайными по своей природе.
ТипыРегрессия в основном используется в двух формах: линейная регрессия и множественная регрессия, вторая - когда количество независимых переменных больше одной.Три популярных типа ANOVA - это случайный эффект, фиксированный эффект и смешанный эффект.
ПримерыКомпания по производству красок использует растворители и мономеры в качестве сырья, которое является производным от нефти; мы можем провести регрессионный анализ между ценой этого сырья и ценой на нефть марки Brent.Если две отдельные исследовательские группы исследуют разные продукты, не связанные друг с другом. ANOVA поможет найти, какой из них дает лучшие результаты.
Используемые переменныеРегрессия применяется к двум наборам переменных, одна из которых является зависимой переменной, а другая - независимой переменной. Количество независимых переменных в регрессии может быть одной или несколькими.ANOVA применяется к различным переменным, которые не обязательно связаны друг с другом.
Использование тестаРегрессия в основном используется практиками или отраслевыми экспертами, чтобы делать оценки или прогнозы для зависимой переменной.ANOVA используется для поиска общего среднего между переменными разных групп.
ОшибкиПрогнозы, сделанные с помощью регрессионного анализа, не всегда желательны, поскольку из-за члена ошибки в регрессии этот член ошибки также известен как остаточный. В случае регрессии число ошибок равно единице.Количество ошибок в случае ANOVA, в отличие от регрессии, больше единицы.

Вывод

И регрессия, и ANOVA - мощные статистические инструменты, которые применяются к множеству переменных. Регрессия используется для того, чтобы делать прогнозы зависимой переменной с помощью независимых переменных, которые имеют некоторые отношения. Полезно проверить гипотезу о том, верна ли выдвинутая гипотеза.

Регрессия используется для переменных, которые являются фиксированными или независимыми по своей природе, и может выполняться с использованием одной независимой переменной или нескольких независимых переменных. ANOVA используется для поиска общего между переменными разных групп, которые не связаны друг с другом. Он используется не для прогнозирования или оценки, а для понимания отношений между набором переменных.