Разница между регрессией и дисперсионным анализом
И регрессия, и дисперсионный анализ представляют собой статистические модели, которые используются для прогнозирования непрерывного результата, но в случае регрессии непрерывный результат прогнозируется на основе одной или более чем одной непрерывной переменной-предиктора, тогда как в случае дисперсионного анализа непрерывный результат является прогнозируется на основе одной или нескольких категориальных переменных-предикторов.
Регрессия - это статистический метод для установления взаимосвязи между наборами переменных, чтобы делать прогнозы зависимой переменной с помощью независимых переменных, ANOVA, с другой стороны, представляет собой статистический инструмент, применяемый к несвязанным группам, чтобы выяснить, есть ли у них обычное средство.
Что такое регресс?
Регрессия - очень эффективный статистический метод для установления взаимосвязи между наборами переменных. Переменные, для которых выполняется регрессионный анализ, - это зависимая переменная и одна или несколько независимых переменных. Это метод понимания влияния на зависимую переменную одной или нескольких независимых переменных.
- Предположим, например, что компания по производству красок использует одну из производных сырой растворителя и мономеров в качестве сырья, мы можем провести регрессионный анализ между ценой этого сырья и ценой на нефть марки Brent.
- В этом примере цена сырья является зависимой переменной, а цена Brent - независимой переменной.
- Поскольку цена растворителей и мономеров увеличивается и уменьшается с ростом и падением цен на нефть марки Brent, цена сырья является зависимой переменной.
- Аналогичным образом, любое бизнес-решение для проверки гипотезы о том, что конкретное действие приведет к увеличению прибыльности подразделения, может быть проверено на основе результата регрессии между зависимыми и независимыми переменными.
Что такое Анова?
ANOVA - это краткая форма дисперсионного анализа. ANOVA - это статистический инструмент, который обычно используется для случайных величин. В нем участвуют группы, не связанные напрямую друг с другом, чтобы выяснить, существуют ли какие-либо общие средства.
- Простой пример, чтобы понять этот момент, - запустить ANOVA для серии оценок студентов из разных колледжей, чтобы попытаться выяснить, лучше ли один студент из одной школы, чем другой.
- Другой пример: две отдельные исследовательские группы исследуют разные продукты, не связанные друг с другом. ANOVA поможет найти, какой из них дает лучшие результаты. Три популярных метода ANOVA - это случайный эффект, фиксированный эффект и смешанный эффект.
Регрессия против ANOVA Инфографика
Ключевые различия между регрессией и ANOVA
- Регрессия применяется к переменным, которые в основном являются фиксированными или независимыми по своей природе, а ANOVA применяется к случайным величинам.
- Регрессия в основном используется в двух формах: линейная регрессия и множественная регрессия, хотя теоретически присутствуют и другие формы регрессии, эти типы наиболее широко используются на практике, с другой стороны, есть три популярных типа дисперсионного анализа, они являются случайными. эффект, фиксированный эффект и смешанный эффект.
- Регрессия в основном используется для того, чтобы делать оценки или прогнозы для зависимой переменной с помощью одной или нескольких независимых переменных, а ANOVA используется для нахождения общего среднего между переменными разных групп.
- В случае регрессии количество членов ошибки равно единице, но в случае ANOVA количество членов ошибки больше единицы.
Сравнительная таблица
Основа | Регресс | ANOVA | ||
Определение | Регрессия - очень эффективный статистический метод для установления взаимосвязи между наборами переменных. | ANOVA - это краткая форма дисперсионного анализа. Он применяется к несвязанным группам, чтобы узнать, есть ли у них общее среднее значение. | ||
Природа переменной | Регрессия применяется к независимым переменным или фиксированным переменным. | ANOVA применяется к переменным, которые являются случайными по своей природе. | ||
Типы | Регрессия в основном используется в двух формах: линейная регрессия и множественная регрессия, вторая - когда количество независимых переменных больше одной. | Три популярных типа ANOVA - это случайный эффект, фиксированный эффект и смешанный эффект. | ||
Примеры | Компания по производству красок использует растворители и мономеры в качестве сырья, которое является производным от нефти; мы можем провести регрессионный анализ между ценой этого сырья и ценой на нефть марки Brent. | Если две отдельные исследовательские группы исследуют разные продукты, не связанные друг с другом. ANOVA поможет найти, какой из них дает лучшие результаты. | ||
Используемые переменные | Регрессия применяется к двум наборам переменных, одна из которых является зависимой переменной, а другая - независимой переменной. Количество независимых переменных в регрессии может быть одной или несколькими. | ANOVA применяется к различным переменным, которые не обязательно связаны друг с другом. | ||
Использование теста | Регрессия в основном используется практиками или отраслевыми экспертами, чтобы делать оценки или прогнозы для зависимой переменной. | ANOVA используется для поиска общего среднего между переменными разных групп. | ||
Ошибки | Прогнозы, сделанные с помощью регрессионного анализа, не всегда желательны, поскольку из-за члена ошибки в регрессии этот член ошибки также известен как остаточный. В случае регрессии число ошибок равно единице. | Количество ошибок в случае ANOVA, в отличие от регрессии, больше единицы. |
Вывод
И регрессия, и ANOVA - мощные статистические инструменты, которые применяются к множеству переменных. Регрессия используется для того, чтобы делать прогнозы зависимой переменной с помощью независимых переменных, которые имеют некоторые отношения. Полезно проверить гипотезу о том, верна ли выдвинутая гипотеза.
Регрессия используется для переменных, которые являются фиксированными или независимыми по своей природе, и может выполняться с использованием одной независимой переменной или нескольких независимых переменных. ANOVA используется для поиска общего между переменными разных групп, которые не связаны друг с другом. Он используется не для прогнозирования или оценки, а для понимания отношений между набором переменных.