Что такое коэффициент корреляции?
Коэффициент корреляции используется для определения того, насколько сильна связь между двумя переменными, и его значения могут находиться в диапазоне от -1,0 до 1,0, где -1,0 представляет отрицательную корреляцию, а +1,0 представляет собой положительную взаимосвязь. Он учитывает относительные движения переменных, а затем определяет, есть ли между ними какая-либо связь.
Формула коэффициента корреляции
где
- r = коэффициент корреляции
- n = количество наблюдений
- x = 1-я переменная в контексте
- y = 2-я переменная
Объяснение
Если есть какая-либо корреляция или, скажем, взаимосвязь между двумя переменными, тогда он должен указать, если одна из переменных изменится в значении, тогда другая переменная также будет иметь тенденцию к изменению значения, например, в частности, которое может быть либо в том же, либо в противоположном направлении . Часть уравнения с числителем служит для проверки относительной силы переменных, движущихся вместе, а часть со знаменателем уравнения масштабирует числитель путем умножения разностей переменных и переменных в квадрате.
Примеры
Вы можете скачать этот шаблон формулы коэффициента корреляции в Excel здесь - шаблон формулы коэффициента корреляции в ExcelПример # 1
Рассмотрим следующие две переменные x иy, которые необходимы для расчета коэффициента корреляции.
Ниже приведены данные для расчета
Решение:
Используя приведенное выше уравнение, мы можем вычислить следующие
У нас есть все значения в приведенной выше таблице с n = 4.
Теперь давайте введем значения для расчета коэффициента корреляции.
Поэтому расчет выглядит следующим образом:
r = (4 * 25 032,24) - (262,55 * 317,31) / √ [(4 * 20 855,74) - (262,55) 2] * [(4 * 30 058,55) - (317,31) 2]
r = 16 820,21 / 16 831,57
Коэффициент будет -
Коэффициент = 0,99932640
Пример # 2
Страна X - страна с растущей экономикой, и она хочет провести независимый анализ решений, принятых ее центральным банком в отношении изменений процентных ставок, повлияли ли они на инфляцию и имеют ли они возможность контролировать то же самое.
Ниже приводится сводная информация о процентной ставке и уровне инфляции, которые преобладали в стране в среднем за эти годы.
Ниже приведены данные для расчета.
Президент страны обратился к вам с просьбой провести анализ и представить его на следующей встрече. Используйте корреляцию и определите, достиг ли центральный банк своей цели или нет.
Решение:
Используя формулу, описанную выше, мы можем рассчитать коэффициент корреляции. Если рассматривать процентную ставку как одну переменную, скажем x, а уровень инфляции как другую переменную - как y.
У нас есть все значения в приведенной выше таблице с n = 6.
Теперь давайте введем значения для расчета коэффициента корреляции.
r = (6 * 170,91) - (46,35 * 22,24) / √ [(6 * 361,19) - (46,35) 2] * [(6 * 82,74) - (22,24) 2]
г = -5,36 / 5,88
Корреляция будет -
Корреляция = -0,92
Анализ: Похоже, что корреляция между процентной ставкой и уровнем инфляции отрицательная, что кажется правильным соотношением, поскольку процентная ставка растет, инфляция уменьшается, что означает, что они имеют тенденцию двигаться в противоположном направлении друг от друга, и из приведенного выше результата Центральный банк успешно реализовал решение, касающееся процентной политики.
Пример # 3
Лаборатория ABC проводит исследования роста и возраста и хотела узнать, есть ли между ними какая-либо связь. Они собрали выборку из 1000 человек для каждой категории и определили средний рост в этой группе.
Ниже приведены данные для расчета коэффициента корреляции.
От вас требуется рассчитать коэффициент корреляции и прийти к выводу, что связь существует.
Решение:
Если рассматривать возраст как одну переменную, скажем x, а рост (в см) - как другую переменную как y.
У нас есть все значения в приведенной выше таблице с n = 6.
Теперь давайте введем значения для расчета коэффициента корреляции.
r = (6 * 10,137) - (70 * 850) / √ [(6 * 940 - (70) 2] * [(6 * 1,20,834) - (850) 2]
г = 1322,00 / 1361,23
Корреляция будет -
Корреляция = 0,971177099
Актуальность и использование
Он используется в статистике в основном для анализа силы взаимосвязи между рассматриваемыми переменными и, кроме того, он также измеряет, существует ли какая-либо линейная взаимосвязь между заданными наборами данных и насколько хорошо они могут быть связаны. Одним из распространенных показателей корреляции является коэффициент корреляции Пирсона.
Если переменная изменяется в значении и вместе с этой другой переменной изменяется в значении, то понимание этой взаимосвязи имеет решающее значение, поскольку можно использовать значение первой переменной для прогнозирования изменения значения второй переменной. Сегодня, в современную эпоху, корреляция имеет множество различных применений, например, в финансовой индустрии, научных исследованиях и других сферах. Но, однако, важно знать, что корреляция имеет три основных типа отношений. Первая - это положительная связь, которая гласит, что если есть изменение в значении переменной, то будет изменение связанной переменной в том же направлении, аналогично, если есть отрицательная связь, то связанная переменная будет вести себя в противоположное направление. Кроме того, если нет корреляции, тогда r будет означать нулевое значение.См. Изображения ниже, чтобы лучше понять концепцию.