Среднее против медианы | Различия между методами использования в статистике

Разница между средним и медианным значением

Среднее и Медиана - два часто используемых термина в математике, среднее значение похоже на среднее значение заданных чисел, оно суммирует числа и делит их на количество чисел, которое дает нам среднее значение, в то время как медиана, с другой стороны, возвращает среднее число из целого. набор данных, и если набор данных четный, то медиана складывает два средних числа и делит их на 2, получая медиану.

Они являются мерой центральной тенденции и часто используются при измерении больших наборов данных, где необходимо провести анализ и интерпретировать результаты. Среднее значение, медиана и мода - это три показателя средних, которые показывают разброс данных от среднего или среднего. Эти методы широко используются в статистике, тогда как среднее значение данных является наиболее широко используемым методом из трех.

Что это означает?

Среднее - это простая сумма количества наблюдений в массиве, деленная на количество наблюдений. Например, если говорить о среднем росте или среднем росте группы из 5 человек. Средний рост будет рассчитан путем суммирования роста 5 человек, разделенного на количество людей, т.е. 5.

Формула

Формула среднего значения = (сумма всех наблюдений / количество наблюдений)

Что такое медиана?

С другой стороны, медиана - это среднее число в наборе массива данных, которое отделяет верхний набор данных от нижнего. Данные необходимо сначала расположить в порядке возрастания, чтобы вычислить медианное значение данных. Если набор данных имеет количество элементов, необходимо взять среднее из двух средних чисел в наборе данных. Однако эти два метода часто используются как взаимозаменяемые.

Формула

Формула медианы = (n + 1) / 2

когда n - нечетное число

Медиана = [(n / 2) + {(n / 2) +1}] / 2

когда n четное число

Среднее и медианное значение инфографики

Давайте посмотрим основные различия между средним и медианой.

Среднее и медианное ключевые различия

  • Mean прост в использовании и применении и может применяться к любому набору массивов данных, будь то четный или нечетный. С другой стороны, медиана немного сложна в использовании, и набор данных необходимо сначала расположить в порядке возрастания или убывания перед расчетом.
  • Среднее значение обычно используется для нормальных распределений, тогда как медиана используется для набора данных искаженных распределений.
  • Среднее значение простое, но не надежное, поскольку оно может содержать выбросы в распределениях и иногда не может дать пользователю правильные результаты для интерпретации. С другой стороны, метод медианы является надежным и лучше подходит для использования, поскольку он используется для искаженных распределений для получения центральной тенденции набора дат и даст пользователю много точных результатов по сравнению со средним значением.
  • Есть только одна формула среднего, которая представляет собой сумму всех наблюдений, деленную на количество наблюдений. Принимая во внимание, что у медианы есть две формулы, одна из нечетных, где только средние числа из набора данных становятся медианой. Но когда у нас есть четный набор данных, выбирается середина из двух значений и делится на 2, что затем дает нам медиану четного набора данных.

Сравнительная таблица среднего и медианного значений

ЖадныйМедиана
Среднее значение вычисляется путем сложения всех значений в массиве данных, который затем делится на количество наблюдений.Медиана - это точное среднее значение набора данных. Его можно вычислить, расположив набор данных в порядке возрастания, а затем найдя или выбрав среднее значение из набора данных.
Он более широко используется в отрасли благодаря простому вычислению среднего значения и дает нам быстрое числоОн не часто используется в отрасли, но он более полный и точный, чем среднее значение, которое представляет собой простую сумму чисел.
Обычно он используется для обычно искаженного набора данных, т.е. нормального распределения.Особенно удобно описывать набор данных со значительным перекосом в данных или когда данные имеют длинный хвост. Он широко используется там, где планировщики имеют значительный вес в данных, что означает, что это не лучший метод расчета.
Это не надежный инструмент для вычисления центральной тенденции.Это очень надежный инструмент, поскольку он определяет вес данных, который обычно имеет большой вес на более длинных хвостах.
Очень чувствителен к выбросамНа него гораздо меньше влияют выбросы
Это просто использоватьЭто сложный характер
Он не может быть рассчитан для категориальных данных, так как значения не суммируются.Его нельзя идентифицировать для категоризированных номинальных данных, так как его нельзя логически упорядочить.

Вывод

Помимо среднего и медианы, есть еще один метод, который часто используется для измерения центральной тенденции - мода. Режим - это значение, которое наиболее часто встречается в наборе данных, режим имеет преимущество перед средним и медианным значением в том, что его можно найти как для числового, так и для категорированного набора данных.

Несмотря на существование режима и медианы, превосходства лучших результатов и анализа над средним значением, среднее значение по-прежнему является наиболее подходящей мерой центральной тенденции, особенно если набор данных является нормальным распределением и данные обычно искажены.

Как хороший аналитик, центральная тенденция должна измеряться всеми тремя методами данных, а дисперсия в анализе должна быть взвешена и тщательно проанализирована для получения лучших и более точных результатов в наборе данных.