Корреляционный анализ

Корреляция (от лат.) – взаимосвязь, взаимозависимость.

Корреляция – взаимосвязь двух и более случайных величин.

Корреляционный анализ — метод обработки статистических данных, основанный на проверки гипотез о связях между переменными с применением коэффициентов корреляции.

Таким образом, корреляционный анализ определяет, существует ли связь между переменными, насколько эта связь сильна и показывает направление и форму этой взаимосвязи. Метод корреляционного анализа, также позволяет обнаружить линейные (прямые и обратные) связи между двумя переменными.

Случайные величины X и Y могут быть либо зависимыми, либо независимыми. Если зависимы эти величины, то изменение значений одной или нескольких из этих величин ведут к изменению значений другой или других величин.

В случае, если связь окажется существенной, то необходимо воспользоваться методом регрессионного анализа. Регрессионный анализ позволяет определить характер связи и в дальнейшем построить её математическую модель.

Допустим, даны две случайные величины X и Y,

где X=x1,x2…xn и Y=y1,y2…yn

Имеется гипотеза о наличии взаимной линейной связи между этими случайными величинами.

Тогда коэффициент корреляции находится по формуле:

коэффициент корреляции формула

где

формулы средних значений величин x и y равна:

формула среднее значение

Формулы дисперсий:

формулы дисперсий

Формула ковариации:

ковариация формула

N – число пар данных

Формулу

коэффициент корреляции формула

также называют формулой для вычисления линейного коэффициента корреляции Пирсона.

Также формулу коэффициента корреляции можно представить в следующем виде 

формула Коэффициент корреляции

Корреляционный момент (ковариации) определяется по формуле:

Корреляционный момент формула

Величина коэффициента корреляции показывает тесноту связи и является математической мерой корреляции. В парной корреляции используется две переменные, а в множественной более двух переменных.

Величина коэффициента корреляции всегда ограничена, то есть

-1< rxy<1

Значение коэффициента корреляции будем интерпретировать следующим образом:

0<|r|< 0,2 — связи нет;

0,2 <|r|< 0,4 — связь слабая;

0,4 <|r|< 0,7 — связь средняя;

0,7 <|r|< 1 — связь сильная;

r > 0 — связь прямая или положительная;

r < 0 — связь обратная или отрицательная.

Если коэффициент корреляции r=0, то корреляция отсутствует, но это не указывает об отсутствии связи, так как она может быть нелинейной.

Графики

Для наглядности, на рисунке слева – сильная связь, справа – связь слабая.

  Корреляционный анализ рисунок

Вид корреляции – линейная положительная

Корреляционный анализ график

Вид корреляции – линейная отрицательная

Корреляционный анализ график

Отсутствует корреляция

6947

Leave a Reply

Ваш адрес email не будет опубликован.