Корреляция (от лат.) – взаимосвязь, взаимозависимость.
Корреляция – взаимосвязь двух и более случайных величин.
Корреляционный анализ — метод обработки статистических данных, основанный на проверки гипотез о связях между переменными с применением коэффициентов корреляции.
Таким образом, корреляционный анализ определяет, существует ли связь между переменными, насколько эта связь сильна и показывает направление и форму этой взаимосвязи. Метод корреляционного анализа, также позволяет обнаружить линейные (прямые и обратные) связи между двумя переменными.
Случайные величины X и Y могут быть либо зависимыми, либо независимыми. Если зависимы эти величины, то изменение значений одной или нескольких из этих величин ведут к изменению значений другой или других величин.
В случае, если связь окажется существенной, то необходимо воспользоваться методом регрессионного анализа. Регрессионный анализ позволяет определить характер связи и в дальнейшем построить её математическую модель.
Допустим, даны две случайные величины X и Y,
где X=x1,x2…xn и Y=y1,y2…yn
Имеется гипотеза о наличии взаимной линейной связи между этими случайными величинами.
Тогда коэффициент корреляции находится по формуле:
где
формулы средних значений величин x и y равна:
Формулы дисперсий:
Формула ковариации:
N – число пар данных
Формулу
также называют формулой для вычисления линейного коэффициента корреляции Пирсона.
Также формулу коэффициента корреляции можно представить в следующем виде
Корреляционный момент (ковариации) определяется по формуле:
Величина коэффициента корреляции показывает тесноту связи и является математической мерой корреляции. В парной корреляции используется две переменные, а в множественной более двух переменных.
Величина коэффициента корреляции всегда ограничена, то есть
-1< rxy<1
Значение коэффициента корреляции будем интерпретировать следующим образом:
0<|r|< 0,2 — связи нет;
0,2 <|r|< 0,4 — связь слабая;
0,4 <|r|< 0,7 — связь средняя;
0,7 <|r|< 1 — связь сильная;
r > 0 — связь прямая или положительная;
r < 0 — связь обратная или отрицательная.
Если коэффициент корреляции r=0, то корреляция отсутствует, но это не указывает об отсутствии связи, так как она может быть нелинейной.
Для наглядности, на рисунке слева – сильная связь, справа – связь слабая.
Вид корреляции – линейная положительная
Вид корреляции – линейная отрицательная
Отсутствует корреляция