spearmanr#
- scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, ось=None, nan_policy='propagate', альтернатива='two-sided')[источник]#
Вычисляет коэффициент корреляции Спирмена и p-значение для проверки на отсутствие корреляции.
Корреляция Спирмена — это непараметрическая мера линейной зависимости между двумя наборами данных. В отличие от корреляции Пирсона, корреляция Спирмена не предполагает, что оба набора данных нормально распределены. Как и другие коэффициенты корреляции, этот варьируется от -1 до +1, где 0 означает отсутствие корреляции. Корреляции -1 или +1 подразумевают монотонную зависимость. Положительные корреляции означают, что по мере того, как x увеличивается, также увеличивается y. Отрицательные корреляции означают, что по мере того, как x увеличивается, y уменьшается.
Пропущенные значения отбрасываются попарно: если значение отсутствует в x, соответствующее значение в y замаскировано.
p-значение приблизительно указывает вероятность того, что некоррелированная система произведёт наборы данных, имеющие корреляцию Спирмена по крайней мере такую же экстремальную, как вычисленная из этих наборов данных. p-значения не полностью надёжны, но, вероятно, разумны для наборов данных размером более 500.
- Параметры:
- x, y1D или 2D array_like, y опционально
Один или два одномерных или двумерных массива, содержащих несколько переменных и наблюдений. Когда они одномерные, каждый представляет собой вектор наблюдений одной переменной. Для поведения в двумерном случае см. ниже
axis, ниже.- use_tiesbool, необязательно
НЕ ИСПОЛЬЗУЙТЕ. Ничего не делает, ключевое слово оставлено только для сохранения обратной совместимости.
- осьint или None, опционально
Если axis=0 (по умолчанию), то каждый столбец представляет переменную, с наблюдениями в строках. Если axis=1, отношение транспонируется: каждая строка представляет переменную, а столбцы содержат наблюдения. Если axis=None, то оба массива будут сведены в один.
- nan_policy{'propagate', 'raise', 'omit'}, опционально
Определяет, как обрабатывать входные данные, содержащие nan. 'propagate' возвращает nan, 'raise' вызывает ошибку, 'omit' выполняет вычисления, игнорируя значения nan. По умолчанию 'propagate'.
- альтернатива{‘two-sided’, ‘less’, ‘greater’}, необязательный
Определяет альтернативную гипотезу. По умолчанию 'two-sided'. Доступны следующие опции:
'two-sided': корреляция ненулевая
'less': корреляция отрицательная (меньше нуля)
'greater': корреляция положительная (больше нуля)
Добавлено в версии 1.7.0.
- Возвращает:
- resSignificanceResult
Объект, содержащий атрибуты:
- статистикаfloat или ndarray (2-D квадратная)
Матрица корреляции Спирмена или коэффициент корреляции (если заданы только 2 переменные в качестве параметров). Матрица корреляции квадратная с длиной, равной общему количеству переменных (столбцов или строк) в
aиbобъединены.- p-значениеfloat
P-значение для проверки гипотезы, нулевая гипотеза которой состоит в том, что два набора данных линейно не коррелированы. См. альтернатива выше для альтернативных гипотез. p-значение имеет ту же форму, что и статистика.
Ссылки
[CRCProbStat2000] раздел 14.7