scipy.stats.mstats.

spearmanr#

scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, ось=None, nan_policy='propagate', альтернатива='two-sided')[источник]#

Вычисляет коэффициент корреляции Спирмена и p-значение для проверки на отсутствие корреляции.

Корреляция Спирмена — это непараметрическая мера линейной зависимости между двумя наборами данных. В отличие от корреляции Пирсона, корреляция Спирмена не предполагает, что оба набора данных нормально распределены. Как и другие коэффициенты корреляции, этот варьируется от -1 до +1, где 0 означает отсутствие корреляции. Корреляции -1 или +1 подразумевают монотонную зависимость. Положительные корреляции означают, что по мере того, как x увеличивается, также увеличивается y. Отрицательные корреляции означают, что по мере того, как x увеличивается, y уменьшается.

Пропущенные значения отбрасываются попарно: если значение отсутствует в x, соответствующее значение в y замаскировано.

p-значение приблизительно указывает вероятность того, что некоррелированная система произведёт наборы данных, имеющие корреляцию Спирмена по крайней мере такую же экстремальную, как вычисленная из этих наборов данных. p-значения не полностью надёжны, но, вероятно, разумны для наборов данных размером более 500.

Параметры:
x, y1D или 2D array_like, y опционально

Один или два одномерных или двумерных массива, содержащих несколько переменных и наблюдений. Когда они одномерные, каждый представляет собой вектор наблюдений одной переменной. Для поведения в двумерном случае см. ниже axis, ниже.

use_tiesbool, необязательно

НЕ ИСПОЛЬЗУЙТЕ. Ничего не делает, ключевое слово оставлено только для сохранения обратной совместимости.

осьint или None, опционально

Если axis=0 (по умолчанию), то каждый столбец представляет переменную, с наблюдениями в строках. Если axis=1, отношение транспонируется: каждая строка представляет переменную, а столбцы содержат наблюдения. Если axis=None, то оба массива будут сведены в один.

nan_policy{'propagate', 'raise', 'omit'}, опционально

Определяет, как обрабатывать входные данные, содержащие nan. 'propagate' возвращает nan, 'raise' вызывает ошибку, 'omit' выполняет вычисления, игнорируя значения nan. По умолчанию 'propagate'.

альтернатива{‘two-sided’, ‘less’, ‘greater’}, необязательный

Определяет альтернативную гипотезу. По умолчанию 'two-sided'. Доступны следующие опции:

  • 'two-sided': корреляция ненулевая

  • 'less': корреляция отрицательная (меньше нуля)

  • 'greater': корреляция положительная (больше нуля)

Добавлено в версии 1.7.0.

Возвращает:
resSignificanceResult

Объект, содержащий атрибуты:

статистикаfloat или ndarray (2-D квадратная)

Матрица корреляции Спирмена или коэффициент корреляции (если заданы только 2 переменные в качестве параметров). Матрица корреляции квадратная с длиной, равной общему количеству переменных (столбцов или строк) в a и b объединены.

p-значениеfloat

P-значение для проверки гипотезы, нулевая гипотеза которой состоит в том, что два набора данных линейно не коррелированы. См. альтернатива выше для альтернативных гипотез. p-значение имеет ту же форму, что и статистика.

Ссылки

[CRCProbStat2000] раздел 14.7