Статистические функции для маскированных массивов (scipy.stats.mstats)#

Этот модуль содержит большое количество статистических функций, которые можно использовать с замаскированными массивами.

Большинство этих функций аналогичны функциям в scipy.stats но могут иметь небольшие различия в API или используемом алгоритме. Поскольку это относительно новый пакет, некоторые изменения в API всё ещё возможны.

Сводная статистика#

describe(a[, axis, ddof, bias])

Вычисляет несколько описательных статистик переданного массива.

gmean(a[, axis, dtype, weights, nan_policy, ...])

Вычисляет взвешенное среднее геометрическое вдоль указанной оси.

hmean(a[, axis, dtype, weights, nan_policy, ...])

Вычислить взвешенное среднее гармоническое вдоль указанной оси.

kurtosis(a[, axis, fisher, bias])

Вычисляет эксцесс (Фишера или Пирсона) набора данных.

mode(a[, axis])

Возвращает массив модального (наиболее частого) значения в переданном массиве.

mquantiles(a[, prob, alphap, betap, axis, limit])

Вычисляет эмпирические квантили для массива данных.

hdmedian(data[, axis, var])

Возвращает оценку медианы Харрелла-Дэвиса вдоль заданной оси.

hdquantiles(data[, prob, axis, var])

Вычисляет оценки квантилей методом Харрелла-Дэвиса.

hdquantiles_sd(data[, prob, axis])

Стандартная ошибка оценок квантилей Харрелла-Дэвиса методом джекнайфа.

idealfourths(data[, axis])

Возвращает оценку нижнего и верхнего квартилей.

plotting_positions(data[, alpha, beta])

Возвращает позиции для построения графиков (или эмпирические процентильные точки) для данных.

meppf(data[, alpha, beta])

Возвращает позиции для построения графиков (или эмпирические процентильные точки) для данных.

moment(a[, moment, axis])

Вычисляет n-й момент относительно среднего для выборки.

skew(a[, axis, bias])

Вычисляет асимметрию набора данных.

tmean(a[, limits, inclusive, axis])

Вычислить усечённое среднее.

tvar(a[, limits, inclusive, axis, ddof])

Вычислить усеченную дисперсию

tmin(a[, lowerlimit, axis, inclusive])

Вычислить усечённый минимум

tmax(a[, upperlimit, axis, inclusive])

Вычислить усечённый максимум

tsem(a[, limits, inclusive, axis, ddof])

Вычислить усеченную стандартную ошибку среднего.

variation(a[, axis, ddof])

Вычислить коэффициент вариации.

find_repeats(arr)

Найти повторы в arr и вернуть кортеж (repeats, repeat_count).

sem(a[, axis, ddof])

Вычисляет стандартную ошибку среднего входного массива.

trimmed_mean(a[, limits, inclusive, ...])

Возвращает усечённое среднее данных вдоль заданной оси.

trimmed_mean_ci(data[, limits, inclusive, ...])

Выбранный доверительный интервал усеченного среднего вдоль заданной оси.

trimmed_std(a[, limits, inclusive, ...])

Возвращает усечённое стандартное отклонение данных вдоль заданной оси.

trimmed_var(a[, limits, inclusive, ...])

Возвращает усечённую дисперсию данных вдоль заданной оси.

Частотная статистика#

scoreatpercentile(data, per[, limit, ...])

Вычислить оценку в заданном процентиле 'per' последовательности a.

Функции корреляции#

f_oneway(*args)

Выполняет односторонний дисперсионный анализ (ANOVA), возвращая F-значение и вероятность для любого количества групп.

pearsonr(x, y)

Коэффициент корреляции Пирсона и p-значение для проверки отсутствия корреляции.

spearmanr(x[, y, use_ties, axis, ...])

Вычисляет коэффициент корреляции Спирмена и p-значение для проверки на отсутствие корреляции.

pointbiserialr(x, y)

Вычисляет коэффициент точечно-бисериальной корреляции и его p-значение.

kendalltau(x, y[, use_ties, use_missing, ...])

Вычисляет коэффициент ранговой корреляции Кендалла tau для двух переменных x и y.

kendalltau_seasonal(x)

Вычисляет многомерный ранговый коэффициент корреляции Кендалла tau для сезонных данных.

linregress(x[, y])

Вычисление линейной регрессии методом наименьших квадратов для двух наборов измерений.

siegelslopes(y[, x, method])

Вычисляет оценку Сигеля для набора точек (x, y).

theilslopes(y[, x, alpha, method])

Вычисляет оценку Тейла-Сена для набора точек (x, y).

sen_seasonal_slopes(x)

Вычисляет сезонные оценки наклона Тейла-Сена и Кендалла.

Статистические тесты#

ttest_1samp(a, popmean[, axis, alternative])

Вычисляет T-тест для среднего значения ОДНОЙ группы оценок.

ttest_onesamp(a, popmean[, axis, alternative])

Вычисляет T-тест для среднего значения ОДНОЙ группы оценок.

ttest_ind(a, b[, axis, equal_var, alternative])

Вычисляет T-тест для средних значений ДВУХ НЕЗАВИСИМЫХ выборок оценок.

ttest_rel(a, b[, axis, alternative])

Вычисляет T-тест для ДВУХ СВЯЗАННЫХ выборок оценок, a и b.

chisquare(f_obs[, f_exp, ddof, axis, ...])

Выполнить критерий хи-квадрат Пирсона.

kstest(data1, data2[, args, alternative, method])

ks_2samp(data1, data2[, alternative, method])

Вычисляет критерий Колмогорова-Смирнова для двух выборок.

ks_1samp(x, cdf[, args, alternative, method])

Вычисляет тест Колмогорова-Смирнова на одной выборке масскированных значений.

ks_twosamp(data1, data2[, alternative, method])

Вычисляет критерий Колмогорова-Смирнова для двух выборок.

mannwhitneyu(x, y[, use_continuity])

Вычисляет статистику Манна-Уитни

rankdata(data[, axis, use_missing])

Возвращает ранг (также известный как порядковая статистика) каждой точки данных вдоль заданной оси.

kruskal(*args)

Вычислить H-критерий Краскела-Уоллиса для независимых выборок

kruskalwallis(*args)

Вычислить H-критерий Краскела-Уоллиса для независимых выборок

friedmanchisquare(*args)

Критерий Фридмана — непараметрический однофакторный дисперсионный анализ с повторными измерениями.

brunnermunzel(x, y[, alternative, distribution])

Выполнить тест Бруннера-Мунзеля на выборках x и y.

skewtest(a[, axis, alternative])

Проверяет, отличается ли асимметрия от нормального распределения.

kurtosistest(a[, axis, alternative])

Проверяет, имеет ли набор данных нормальный эксцесс

normaltest(a[, axis])

Проверяет, отличается ли выборка от нормального распределения.

Преобразования#

obrientransform(*args)

Вычисляет преобразование входных данных (любое количество столбцов).

trim(a[, limits, inclusive, relative, axis])

Обрезает массив, маскируя данные за пределами заданных границ.

trima(a[, limits, inclusive])

Обрезает массив, маскируя данные за пределами заданных границ.

trimmed_stde(a[, limits, inclusive, axis])

Возвращает стандартную ошибку усечённого среднего вдоль заданной оси.

trimr(a[, limits, inclusive, axis])

Обрезает массив, маскируя некоторую долю данных на каждом конце.

trimtail(data[, proportiontocut, tail, ...])

Обрезает данные, маскируя значения с одного конца.

trimboth(data[, proportiontocut, inclusive, ...])

Обрезает наименьшие и наибольшие значения данных.

winsorize(a[, limits, inclusive, inplace, ...])

Возвращает уинсоризованную версию входного массива.

zmap(scores, compare[, axis, ddof, nan_policy])

Вычислить относительные z-оценки.

zscore(a[, axis, ddof, nan_policy])

Вычислить z-оценку.

Другие#

argstoarray(*args)

Создаёт двумерный массив из группы последовательностей.

count_tied_groups(x[, use_missing])

Подсчитывает количество связанных значений.

msign(x)

Возвращает знак x или 0, если x замаскирован.

compare_medians_ms(group_1, group_2[, axis])

Сравнивает медианы двух независимых групп вдоль заданной оси.

median_cihs(data[, alpha, axis])

Вычисляет доверительный интервал уровня alpha для медианы данных.

mjci(data[, prob, axis])

Разработка SciPy в основном ведётся на GitHub; этот раздел описывает ожидаемый способ работы с проблемами, запросами на включение и управления основной

mquantiles_cimj(data[, prob, alpha, axis])

Вычисляет доверительный интервал уровня alpha для выбранных квантилей данных с использованием оценок Марица-Джарретта.

rsh(data[, points])

Вычисляет сдвинутые гистограммы Розенблатта для каждой точки данных.