Статистические функции для маскированных массивов (`scipy.stats.mstats`)#

Этот модуль содержит большое количество статистических функций, которые можно использовать с замаскированными массивами.

Большинство этих функций аналогичны функциям в scipy.stats но могут иметь небольшие различия в API или используемом алгоритме. Поскольку это относительно новый пакет, некоторые изменения в API всё ещё возможны.

Сводная статистика#

`describe`(a[, axis, ddof, bias])	Вычисляет несколько описательных статистик переданного массива.
`gmean`(a[, axis, dtype, weights, nan_policy, ...])	Вычисляет взвешенное среднее геометрическое вдоль указанной оси.
`hmean`(a[, axis, dtype, weights, nan_policy, ...])	Вычислить взвешенное среднее гармоническое вдоль указанной оси.
`kurtosis`(a[, axis, fisher, bias])	Вычисляет эксцесс (Фишера или Пирсона) набора данных.
`mode`(a[, axis])	Возвращает массив модального (наиболее частого) значения в переданном массиве.
`mquantiles`(a[, prob, alphap, betap, axis, limit])	Вычисляет эмпирические квантили для массива данных.
`hdmedian`(data[, axis, var])	Возвращает оценку медианы Харрелла-Дэвиса вдоль заданной оси.
`hdquantiles`(data[, prob, axis, var])	Вычисляет оценки квантилей методом Харрелла-Дэвиса.
`hdquantiles_sd`(data[, prob, axis])	Стандартная ошибка оценок квантилей Харрелла-Дэвиса методом джекнайфа.
`idealfourths`(data[, axis])	Возвращает оценку нижнего и верхнего квартилей.
`plotting_positions`(data[, alpha, beta])	Возвращает позиции для построения графиков (или эмпирические процентильные точки) для данных.
`meppf`(data[, alpha, beta])	Возвращает позиции для построения графиков (или эмпирические процентильные точки) для данных.
`moment`(a[, moment, axis])	Вычисляет n-й момент относительно среднего для выборки.
`skew`(a[, axis, bias])	Вычисляет асимметрию набора данных.
`tmean`(a[, limits, inclusive, axis])	Вычислить усечённое среднее.
`tvar`(a[, limits, inclusive, axis, ddof])	Вычислить усеченную дисперсию
`tmin`(a[, lowerlimit, axis, inclusive])	Вычислить усечённый минимум
`tmax`(a[, upperlimit, axis, inclusive])	Вычислить усечённый максимум
`tsem`(a[, limits, inclusive, axis, ddof])	Вычислить усеченную стандартную ошибку среднего.
`variation`(a[, axis, ddof])	Вычислить коэффициент вариации.
`find_repeats`(arr)	Найти повторы в arr и вернуть кортеж (repeats, repeat_count).
`sem`(a[, axis, ddof])	Вычисляет стандартную ошибку среднего входного массива.
`trimmed_mean`(a[, limits, inclusive, ...])	Возвращает усечённое среднее данных вдоль заданной оси.
`trimmed_mean_ci`(data[, limits, inclusive, ...])	Выбранный доверительный интервал усеченного среднего вдоль заданной оси.
`trimmed_std`(a[, limits, inclusive, ...])	Возвращает усечённое стандартное отклонение данных вдоль заданной оси.
`trimmed_var`(a[, limits, inclusive, ...])	Возвращает усечённую дисперсию данных вдоль заданной оси.

Частотная статистика#

scoreatpercentile(data, per[, limit, ...])

Вычислить оценку в заданном процентиле 'per' последовательности a.

Функции корреляции#

`f_oneway`(*args)	Выполняет односторонний дисперсионный анализ (ANOVA), возвращая F-значение и вероятность для любого количества групп.
`pearsonr`(x, y)	Коэффициент корреляции Пирсона и p-значение для проверки отсутствия корреляции.
`spearmanr`(x[, y, use_ties, axis, ...])	Вычисляет коэффициент корреляции Спирмена и p-значение для проверки на отсутствие корреляции.
`pointbiserialr`(x, y)	Вычисляет коэффициент точечно-бисериальной корреляции и его p-значение.
`kendalltau`(x, y[, use_ties, use_missing, ...])	Вычисляет коэффициент ранговой корреляции Кендалла tau для двух переменных x и y.
`kendalltau_seasonal`(x)	Вычисляет многомерный ранговый коэффициент корреляции Кендалла tau для сезонных данных.
`linregress`(x[, y])	Вычисление линейной регрессии методом наименьших квадратов для двух наборов измерений.
`siegelslopes`(y[, x, method])	Вычисляет оценку Сигеля для набора точек (x, y).
`theilslopes`(y[, x, alpha, method])	Вычисляет оценку Тейла-Сена для набора точек (x, y).
`sen_seasonal_slopes`(x)	Вычисляет сезонные оценки наклона Тейла-Сена и Кендалла.

Статистические тесты#

`ttest_1samp`(a, popmean[, axis, alternative])	Вычисляет T-тест для среднего значения ОДНОЙ группы оценок.
`ttest_onesamp`(a, popmean[, axis, alternative])	Вычисляет T-тест для среднего значения ОДНОЙ группы оценок.
`ttest_ind`(a, b[, axis, equal_var, alternative])	Вычисляет T-тест для средних значений ДВУХ НЕЗАВИСИМЫХ выборок оценок.
`ttest_rel`(a, b[, axis, alternative])	Вычисляет T-тест для ДВУХ СВЯЗАННЫХ выборок оценок, a и b.
`chisquare`(f_obs[, f_exp, ddof, axis, ...])	Выполнить критерий хи-квадрат Пирсона.
`kstest`(data1, data2[, args, alternative, method])
`ks_2samp`(data1, data2[, alternative, method])	Вычисляет критерий Колмогорова-Смирнова для двух выборок.
`ks_1samp`(x, cdf[, args, alternative, method])	Вычисляет тест Колмогорова-Смирнова на одной выборке масскированных значений.
`ks_twosamp`(data1, data2[, alternative, method])	Вычисляет критерий Колмогорова-Смирнова для двух выборок.
`mannwhitneyu`(x, y[, use_continuity])	Вычисляет статистику Манна-Уитни
`rankdata`(data[, axis, use_missing])	Возвращает ранг (также известный как порядковая статистика) каждой точки данных вдоль заданной оси.
`kruskal`(*args)	Вычислить H-критерий Краскела-Уоллиса для независимых выборок
`kruskalwallis`(*args)	Вычислить H-критерий Краскела-Уоллиса для независимых выборок
`friedmanchisquare`(*args)	Критерий Фридмана — непараметрический однофакторный дисперсионный анализ с повторными измерениями.
`brunnermunzel`(x, y[, alternative, distribution])	Выполнить тест Бруннера-Мунзеля на выборках x и y.
`skewtest`(a[, axis, alternative])	Проверяет, отличается ли асимметрия от нормального распределения.
`kurtosistest`(a[, axis, alternative])	Проверяет, имеет ли набор данных нормальный эксцесс
`normaltest`(a[, axis])	Проверяет, отличается ли выборка от нормального распределения.

Преобразования#

`obrientransform`(*args)	Вычисляет преобразование входных данных (любое количество столбцов).
`trim`(a[, limits, inclusive, relative, axis])	Обрезает массив, маскируя данные за пределами заданных границ.
`trima`(a[, limits, inclusive])	Обрезает массив, маскируя данные за пределами заданных границ.
`trimmed_stde`(a[, limits, inclusive, axis])	Возвращает стандартную ошибку усечённого среднего вдоль заданной оси.
`trimr`(a[, limits, inclusive, axis])	Обрезает массив, маскируя некоторую долю данных на каждом конце.
`trimtail`(data[, proportiontocut, tail, ...])	Обрезает данные, маскируя значения с одного конца.
`trimboth`(data[, proportiontocut, inclusive, ...])	Обрезает наименьшие и наибольшие значения данных.
`winsorize`(a[, limits, inclusive, inplace, ...])	Возвращает уинсоризованную версию входного массива.
`zmap`(scores, compare[, axis, ddof, nan_policy])	Вычислить относительные z-оценки.
`zscore`(a[, axis, ddof, nan_policy])	Вычислить z-оценку.

Другие#

`argstoarray`(*args)	Создаёт двумерный массив из группы последовательностей.
`count_tied_groups`(x[, use_missing])	Подсчитывает количество связанных значений.
`msign`(x)	Возвращает знак x или 0, если x замаскирован.
`compare_medians_ms`(group_1, group_2[, axis])	Сравнивает медианы двух независимых групп вдоль заданной оси.
`median_cihs`(data[, alpha, axis])	Вычисляет доверительный интервал уровня alpha для медианы данных.
`mjci`(data[, prob, axis])	Разработка SciPy в основном ведётся на GitHub; этот раздел описывает ожидаемый способ работы с проблемами, запросами на включение и управления основной
`mquantiles_cimj`(data[, prob, alpha, axis])	Вычисляет доверительный интервал уровня alpha для выбранных квантилей данных с использованием оценок Марица-Джарретта.
`rsh`(data[, points])	Вычисляет сдвинутые гистограммы Розенблатта для каждой точки данных.