scipy.stats.

alexandergovern#

scipy.stats.alexandergovern(*образцы, nan_policy='propagate', ось=0, keepdims=False)[источник]#

Выполняет тест Александра Говерна.

Аппроксимация Александера-Говерна проверяет равенство k независимых средних при неоднородности дисперсии. Тест применяется к выборкам из двух или более групп, возможно, разного размера.

Параметры:

sample1, sample2, …array_like

Измерения выборки для каждой группы. Должно быть как минимум две выборки, и каждая выборка должна содержать как минимум два наблюдения.

nan_policy{‘propagate’, ‘omit’, ‘raise’}

Определяет, как обрабатывать входные значения NaN.

propagate: если NaN присутствует в срезе оси (например, строке), вдоль которой вычисляется статистика, соответствующая запись вывода будет NaN.
omit: NaN будут пропущены при выполнении расчета. Если в срезе оси, вдоль которого вычисляется статистика, остается недостаточно данных, соответствующая запись вывода будет NaN.
raise: если присутствует NaN, то ValueError будет вызвано исключение.

осьint или None, по умолчанию: 0

Если это целое число, ось входных данных, по которой вычисляется статистика. Статистика каждого среза по оси (например, строки) входных данных появится в соответствующем элементе вывода. Если None, вход будет сведён в одномерный массив перед вычислением статистики.

keepdimsbool, по умолчанию: False

Если установлено значение True, оси, которые были сокращены, остаются в результате как размерности с размером один. С этой опцией результат будет корректно транслироваться относительно входного массива.

Возвращает:

resРезультат Александра Говерна

Объект с атрибутами:

статистикаfloat: Вычисленная статистика A теста.
p-значениеfloat: Соответствующее p-значение из распределения хи-квадрат.

Предупреждает:

ConstantInputWarning: Возникает, если входной массив является константным. Статистика не определена в этом случае, поэтому np.nan возвращается.

Смотрите также

f_oneway: однофакторный дисперсионный анализ (ANOVA)

Примечания

Использование этого теста основывается на нескольких предположениях.

Выборки независимы.
Каждая выборка взята из нормально распределённой совокупности.
В отличие от f_oneway, этот тест не предполагает гомоскедастичность, вместо этого ослабляя предположение о равных дисперсиях.

Входные выборки должны быть конечными, одномерными и с размером больше одного.

Начиная с SciPy 1.9, np.matrix входные данные (не рекомендуется для нового кода) преобразуются в np.ndarray перед выполнением вычисления. В этом случае результатом будет скаляр или np.ndarray подходящей формы вместо 2D np.matrix. Аналогично, хотя маскированные элементы маскированных массивов игнорируются, результатом будет скаляр или np.ndarray вместо маскированного массива с mask=False.

Ссылки

[1]

Александр, Ральф А. и Дайан М. Говерн. «Новое и более простое приближение для дисперсионного анализа при неоднородности дисперсии». Журнал образовательной статистики, том 19, № 2, 1994, стр. 91-101. JSTOR, www.jstor.org/stable/1165140. Доступ 12 сентября 2020.

Примеры

>>> from scipy.stats import alexandergovern

Вот некоторые данные о годовой процентной ставке по кредитам на новые автомобили в девяти крупнейших банках четырех американских городов, взятые из набора данных ANOVA Национального института стандартов и технологий.

Мы используем alexandergovern для проверки нулевой гипотезы о том, что все города имеют одинаковое среднее значение APR, против альтернативы, что города не все имеют одинаковое среднее APR. Мы решаем, что для отклонения нулевой гипотезы в пользу альтернативы требуется уровень значимости 5%.

>>> atlanta = [13.75, 13.75, 13.5, 13.5, 13.0, 13.0, 13.0, 12.75, 12.5]
>>> chicago = [14.25, 13.0, 12.75, 12.5, 12.5, 12.4, 12.3, 11.9, 11.9]
>>> houston = [14.0, 14.0, 13.51, 13.5, 13.5, 13.25, 13.0, 12.5, 12.5]
>>> memphis = [15.0, 14.0, 13.75, 13.59, 13.25, 12.97, 12.5, 12.25,
...           11.89]
>>> alexandergovern(atlanta, chicago, houston, memphis)
AlexanderGovernResult(statistic=4.65087071883494,
                      pvalue=0.19922132490385214)

P-значение равно 0.1992, что указывает на почти 20% вероятность наблюдения такого экстремального значения тестовой статистики при нулевой гипотезе. Это превышает 5%, поэтому мы не отвергаем нулевую гипотезу в пользу альтернативной.