scipy.stats.

dunnett#

scipy.stats.dunnett(*образцы, управление, альтернатива='two-sided', rng=None, random_state=None)[источник]#

Тест Даннетта: множественные сравнения средних с контрольной группой.

Это реализация исходного одношагового теста Даннетта, как описано в [1].

Параметры:

sample1, sample2, …1D array_like

Измерения выборки для каждой экспериментальной группы.

управление1D array_like

Измерения выборки для контрольной группы.

альтернатива{‘two-sided’, ‘less’, ‘greater’}, необязательный

Определяет альтернативную гипотезу.

Нулевая гипотеза состоит в том, что средние распределений, лежащих в основе выборок и контроля, равны. Доступны следующие альтернативные гипотезы (по умолчанию 'two-sided'):

'two-sided': средние распределений, лежащих в основе выборок и контроля, не равны.
‘less’: средние распределений, лежащих в основе выборок, меньше среднего распределения, лежащего в основе контрольной группы.
‘greater’: средние распределений, лежащих в основе выборок, больше, чем среднее распределения, лежащего в основе контрольной группы.

rngnumpy.random.Generator, опционально

Состояние генератора псевдослучайных чисел. Когда rng равно None, новый numpy.random.Generator создаётся с использованием энтропии из операционной системы. Типы, отличные от numpy.random.Generator передаются в numpy.random.default_rng для создания экземпляра Generator.

Изменено в версии 1.15.0: В рамках SPEC-007 переход от использования numpy.random.RandomState to numpy.random.Generator, этот ключевое слово было изменено с random_state to rng. В течение переходного периода оба ключевых слова будут продолжать работать, хотя можно указать только одно за раз. После переходного периода вызовы функций с использованием random_state ключевое слово будет выдавать предупреждения. После периода устаревания, random_state ключевое слово будет удалено.

Возвращает:

resDunnettResult

Объект, содержащий атрибуты:

статистикаfloat ndarray: Вычисленная статистика теста для каждого сравнения. Элемент с индексом i является статистикой для сравнения между группами i и контроль.
p-значениеfloat ndarray: Вычисленное p-значение теста для каждого сравнения. Элемент с индексом i является p-значением для сравнения между группой i и контроль.

И следующий метод:

confidence_interval(confidence_level=0.95) :: Вычислить разницу в средних значениях групп с контролем ± допуском.

Смотрите также

tukey_hsd: выполняет попарное сравнение средних.
Тест Даннетта: Расширенный пример

Примечания

Как и t-тест для независимых выборок, тест Даннетта [1] используется для получения выводов о средних значениях распределений, из которых были взяты выборки. Однако, когда выполняется несколько t-тестов с фиксированным уровнем значимости, "семейная ошибка" - вероятность ошибочного отклонения нулевой гипотезы хотя бы в одном тесте - превысит уровень значимости. Тест Даннетта предназначен для выполнения множественных сравнений при контроле семейной ошибки.

Тест Даннетта сравнивает средние значения нескольких экспериментальных групп с одной контрольной группой. Тест Тьюки на честно значимые различия — это еще один тест множественных сравнений, который контролирует уровень ошибки для семейства, но tukey_hsd выполняет все попарные сравнения между группами. Когда попарные сравнения между экспериментальными группами не нужны, тест Даннетта предпочтительнее из-за его большей мощности.

Использование этого теста основывается на нескольких предположениях.

Наблюдения независимы внутри и между группами.
Наблюдения внутри каждой группы распределены нормально.
Распределения, из которых взяты выборки, имеют одинаковую конечную дисперсию.

Ссылки

[1] (1,2)

Dunnett, Charles W. (1955) “A Multiple Comparison Procedure for Comparing Several Treatments with a Control.” Journal of the American Statistical Association, 50:272, 1096-1121, DOI:10.1080/01621459.1955.10501294

[2]

Thomson, M. L., & Short, M. D. (1969). Mucociliary function in health, chronic obstructive airway disease, and asbestosis. Journal of applied physiology, 26(5), 535-539. DOI:10.1152/jappl.1969.26.5.535

Примеры

Мы будем использовать данные из [2], Таблица 1. Нулевая гипотеза состоит в том, что средние распределений, лежащих в основе выборок и контроля, равны.

Сначала мы проверяем, что средние распределений, лежащих в основе выборок и контрольной группы, не равны (alternative='two-sided', по умолчанию).

>>> import numpy as np
>>> from scipy.stats import dunnett
>>> samples = [[3.8, 2.7, 4.0, 2.4], [2.8, 3.4, 3.7, 2.2, 2.0]]
>>> control = [2.9, 3.0, 2.5, 2.6, 3.2]
>>> res = dunnett(*samples, control=control)
>>> res.statistic
array([ 0.90874545, -0.05007117])
>>> res.pvalue
array([0.58325114, 0.99819341])

Теперь мы проверяем, что средние распределений, лежащих в основе выборок, больше среднего распределения, лежащего в основе контрольной группы.

>>> res = dunnett(*samples, control=control, alternative='greater')
>>> res.statistic
array([ 0.90874545, -0.05007117])
>>> res.pvalue
array([0.30230596, 0.69115597])

Для более подробного примера см. Тест Даннетта.