dunnett#
- scipy.stats.dunnett(*образцы, управление, альтернатива='two-sided', rng=None, random_state=None)[источник]#
Тест Даннетта: множественные сравнения средних с контрольной группой.
Это реализация исходного одношагового теста Даннетта, как описано в [1].
- Параметры:
- sample1, sample2, …1D array_like
Измерения выборки для каждой экспериментальной группы.
- управление1D array_like
Измерения выборки для контрольной группы.
- альтернатива{‘two-sided’, ‘less’, ‘greater’}, необязательный
Определяет альтернативную гипотезу.
Нулевая гипотеза состоит в том, что средние распределений, лежащих в основе выборок и контроля, равны. Доступны следующие альтернативные гипотезы (по умолчанию 'two-sided'):
'two-sided': средние распределений, лежащих в основе выборок и контроля, не равны.
‘less’: средние распределений, лежащих в основе выборок, меньше среднего распределения, лежащего в основе контрольной группы.
‘greater’: средние распределений, лежащих в основе выборок, больше, чем среднее распределения, лежащего в основе контрольной группы.
- rng
numpy.random.Generator, опционально Состояние генератора псевдослучайных чисел. Когда rng равно None, новый
numpy.random.Generatorсоздаётся с использованием энтропии из операционной системы. Типы, отличные отnumpy.random.Generatorпередаются вnumpy.random.default_rngдля создания экземпляраGenerator.Изменено в версии 1.15.0: В рамках SPEC-007 переход от использования
numpy.random.RandomStatetonumpy.random.Generator, этот ключевое слово было изменено с random_state to rng. В течение переходного периода оба ключевых слова будут продолжать работать, хотя можно указать только одно за раз. После переходного периода вызовы функций с использованием random_state ключевое слово будет выдавать предупреждения. После периода устаревания, random_state ключевое слово будет удалено.
- Возвращает:
- res
DunnettResult Объект, содержащий атрибуты:
- статистикаfloat ndarray
Вычисленная статистика теста для каждого сравнения. Элемент с индексом
iявляется статистикой для сравнения между группамиiи контроль.- p-значениеfloat ndarray
Вычисленное p-значение теста для каждого сравнения. Элемент с индексом
iявляется p-значением для сравнения между группойiи контроль.
И следующий метод:
- confidence_interval(confidence_level=0.95) :
Вычислить разницу в средних значениях групп с контролем ± допуском.
- res
Смотрите также
tukey_hsdвыполняет попарное сравнение средних.
- Тест Даннетта
Расширенный пример
Примечания
Как и t-тест для независимых выборок, тест Даннетта [1] используется для получения выводов о средних значениях распределений, из которых были взяты выборки. Однако, когда выполняется несколько t-тестов с фиксированным уровнем значимости, "семейная ошибка" - вероятность ошибочного отклонения нулевой гипотезы хотя бы в одном тесте - превысит уровень значимости. Тест Даннетта предназначен для выполнения множественных сравнений при контроле семейной ошибки.
Тест Даннетта сравнивает средние значения нескольких экспериментальных групп с одной контрольной группой. Тест Тьюки на честно значимые различия — это еще один тест множественных сравнений, который контролирует уровень ошибки для семейства, но
tukey_hsdвыполняет все попарные сравнения между группами. Когда попарные сравнения между экспериментальными группами не нужны, тест Даннетта предпочтительнее из-за его большей мощности.Использование этого теста основывается на нескольких предположениях.
Наблюдения независимы внутри и между группами.
Наблюдения внутри каждой группы распределены нормально.
Распределения, из которых взяты выборки, имеют одинаковую конечную дисперсию.
Ссылки
[1] (1,2)Dunnett, Charles W. (1955) “A Multiple Comparison Procedure for Comparing Several Treatments with a Control.” Journal of the American Statistical Association, 50:272, 1096-1121, DOI:10.1080/01621459.1955.10501294
[2]Thomson, M. L., & Short, M. D. (1969). Mucociliary function in health, chronic obstructive airway disease, and asbestosis. Journal of applied physiology, 26(5), 535-539. DOI:10.1152/jappl.1969.26.5.535
Примеры
Мы будем использовать данные из [2], Таблица 1. Нулевая гипотеза состоит в том, что средние распределений, лежащих в основе выборок и контроля, равны.
Сначала мы проверяем, что средние распределений, лежащих в основе выборок и контрольной группы, не равны (
alternative='two-sided', по умолчанию).>>> import numpy as np >>> from scipy.stats import dunnett >>> samples = [[3.8, 2.7, 4.0, 2.4], [2.8, 3.4, 3.7, 2.2, 2.0]] >>> control = [2.9, 3.0, 2.5, 2.6, 3.2] >>> res = dunnett(*samples, control=control) >>> res.statistic array([ 0.90874545, -0.05007117]) >>> res.pvalue array([0.58325114, 0.99819341])
Теперь мы проверяем, что средние распределений, лежащих в основе выборок, больше среднего распределения, лежащего в основе контрольной группы.
>>> res = dunnett(*samples, control=control, alternative='greater') >>> res.statistic array([ 0.90874545, -0.05007117]) >>> res.pvalue array([0.30230596, 0.69115597])
Для более подробного примера см. Тест Даннетта.