scipy.stats.

boschloo_exact#

scipy.stats.boschloo_exact(таблица, альтернатива='two-sided', n=32)[источник]#

Выполнить точный тест Бошлоо для таблицы сопряженности 2x2.

Параметры:
таблицаarray_like из целых чисел

Таблица сопряженности 2x2. Элементы должны быть неотрицательными целыми числами.

альтернатива{‘two-sided’, ‘less’, ‘greater’}, необязательный

Определяет нулевую и альтернативную гипотезы. По умолчанию 'two-sided'. Пожалуйста, смотрите объяснения в разделе Notes ниже.

nint, необязательный

Количество точек выборки, используемых при построении метода выборки. Обратите внимание, что этот аргумент будет автоматически преобразован в следующую более высокую степень 2, поскольку scipy.stats.qmc.Sobol используется для выбора точек выборки. По умолчанию 32. Должно быть положительным. В большинстве случаев 32 точек достаточно для достижения хорошей точности. Большее количество точек приводит к снижению производительности.

Возвращает:
berBoschlooExactResult

Объект результата со следующими атрибутами.

статистикаfloat

Статистика, используемая в тесте Бошлоо; то есть p-значение из точного теста Фишера.

p-значениеfloat

P-значение, вероятность получения распределения, по крайней мере, столь же экстремального, как фактически наблюдаемое, при условии, что нулевая гипотеза верна.

Смотрите также

chi2_contingency

Критерий хи-квадрат независимости переменных в таблице сопряженности.

fisher_exact

Точный тест Фишера для таблицы сопряжённости 2x2.

barnard_exact

Точный тест Барнарда, который является более мощной альтернативой точному тесту Фишера для таблиц сопряжённости 2x2.

Примечания

Тест Бошло — это точный тест, используемый при анализе таблиц сопряжённости. Он исследует связь двух категориальных переменных и является равномерно более мощной альтернативой точному тесту Фишера для таблиц сопряжённости 2x2.

Точный тест Босхлоо использует p-значение точного теста Фишера как статистику, а p-значение Босхлоо — это вероятность наблюдения такого экстремального значения этой статистики при нулевой гипотезе.

Давайте определим \(X_0\) матрица 2x2, представляющая наблюдаемую выборку, где каждый столбец хранит биномиальный эксперимент, как в примере ниже. Давайте также определим \(p_1, p_2\) теоретические биномиальные вероятности для \(x_{11}\) и \(x_{12}\)При использовании точного теста Бошло можно утверждать три различные альтернативные гипотезы:

  • \(H_0 : p_1=p_2\) против \(H_1 : p_1 < p_2\), с альтернатива = "less"

  • \(H_0 : p_1=p_2\) против \(H_1 : p_1 > p_2\), с альтернатива = “greater”

  • \(H_0 : p_1=p_2\) против \(H_1 : p_1 \neq p_2\), с альтернатива = "two-sided" (по умолчанию)

Существует несколько соглашений для вычисления двустороннего p-значения, когда нулевое распределение асимметрично. Здесь мы применяем соглашение, что p-значение двустороннего теста равно удвоенному минимальному из p-значений односторонних тестов (ограниченному значением 1.0). Обратите внимание, что fisher_exact следует другому соглашению, поэтому для заданного таблица, статистика, сообщаемая boschloo_exact может отличаться от p-значения, сообщаемого fisher_exact когда alternative='two-sided'.

Добавлено в версии 1.7.0.

Ссылки

[1]

R.D. Boschloo. "Повышенный условный уровень значимости для таблицы 2 x 2 при проверке равенства двух вероятностей", Statistica Neerlandica, 24(1), 1970

[2]

“Тест Бошлоо”, Википедия, https://en.wikipedia.org/wiki/Boschloo%27s_test

[3]

Lise M. Saari et al. «Отношение сотрудников и удовлетворенность работой», Human Resource Management, 43(4), 395-407, 2004, DOI:10.1002/hrm.20032.

Примеры

В следующем примере мы рассматриваем статью «Отношение сотрудников и удовлетворённость работой» [3] который сообщает результаты опроса 63 ученых и 117 преподавателей колледжей. Из 63 ученых 31 сказали, что они очень довольны своей работой, тогда как 74 преподавателя колледжа были очень довольны своей работой. Является ли это значимым доказательством того, что преподаватели колледжей более довольны своей работой, чем ученые? Следующая таблица суммирует упомянутые выше данные:

                 college professors   scientists
Very Satisfied   74                     31
Dissatisfied     43                     32

При работе со статистической проверкой гипотез мы обычно используем пороговую вероятность или уровень значимости, на основе которого решаем отвергнуть нулевую гипотезу \(H_0\). Предположим, мы выберем общепринятый уровень значимости 5%.

Наша альтернативная гипотеза состоит в том, что профессора колледжей действительно более удовлетворены своей работой, чем учёные. Поэтому мы ожидаем, \(p_1\) доля очень довольных профессоров колледжа должна быть больше, чем \(p_2\), доля очень удовлетворенных ученых. Таким образом, мы называем boschloo_exact с alternative="greater" опция:

>>> import scipy.stats as stats
>>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater")
>>> res.statistic
0.0483
>>> res.pvalue
0.0355

При нулевой гипотезе, что учёные счастливее в своей работе, чем профессора колледжей, вероятность получения тестовых результатов, по крайней мере, столь же экстремальных, как наблюдаемые данные, составляет приблизительно 3,55%. Поскольку это p-значение меньше выбранного нами уровня значимости, у нас есть доказательства, чтобы отвергнуть \(H_0\) в пользу альтернативной гипотезы.