Тест хи-квадрат на независимость переменных в таблице сопряженности#
В [1], исследовалось использование аспирина для предотвращения сердечно-сосудистых событий у женщин и мужчин. Исследование примечательно тем, что заключило:
…аспириновая терапия снизила риск совокупности сердечно-сосудистых событий благодаря своему эффекту снижения риска ишемического инсульта у женщин […]
В статье перечислены исследования различных сердечно-сосудистых событий. Давайте сосредоточимся на ишемическом инсульте у женщин.
В следующей таблице представлены результаты эксперимента, в котором участники регулярно принимали аспирин или плацебо в течение нескольких лет. Зафиксированы случаи ишемического инсульта:
Аспирин |
Контроль/Плацебо |
|
|---|---|---|
Ишемический инсульт |
176 |
230 |
Без обводки |
21035 |
21018 |
Есть ли доказательства того, что аспирин снижает риск ишемического инсульта? Мы начинаем с формулирования нулевой гипотезы \(H_0\):
Эффект аспирина эквивалентен эффекту плацебо.
Оценим правдоподобность этой гипотезы с помощью
chi-square test с
наблюдаемыми таблица сопряженности
как наш вход.
import numpy as np
from scipy.stats import chi2_contingency
table = np.array([[176, 230], [21035, 21018]])
res = chi2_contingency(table)
res.statistic
np.float64(6.892569132546561)
res.pvalue
np.float64(0.008655478161175739)
Используя уровень значимости 5%, мы отвергли бы нулевую гипотезу в пользу альтернативной гипотезы: «эффект аспирина не эквивалентен эффекту плацебо». Потому что scipy.stats.contingency.chi2_contingency
выполняет двусторонний тест, альтернативная гипотеза не указывает
направление эффекта. Мы можем использовать scipy.stats.contingency.odds_ratio
для поддержки вывода о том, что аспирин уменьшает риск ишемического инсульта.