Тест хи-квадрат на независимость переменных в таблице сопряженности#

В [1], исследовалось использование аспирина для предотвращения сердечно-сосудистых событий у женщин и мужчин. Исследование примечательно тем, что заключило:

…аспириновая терапия снизила риск совокупности сердечно-сосудистых событий благодаря своему эффекту снижения риска ишемического инсульта у женщин […]

В статье перечислены исследования различных сердечно-сосудистых событий. Давайте сосредоточимся на ишемическом инсульте у женщин.

В следующей таблице представлены результаты эксперимента, в котором участники регулярно принимали аспирин или плацебо в течение нескольких лет. Зафиксированы случаи ишемического инсульта:

Аспирин

Контроль/Плацебо

Ишемический инсульт

176

230

Без обводки

21035

21018

Есть ли доказательства того, что аспирин снижает риск ишемического инсульта? Мы начинаем с формулирования нулевой гипотезы \(H_0\):

Эффект аспирина эквивалентен эффекту плацебо.

Оценим правдоподобность этой гипотезы с помощью chi-square test с наблюдаемыми таблица сопряженности как наш вход.

import numpy as np
from scipy.stats import chi2_contingency
table = np.array([[176, 230], [21035, 21018]])
res = chi2_contingency(table)
res.statistic
np.float64(6.892569132546561)
res.pvalue
np.float64(0.008655478161175739)

Используя уровень значимости 5%, мы отвергли бы нулевую гипотезу в пользу альтернативной гипотезы: «эффект аспирина не эквивалентен эффекту плацебо». Потому что scipy.stats.contingency.chi2_contingency выполняет двусторонний тест, альтернативная гипотеза не указывает направление эффекта. Мы можем использовать scipy.stats.contingency.odds_ratio для поддержки вывода о том, что аспирин уменьшает риск ишемического инсульта.

Ссылки#