odds_ratio#
- scipy.stats.contingency.odds_ratio(таблица, *, kind='условный')[источник]#
Вычислите отношение шансов для таблицы сопряженности 2x2.
- Параметры:
- таблицаarray_like из целых чисел
Таблица сопряжённости 2x2. Элементы должны быть неотрицательными целыми числами.
- kindstr, optional
Какой тип отношения шансов вычислять: либо выборочное отношение шансов (
kind='sample') или условное отношение шансов (kind='conditional'). По умолчанию'conditional'.
- Возвращает:
- результат
OddsRatioResultэкземпляр Возвращаемый объект имеет два вычисленных атрибута:
- статистикаfloat
Если kind является
'sample', это выборочная (или безусловная) оценка, заданнаяtable[0, 0]*table[1, 1]/(table[0, 1]*table[1, 0]).Если kind является
'conditional', это условная оценка максимального правдоподобия для отношения шансов. Это параметр нецентральности нецентрального гипергеометрического распределения Фишера с теми же гипергеометрическими параметрами, что и таблица и чьё среднее значение равноtable[0, 0].
Объект имеет метод confidence_interval которая вычисляет доверительный интервал отношения шансов.
- результат
Смотрите также
scipy.stats.fisher_exactrelative_risk- Отношение шансов для таблицы сопряженности
Расширенный пример
Примечания
Условное отношение шансов обсуждалось Фишером (см. «Пример 1» в [1]). Тексты, охватывающие отношение шансов, включают [2] и [3].
Добавлено в версии 1.10.0.
Ссылки
[1]Р. А. Фишер (1935), Логика индуктивного вывода, Журнал Королевского статистического общества, Том 98, № 1, стр. 39-82.
[2]Breslow NE, Day NE (1980). Statistical methods in cancer research. Volume I - The analysis of case-control studies. IARC Sci Publ. (32):5-338. PMID: 7216345. (См. раздел 4.2.)
[3]H. Sahai и A. Khurshid (1996), Statistics in Epidemiology: Methods, Techniques, and Applications, CRC Press LLC, Boca Raton, Florida.
Примеры
В эпидемиологии индивидуумы классифицируются как «подверженные» или «не подверженные» некоторому фактору или лечению. Если изучается возникновение какого-либо заболевания, те, у кого есть заболевание, часто классифицируются как «случаи», а те, у кого его нет — как «не случаи». Подсчёт встречаемости этих классов даёт таблицу сопряжённости:
exposed unexposed cases a b noncases c d
Выборочное отношение шансов может быть записано как
(a/c) / (b/d).a/cможет интерпретироваться как шансы возникновения случая в экспонированной группе, иb/dкак шансы возникновения случая в неэкспонированной группе. Выборочное отношение шансов — это отношение этих шансов. Если отношение шансов больше 1, это предполагает положительную связь между экспозицией и случаем.Перестановка строк или столбцов таблицы сопряжённости инвертирует отношение шансов, поэтому важно понимать значение меток, присвоенных строкам и столбцам таблицы при интерпретации отношения шансов.
Рассмотрим гипотетический пример, где предполагается, что воздействие определенного химического вещества связано с повышенной частотой определенного заболевания. Предположим, у нас есть следующая таблица для выборки из 410 человек:
exposed unexposed cases 7 15 noncases 58 472
Вопрос, который мы задаем: «Связано ли воздействие химического вещества с повышенным риском заболевания?»
Вычислить отношение шансов:
>>> from scipy.stats.contingency import odds_ratio >>> res = odds_ratio([[7, 15], [58, 472]]) >>> res.statistic 3.7836687705553493
Для этой выборки шансы заболеть для тех, кто подвергался воздействию химиката, почти в 3,8 раза выше, чем для тех, кто не подвергался.
Мы можем вычислить 95% доверительный интервал для отношения шансов:
>>> res.confidence_interval(confidence_level=0.95) ConfidenceInterval(low=1.2514829132266785, high=10.363493716701269)
95% доверительный интервал для условного отношения шансов составляет приблизительно (1.25, 10.4).
Для более подробного примера см. Отношение шансов для таблицы сопряженности.