scipy.stats.contingency.

odds_ratio#

scipy.stats.contingency.odds_ratio(таблица, *, kind='условный')[источник]#

Вычислите отношение шансов для таблицы сопряженности 2x2.

Параметры:
таблицаarray_like из целых чисел

Таблица сопряжённости 2x2. Элементы должны быть неотрицательными целыми числами.

kindstr, optional

Какой тип отношения шансов вычислять: либо выборочное отношение шансов (kind='sample') или условное отношение шансов (kind='conditional'). По умолчанию 'conditional'.

Возвращает:
результатOddsRatioResult экземпляр

Возвращаемый объект имеет два вычисленных атрибута:

статистикаfloat
  • Если kind является 'sample', это выборочная (или безусловная) оценка, заданная table[0, 0]*table[1, 1]/(table[0, 1]*table[1, 0]).

  • Если kind является 'conditional', это условная оценка максимального правдоподобия для отношения шансов. Это параметр нецентральности нецентрального гипергеометрического распределения Фишера с теми же гипергеометрическими параметрами, что и таблица и чьё среднее значение равно table[0, 0].

Объект имеет метод confidence_interval которая вычисляет доверительный интервал отношения шансов.

Примечания

Условное отношение шансов обсуждалось Фишером (см. «Пример 1» в [1]). Тексты, охватывающие отношение шансов, включают [2] и [3].

Добавлено в версии 1.10.0.

Ссылки

[1]

Р. А. Фишер (1935), Логика индуктивного вывода, Журнал Королевского статистического общества, Том 98, № 1, стр. 39-82.

[2]

Breslow NE, Day NE (1980). Statistical methods in cancer research. Volume I - The analysis of case-control studies. IARC Sci Publ. (32):5-338. PMID: 7216345. (См. раздел 4.2.)

[3]

H. Sahai и A. Khurshid (1996), Statistics in Epidemiology: Methods, Techniques, and Applications, CRC Press LLC, Boca Raton, Florida.

Примеры

В эпидемиологии индивидуумы классифицируются как «подверженные» или «не подверженные» некоторому фактору или лечению. Если изучается возникновение какого-либо заболевания, те, у кого есть заболевание, часто классифицируются как «случаи», а те, у кого его нет — как «не случаи». Подсчёт встречаемости этих классов даёт таблицу сопряжённости:

            exposed    unexposed
cases          a           b
noncases       c           d

Выборочное отношение шансов может быть записано как (a/c) / (b/d). a/c может интерпретироваться как шансы возникновения случая в экспонированной группе, и b/d как шансы возникновения случая в неэкспонированной группе. Выборочное отношение шансов — это отношение этих шансов. Если отношение шансов больше 1, это предполагает положительную связь между экспозицией и случаем.

Перестановка строк или столбцов таблицы сопряжённости инвертирует отношение шансов, поэтому важно понимать значение меток, присвоенных строкам и столбцам таблицы при интерпретации отношения шансов.

Рассмотрим гипотетический пример, где предполагается, что воздействие определенного химического вещества связано с повышенной частотой определенного заболевания. Предположим, у нас есть следующая таблица для выборки из 410 человек:

        exposed unexposed
cases        7       15
noncases    58      472

Вопрос, который мы задаем: «Связано ли воздействие химического вещества с повышенным риском заболевания?»

Вычислить отношение шансов:

>>> from scipy.stats.contingency import odds_ratio
>>> res = odds_ratio([[7, 15], [58, 472]])
>>> res.statistic
3.7836687705553493

Для этой выборки шансы заболеть для тех, кто подвергался воздействию химиката, почти в 3,8 раза выше, чем для тех, кто не подвергался.

Мы можем вычислить 95% доверительный интервал для отношения шансов:

>>> res.confidence_interval(confidence_level=0.95)
ConfidenceInterval(low=1.2514829132266785, high=10.363493716701269)

95% доверительный интервал для условного отношения шансов составляет приблизительно (1.25, 10.4).

Для более подробного примера см. Отношение шансов для таблицы сопряженности.