в подпространство меньшей размерности так, чтобы ковариация между#

sklearn.metrics.cluster.в подпространство меньшей размерности так, чтобы ковариация между(labels_true, labels_pred)[источник]#

Матрица парных несоответствий, возникающая из двух кластеризаций.

Матрица парной путаницы \(C\) вычисляет матрицу сходства 2 на 2 между двумя кластеризациями, рассматривая все пары выборок и подсчитывая пары, которые назначены в один и тот же или разные кластеры при истинной и предсказанной кластеризациях [1].

Рассматривая пару выборок, которые сгруппированы вместе как положительная пара, тогда, как в бинарной классификации, количество истинных отрицаний равно \(C_{00}\), ложноотрицательные значения это \(C_{10}\), истинные положительные результаты — это \(C_{11}\) и ложные срабатывания - это \(C_{01}\).

Подробнее в Руководство пользователя.

Параметры:
labels_truearray-like формы (n_samples,), dtype=integral

Истинные метки классов, используемые в качестве эталона.

labels_predarray-like формы (n_samples,), dtype=integral

Метки кластеров для оценки.

Возвращает:
Cndarray формы (2, 2), dtype=np.int64

Матрица сопряженности.

Смотрите также

sklearn.metrics.rand_score

Оценка Рэнда.

sklearn.metrics.adjusted_rand_score

Скорректированный индекс Рэнда.

sklearn.metrics.adjusted_mutual_info_score

Adjusted Mutual Information.

Ссылки

Примеры

Идеально совпадающие метки имеют все ненулевые элементы на диагонали независимо от фактических значений меток:

>>> from sklearn.metrics.cluster import pair_confusion_matrix
>>> pair_confusion_matrix([0, 0, 1, 1], [1, 1, 0, 0])
array([[8, 0],
       [0, 4]]...

Разметки, которые назначают всех членов классов одним и тем же кластерам, являются полными, но могут быть не всегда чистыми, поэтому штрафуются, и имеют некоторые ненулевые записи вне диагонали:

>>> pair_confusion_matrix([0, 0, 1, 2], [0, 0, 1, 1])
array([[8, 2],
       [0, 2]]...

Обратите внимание, что матрица не симметрична.