в подпространство меньшей размерности так, чтобы ковариация между#
- sklearn.metrics.cluster.в подпространство меньшей размерности так, чтобы ковариация между(labels_true, labels_pred)[источник]#
Матрица парных несоответствий, возникающая из двух кластеризаций.
Матрица парной путаницы \(C\) вычисляет матрицу сходства 2 на 2 между двумя кластеризациями, рассматривая все пары выборок и подсчитывая пары, которые назначены в один и тот же или разные кластеры при истинной и предсказанной кластеризациях [1].
Рассматривая пару выборок, которые сгруппированы вместе как положительная пара, тогда, как в бинарной классификации, количество истинных отрицаний равно \(C_{00}\), ложноотрицательные значения это \(C_{10}\), истинные положительные результаты — это \(C_{11}\) и ложные срабатывания - это \(C_{01}\).
Подробнее в Руководство пользователя.
- Параметры:
- labels_truearray-like формы (n_samples,), dtype=integral
Истинные метки классов, используемые в качестве эталона.
- labels_predarray-like формы (n_samples,), dtype=integral
Метки кластеров для оценки.
- Возвращает:
- Cndarray формы (2, 2), dtype=np.int64
Матрица сопряженности.
Смотрите также
sklearn.metrics.rand_scoreОценка Рэнда.
sklearn.metrics.adjusted_rand_scoreСкорректированный индекс Рэнда.
sklearn.metrics.adjusted_mutual_info_scoreAdjusted Mutual Information.
Ссылки
Примеры
Идеально совпадающие метки имеют все ненулевые элементы на диагонали независимо от фактических значений меток:
>>> from sklearn.metrics.cluster import pair_confusion_matrix >>> pair_confusion_matrix([0, 0, 1, 1], [1, 1, 0, 0]) array([[8, 0], [0, 4]]...
Разметки, которые назначают всех членов классов одним и тем же кластерам, являются полными, но могут быть не всегда чистыми, поэтому штрафуются, и имеют некоторые ненулевые записи вне диагонали:
>>> pair_confusion_matrix([0, 0, 1, 2], [0, 0, 1, 1]) array([[8, 2], [0, 2]]...
Обратите внимание, что матрица не симметрична.