в подпространство меньшей размерности так, чтобы ковариация между#

sklearn.metrics.cluster.в подпространство меньшей размерности так, чтобы ковариация между(labels_true, labels_pred)[источник]#

Матрица парных несоответствий, возникающая из двух кластеризаций.

Матрица парной путаницы \(C\) вычисляет матрицу сходства 2 на 2 между двумя кластеризациями, рассматривая все пары выборок и подсчитывая пары, которые назначены в один и тот же или разные кластеры при истинной и предсказанной кластеризациях [1].

Рассматривая пару выборок, которые сгруппированы вместе как положительная пара, тогда, как в бинарной классификации, количество истинных отрицаний равно \(C_{00}\), ложноотрицательные значения это \(C_{10}\), истинные положительные результаты — это \(C_{11}\) и ложные срабатывания - это \(C_{01}\).

Подробнее в Руководство пользователя.

Параметры:

labels_truearray-like формы (n_samples,), dtype=integral: Истинные метки классов, используемые в качестве эталона.
labels_predarray-like формы (n_samples,), dtype=integral: Метки кластеров для оценки.

Возвращает:

Cndarray формы (2, 2), dtype=np.int64: Матрица сопряженности.

Смотрите также

sklearn.metrics.rand_score: Оценка Рэнда.
sklearn.metrics.adjusted_rand_score: Скорректированный индекс Рэнда.
sklearn.metrics.adjusted_mutual_info_score: Adjusted Mutual Information.

Ссылки

[1]

Hubert, L., Arabie, P. “Comparing partitions.” Journal of Classification 2, 193–218 (1985).

Примеры

Идеально совпадающие метки имеют все ненулевые элементы на диагонали независимо от фактических значений меток:

>>> from sklearn.metrics.cluster import pair_confusion_matrix
>>> pair_confusion_matrix([0, 0, 1, 1], [1, 1, 0, 0])
array([[8, 0],
       [0, 4]]...

Разметки, которые назначают всех членов классов одним и тем же кластерам, являются полными, но могут быть не всегда чистыми, поэтому штрафуются, и имеют некоторые ненулевые записи вне диагонали:

>>> pair_confusion_matrix([0, 0, 1, 2], [0, 0, 1, 1])
array([[8, 2],
       [0, 2]]...

Обратите внимание, что матрица не симметрична.

в подпространство меньшей размерности так, чтобы ковариация между#

Эта страница