contingency_matrix#

sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype= 'numpy.int64'>)[источник]#

Построение матрицы сопряженности, описывающей связь между метками.

Подробнее в Руководство пользователя.

Параметры:
labels_truearray-like формы (n_samples,)

Истинные метки классов, используемые в качестве эталона.

labels_predarray-like формы (n_samples,)

Метки кластеров для оценки.

epsfloat, по умолчанию=None

Если float, это значение добавляется ко всем значениям в матрице сопряженности. Это помогает предотвратить распространение NaN. Если None, ничего не корректируется.

разреженныйbool, по умолчанию=False

Если True, вернуть разреженную матрицу сопряженности CSR. Если eps не является None и sparse является True вызовет ValueError.

Добавлено в версии 0.18.

dtypeчисловой тип, по умолчанию=np.int64

Тип выходных данных. Игнорируется, если eps не является None.

Добавлено в версии 0.24.

Возвращает:
таблица сопряженности{array-like, sparse}, shape=[n_classes_true, n_classes_pred]

Матрица \(C\) такой, что \(C_{i, j}\) это количество образцов в истинном классе \(i\) и в предсказанном классе \(j\). Если eps is None, тип данных этого массива будет целочисленным, если не установлено иное с помощью dtype аргумент. Если eps указан, dtype будет float. Будет sklearn.sparse.csr_matrix if sparse=True.

Примеры

>>> from sklearn.metrics.cluster import contingency_matrix
>>> labels_true = [0, 0, 1, 1, 2, 2]
>>> labels_pred = [1, 0, 2, 1, 0, 2]
>>> contingency_matrix(labels_true, labels_pred)
array([[1, 1, 0],
       [0, 1, 1],
       [1, 0, 1]])