contingency_matrix#
-
sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype=
'numpy.int64'> )[источник]# Построение матрицы сопряженности, описывающей связь между метками.
Подробнее в Руководство пользователя.
- Параметры:
- labels_truearray-like формы (n_samples,)
Истинные метки классов, используемые в качестве эталона.
- labels_predarray-like формы (n_samples,)
Метки кластеров для оценки.
- epsfloat, по умолчанию=None
Если float, это значение добавляется ко всем значениям в матрице сопряженности. Это помогает предотвратить распространение NaN. Если
None, ничего не корректируется.- разреженныйbool, по умолчанию=False
Если
True, вернуть разреженную матрицу сопряженности CSR. Еслиepsне являетсяNoneиsparseявляетсяTrueвызовет ValueError.Добавлено в версии 0.18.
- dtypeчисловой тип, по умолчанию=np.int64
Тип выходных данных. Игнорируется, если
epsне являетсяNone.Добавлено в версии 0.24.
- Возвращает:
- таблица сопряженности{array-like, sparse}, shape=[n_classes_true, n_classes_pred]
Матрица \(C\) такой, что \(C_{i, j}\) это количество образцов в истинном классе \(i\) и в предсказанном классе \(j\). Если
eps is None, тип данных этого массива будет целочисленным, если не установлено иное с помощьюdtypeаргумент. Еслиepsуказан, dtype будет float. Будетsklearn.sparse.csr_matrixifsparse=True.
Примеры
>>> from sklearn.metrics.cluster import contingency_matrix >>> labels_true = [0, 0, 1, 1, 2, 2] >>> labels_pred = [1, 0, 2, 1, 0, 2] >>> contingency_matrix(labels_true, labels_pred) array([[1, 1, 0], [0, 1, 1], [1, 0, 1]])