rand_score#

sklearn.metrics.rand_score(labels_true, labels_pred)[источник]#

Индекс Рэнда.

Индекс Рэнда вычисляет меру сходства между двумя кластеризациями, рассматривая все пары образцов и подсчитывая пары, которые назначены в одинаковые или разные кластеры в предсказанной и истинной кластеризациях [1] [2].

Сырая оценка RI [3] равен:

RI = (number of agreeing pairs) / (number of pairs)

Подробнее в Руководство пользователя.

Параметры:
labels_truearray-like формы (n_samples,), dtype=integral

Истинные метки классов, используемые в качестве эталона.

labels_predarray-like формы (n_samples,), dtype=integral

Метки кластеров для оценки.

Возвращает:
RIfloat

Оценка сходства между 0.0 и 1.0 включительно, где 1.0 означает идеальное совпадение.

Смотрите также

adjusted_rand_score

Скорректированный индекс Рэнда.

adjusted_mutual_info_score

Adjusted Mutual Information.

Ссылки

Примеры

Идеально совпадающие разметки имеют оценку 1, даже

>>> from sklearn.metrics.cluster import rand_score
>>> rand_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Разметки, которые относят всех членов классов к одним и тем же кластерам, являются полными, но не всегда чистыми, поэтому штрафуются:

>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1])
0.83