rand_score#
- sklearn.metrics.rand_score(labels_true, labels_pred)[источник]#
Индекс Рэнда.
Индекс Рэнда вычисляет меру сходства между двумя кластеризациями, рассматривая все пары образцов и подсчитывая пары, которые назначены в одинаковые или разные кластеры в предсказанной и истинной кластеризациях [1] [2].
Сырая оценка RI [3] равен:
RI = (number of agreeing pairs) / (number of pairs)
Подробнее в Руководство пользователя.
- Параметры:
- labels_truearray-like формы (n_samples,), dtype=integral
Истинные метки классов, используемые в качестве эталона.
- labels_predarray-like формы (n_samples,), dtype=integral
Метки кластеров для оценки.
- Возвращает:
- RIfloat
Оценка сходства между 0.0 и 1.0 включительно, где 1.0 означает идеальное совпадение.
Смотрите также
adjusted_rand_scoreСкорректированный индекс Рэнда.
adjusted_mutual_info_scoreAdjusted Mutual Information.
Ссылки
Примеры
Идеально совпадающие разметки имеют оценку 1, даже
>>> from sklearn.metrics.cluster import rand_score >>> rand_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
Разметки, которые относят всех членов классов к одним и тем же кластерам, являются полными, но не всегда чистыми, поэтому штрафуются:
>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1]) 0.83
Примеры галереи#
Коррекция на случайность в оценке производительности кластеризации