fowlkes_mallows_score#

sklearn.metrics.fowlkes_mallows_score(labels_true, labels_pred, *, разреженный='устаревший')[источник]#

Измеряет сходство двух кластеризаций набора точек.

Добавлено в версии 0.18.

Индекс Фоулкса-Мэллоуза (FMI) определяется как среднее геометрическое точности и полноты:

FMI = TP / sqrt((TP + FP) * (TP + FN))

Где TP это количество Истинно положительный (т.е. количество пар точек, которые принадлежат одному кластеру в обоих labels_true и labels_pred), FP это количество Ложноположительный (т.е. количество пар точек, принадлежащих одному кластеру в labels_pred но не в labels_true) и FN это количество Ложноотрицательный (т.е. количество пар точек, принадлежащих одному кластеру в labels_true но не в labels_pred).

Оценка варьируется от 0 до 1. Высокое значение указывает на хорошее сходство между двумя кластерами.

Подробнее в Руководство пользователя.

Параметры:
labels_truearray-like формы (n_samples,), dtype=int

Кластеризация данных в непересекающиеся подмножества.

labels_predarray-like формы (n_samples,), dtype=int

Кластеризация данных в непересекающиеся подмножества.

разреженныйbool, по умолчанию=False

Вычислить матрицу сопряженности внутри с разреженной матрицей.

Устарело с версии 1.7: The sparse параметр устарел и будет удален в 1.9. Он не имеет эффекта.

Возвращает:
scorefloat

Полученный показатель Fowlkes-Mallows.

Ссылки

Примеры

Идеальные разметки одновременно однородны и полны, следовательно, имеют оценку 1.0:

>>> from sklearn.metrics.cluster import fowlkes_mallows_score
>>> fowlkes_mallows_score([0, 0, 1, 1], [0, 0, 1, 1])
1.0
>>> fowlkes_mallows_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Если элементы классов полностью разделены по разным кластерам, назначение полностью случайно, поэтому FMI равен нулю:

>>> fowlkes_mallows_score([0, 0, 0, 0], [0, 1, 2, 3])
0.0