fowlkes_mallows_score#
- sklearn.metrics.fowlkes_mallows_score(labels_true, labels_pred, *, разреженный='устаревший')[источник]#
Измеряет сходство двух кластеризаций набора точек.
Добавлено в версии 0.18.
Индекс Фоулкса-Мэллоуза (FMI) определяется как среднее геометрическое точности и полноты:
FMI = TP / sqrt((TP + FP) * (TP + FN))
Где
TPэто количество Истинно положительный (т.е. количество пар точек, которые принадлежат одному кластеру в обоихlabels_trueиlabels_pred),FPэто количество Ложноположительный (т.е. количество пар точек, принадлежащих одному кластеру вlabels_predно не вlabels_true) иFNэто количество Ложноотрицательный (т.е. количество пар точек, принадлежащих одному кластеру вlabels_trueно не вlabels_pred).Оценка варьируется от 0 до 1. Высокое значение указывает на хорошее сходство между двумя кластерами.
Подробнее в Руководство пользователя.
- Параметры:
- labels_truearray-like формы (n_samples,), dtype=int
Кластеризация данных в непересекающиеся подмножества.
- labels_predarray-like формы (n_samples,), dtype=int
Кластеризация данных в непересекающиеся подмножества.
- разреженныйbool, по умолчанию=False
Вычислить матрицу сопряженности внутри с разреженной матрицей.
Устарело с версии 1.7: The
sparseпараметр устарел и будет удален в 1.9. Он не имеет эффекта.
- Возвращает:
- scorefloat
Полученный показатель Fowlkes-Mallows.
Ссылки
Примеры
Идеальные разметки одновременно однородны и полны, следовательно, имеют оценку 1.0:
>>> from sklearn.metrics.cluster import fowlkes_mallows_score >>> fowlkes_mallows_score([0, 0, 1, 1], [0, 0, 1, 1]) 1.0 >>> fowlkes_mallows_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
Если элементы классов полностью разделены по разным кластерам, назначение полностью случайно, поэтому FMI равен нулю:
>>> fowlkes_mallows_score([0, 0, 0, 0], [0, 1, 2, 3]) 0.0