homogeneity_completeness_v_measure#

sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)[источник]#

Вычислить однородность, полноту и показатель V-Measure за один раз.

Эти метрики основаны на нормализованных мерах условной энтропии кластеризации для оценки с учетом знаний об истинных метках классов (Ground Truth) тех же образцов.

Результат кластеризации удовлетворяет однородности, если все его кластеры содержат только точки данных, которые являются членами одного класса.

Результат кластеризации удовлетворяет полноте, если все точки данных, принадлежащие одному классу, являются элементами одного и того же кластера.

Обе оценки имеют положительные значения от 0.0 до 1.0, причем большие значения являются предпочтительными.

Эти 3 метрики не зависят от абсолютных значений меток: перестановка значений меток классов или кластеров никак не изменит значения оценок.

V-Measure также симметричен: при перестановке labels_true и label_pred даст одинаковый результат. Это не выполняется для однородности и полноты. V-мера идентична normalized_mutual_info_score с использованием метода арифметического усреднения.

Подробнее в Руководство пользователя.

Параметры:
labels_truearray-like формы (n_samples,)

Истинные метки классов, используемые в качестве эталона.

labels_predarray-like формы (n_samples,)

Метки кластеров для оценки.

betafloat, по умолчанию=1.0

Отношение веса, приписываемого homogeneity против completeness. Если beta больше 1, completeness взвешивается более сильно в расчете. Если beta меньше 1, homogeneity взвешивается сильнее.

Возвращает:
гомогенностьfloat

Оценка от 0.0 до 1.0. 1.0 означает идеально однородную маркировку.

полнотаfloat

Оценка от 0.0 до 1.0. 1.0 означает идеально полную маркировку.

v_measurefloat

Среднее гармоническое первых двух.

Смотрите также

homogeneity_score

Метрика однородности кластерной разметки.

completeness_score

Метрика полноты маркировки кластеров.

v_measure_score

V-мера (NMI с опцией среднего арифметического).

Примеры

>>> from sklearn.metrics import homogeneity_completeness_v_measure
>>> y_true, y_pred = [0, 0, 1, 1, 2, 2], [0, 0, 1, 2, 2, 2]
>>> homogeneity_completeness_v_measure(y_true, y_pred)
(0.71, 0.771, 0.74)