Примечание

Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.

Precision-Recall#

Пример использования метрики Precision-Recall для оценки качества выходных данных классификатора.

Precision-Recall — полезная мера успешности предсказания, когда классы сильно несбалансированы. В информационном поиске precision — это мера доли релевантных элементов среди фактически возвращённых элементов, а recall — мера доли элементов, которые были возвращены, среди всех элементов, которые должны были быть возвращены. «Релевантность» здесь относится к элементам, которые помечены положительно, т.е. true positives и false negatives.

Точность (\(P\)) определяется как количество истинно положительных (\(T_p\)) по количеству истинно положительных плюс количество ложноположительных (\(F_p\)).

\[P = \frac{T_p}{T_p+F_p}\]

Полнота (\(R\)) определяется как количество истинно положительных (\(T_p\)) над числом истинно положительных плюс число ложно отрицательных (\(F_n\)).

\[R = \frac{T_p}{T_p + F_n}\]

Кривая точности-полноты показывает компромисс между точностью и полнотой при различных порогах. Большая площадь под кривой означает как высокую полноту, так и высокую точность. Высокая точность достигается за счет малого количества ложноположительных результатов, а высокая полнота - за счет малого количества ложноотрицательных результатов среди релевантных. Высокие значения обеих метрик показывают, что классификатор возвращает точные результаты (высокая точность), а также возвращает большинство всех релевантных результатов (высокая полнота).

Система с высокой полнотой, но низкой точностью возвращает большинство релевантных элементов, но доля возвращённых результатов, которые неправильно помечены, высока. Система с высокой точностью, но низкой полнотой является противоположностью, возвращая очень мало релевантных элементов, но большинство её предсказанных меток верны при сравнении с фактическими метками. Идеальная система с высокой точностью и высокой полнотой вернёт большинство релевантных элементов, причём большинство результатов будут правильно помечены.

Определение точности (\(\frac{T_p}{T_p + F_p}\)) показывает, что снижение порога классификатора может увеличить знаменатель, увеличивая количество возвращаемых результатов. Если порог был ранее установлен слишком высоко, новые результаты могут быть истинно положительными, что повысит точность. Если предыдущий порог был примерно правильным или слишком низким, дальнейшее снижение порога приведет к ложным срабатываниям, снижая точность.

Полнота определяется как \(\frac{T_p}{T_p+F_n}\), где \(T_p+F_n\) не зависит от порога классификатора. Изменение порога классификатора может изменить только числитель, \(T_p\). Понижение порога классификатора может увеличить полноту, увеличив количество истинно положительных результатов. Также возможно, что понижение порога оставит полноту неизменной, в то время как точность колеблется. Таким образом, точность не обязательно уменьшается с увеличением полноты.

Связь между полнотой и точностью можно наблюдать в ступенчатой области графика - на краях этих ступеней небольшое изменение порога значительно снижает точность, с лишь незначительным увеличением полноты.

Средняя точность (AP) суммирует такой график как взвешенное среднее достигнутых точностей на каждом пороге, с увеличением полноты от предыдущего порога, используемым в качестве веса:

\(\text{AP} = \sum_n (R_n - R_{n-1}) P_n\)

где \(P_n\) и \(R_n\) являются точностью и полнотой на n-м пороге. Пара \((R_k, P_k)\) называется рабочая точка.

AP и площадь под операционной характеристикой по трапециевидному правилу (sklearn.metrics.auc) являются распространенными способами обобщения кривой точности-полноты, которые приводят к разным результатам. Подробнее в Руководство пользователя.

Кривые точности-полноты обычно используются в бинарной классификации для изучения выходных данных классификатора. Чтобы расширить кривую точности-полноты и среднюю точность на многоклассовую или многометочную классификацию, необходимо бинаризировать выход. Можно построить одну кривую для каждой метки, но также можно построить кривую точности-полноты, рассматривая каждый элемент матрицы индикаторов меток как бинарный прогноз (микро-усреднение).

Примечание

Смотрите также sklearn.metrics.average_precision_score,: sklearn.metrics.recall_score, sklearn.metrics.precision_score, sklearn.metrics.f1_score

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

В настройках бинарной классификации#

Набор данных и модель#

Мы будем использовать классификатор Linear SVC для различения двух типов ирисов.

import numpy as np

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

X, y = load_iris(return_X_y=True)

# Add noisy features
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
X = np.concatenate([X, random_state.randn(n_samples, 200 * n_features)], axis=1)

# Limit to the two first classes, and split into training and test
X_train, X_test, y_train, y_test = train_test_split(
    X[y < 2], y[y < 2], test_size=0.5, random_state=random_state
)

Linear SVC ожидает, что каждый признак будет иметь схожий диапазон значений. Поэтому мы сначала масштабируем данные с помощью StandardScaler.

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import LinearSVC

classifier = make_pipeline(StandardScaler(), LinearSVC(random_state=random_state))
classifier.fit(X_train, y_train)

Pipeline(steps=[('standardscaler', StandardScaler()),
                ('linearsvc',
                 LinearSVC(random_state=RandomState(MT19937) at 0x7FE89D36E840))])

В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту.
На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.

Построение кривой Precision-Recall#

Чтобы построить кривую точности-полноты, следует использовать PrecisionRecallDisplay. Действительно, доступны два метода в зависимости от того, были ли уже вычислены предсказания классификатора или нет.

Давайте сначала построим кривую точности-полноты без предсказаний классификатора. Мы используем from_estimator которая вычисляет прогнозы для нас перед построением кривой.

from sklearn.metrics import PrecisionRecallDisplay

display = PrecisionRecallDisplay.from_estimator(
    classifier, X_test, y_test, name="LinearSVC", plot_chance_level=True, despine=True
)
_ = display.ax_.set_title("2-class Precision-Recall curve")

Если у нас уже есть оцененные вероятности или оценки для нашей модели, то мы можем использовать from_predictions.

y_score = classifier.decision_function(X_test)

display = PrecisionRecallDisplay.from_predictions(
    y_test, y_score, name="LinearSVC", plot_chance_level=True, despine=True
)
_ = display.ax_.set_title("2-class Precision-Recall curve")

В многометочных настройках#

Кривая точности-полноты не поддерживает многометочную настройку. Однако, можно решить, как обрабатывать этот случай. Мы покажем такой пример ниже.

Создание многометочных данных, обучение и предсказание#

Мы создаем многометочный набор данных, чтобы проиллюстрировать точность-полноту в многометочных настройках.

from sklearn.preprocessing import label_binarize

# Use label_binarize to be multi-label like settings
Y = label_binarize(y, classes=[0, 1, 2])
n_classes = Y.shape[1]

# Split into training and test
X_train, X_test, Y_train, Y_test = train_test_split(
    X, Y, test_size=0.5, random_state=random_state
)

Мы используем OneVsRestClassifier для многометочного прогнозирования.

from sklearn.multiclass import OneVsRestClassifier

classifier = OneVsRestClassifier(
    make_pipeline(StandardScaler(), LinearSVC(random_state=random_state))
)
classifier.fit(X_train, Y_train)
y_score = classifier.decision_function(X_test)

Средняя точность в многометочных настройках#

from sklearn.metrics import average_precision_score, precision_recall_curve

# For each class
precision = dict()
recall = dict()
average_precision = dict()
for i in range(n_classes):
    precision[i], recall[i], _ = precision_recall_curve(Y_test[:, i], y_score[:, i])
    average_precision[i] = average_precision_score(Y_test[:, i], y_score[:, i])

# A "micro-average": quantifying score on all classes jointly
precision["micro"], recall["micro"], _ = precision_recall_curve(
    Y_test.ravel(), y_score.ravel()
)
average_precision["micro"] = average_precision_score(Y_test, y_score, average="micro")

Построение микроусредненной кривой точности-полноты#

from collections import Counter

display = PrecisionRecallDisplay(
    recall=recall["micro"],
    precision=precision["micro"],
    average_precision=average_precision["micro"],
    prevalence_pos_label=Counter(Y_test.ravel())[1] / Y_test.size,
)
display.plot(plot_chance_level=True, despine=True)
_ = display.ax_.set_title("Micro-averaged over all classes")

Построение кривой Precision-Recall для каждого класса и кривых iso-f1#

from itertools import cycle

import matplotlib.pyplot as plt

# setup plot details
colors = cycle(["navy", "turquoise", "darkorange", "cornflowerblue", "teal"])

_, ax = plt.subplots(figsize=(7, 8))

f_scores = np.linspace(0.2, 0.8, num=4)
lines, labels = [], []
for f_score in f_scores:
    x = np.linspace(0.01, 1)
    y = f_score * x / (2 * x - f_score)
    (l,) = plt.plot(x[y >= 0], y[y >= 0], color="gray", alpha=0.2)
    plt.annotate("f1={0:0.1f}".format(f_score), xy=(0.9, y[45] + 0.02))

display = PrecisionRecallDisplay(
    recall=recall["micro"],
    precision=precision["micro"],
    average_precision=average_precision["micro"],
)
display.plot(ax=ax, name="Micro-average precision-recall", color="gold")

for i, color in zip(range(n_classes), colors):
    display = PrecisionRecallDisplay(
        recall=recall[i],
        precision=precision[i],
        average_precision=average_precision[i],
    )
    display.plot(
        ax=ax, name=f"Precision-recall for class {i}", color=color, despine=True
    )

# add the legend for the iso-f1 curves
handles, labels = display.ax_.get_legend_handles_labels()
handles.extend([l])
labels.extend(["iso-f1 curves"])
# set the legend and the axes
ax.legend(handles=handles, labels=labels, loc="best")
ax.set_title("Extension of Precision-Recall curve to multi-class")

plt.show()

Extension of Precision-Recall curve to multi-class

Общее время выполнения скрипта: (0 минут 0.320 секунд)

Связанные примеры

Пользовательская стратегия повторного обучения для поиска по сетке с кросс-валидацией

Визуализации с объектами Display

Оценка разреженной обратной ковариации

Последующая настройка порога принятия решений для обучения с учетом стоимости

Галерея, созданная Sphinx-Gallery

	шаги steps: список кортежей Список кортежей (имя шага, оценщик), которые должны быть соединены в цепочку последовательный порядок. Для совместимости с API scikit-learn, все шаги должен определять `fit`. Все не последние шаги также должны определять `transform`. См. :ref:`Комбинирование оценщиков ` для получения дополнительной информации.	[('standardscaler', ...), ('linearsvc', ...)]
	transform_input transform_input: list of str, default=None Имена параметров :term:`metadata`, которые должны быть преобразованы конвейер перед передачей его шагу, который его потребляет. Это позволяет преобразовывать некоторые входные аргументы для ``fit`` (кроме ``X``) для преобразования шагами конвейера до шага, который требует их. Требование определяется через :ref:`маршрутизацию метаданных `. Например, это можно использовать для передачи набора валидации через конвейер. Вы можете установить это только если включена маршрутизация метаданных, что вы можно включить, используя ``sklearn.set_config(enable_metadata_routing=True)``. .. versionadded:: 1.6	None
	память memory: строка или объект с интерфейсом joblib.Memory, по умолчанию=None Используется для кэширования обученных трансформеров конвейера. Последний шаг никогда не будет кэшироваться, даже если это трансформер. По умолчанию, никакие кэширование выполняется. Если задана строка, это путь к директория кэширования. Включение кэширования запускает клонирование преобразователей перед обучением. Следовательно, экземпляр трансформатора, переданный в конвейер не может быть проверен напрямую. Используйте атрибут `named_steps` или ``steps`` для проверки оценщиков внутри конвейера. Кэширование трансформеры выгодны, когда подгонка занимает много времени. См. :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` для примера о том, как включить кэширование.	None
	verbose verbose: bool, default=False Если True, затраченное время на обучение каждого шага будет выводиться по мере его выполнения. завершено.	False

	штраф penalty: {'l1', 'l2'}, default='l2' Определяет норму, используемую в штрафе. 'l2' penalty - стандарт, используемый в SVC. 'l1' приводит к ``coef_`` векторы, которые являются разреженными.	'l2'
	потеря loss: {'hinge', 'squared_hinge'}, по умолчанию='squared_hinge' Определяет функцию потерь. 'hinge' — стандартная потеря SVM (используется, например, классом SVC), в то время как 'squared_hinge' является квадрат потерь на шарнире. Комбинация ``penalty='l1'`` и ``loss='hinge'`` не поддерживается.	'squared_hinge'
	dual dual: "auto" или bool, по умолчанию="auto" Выберите алгоритм для решения двойственной или прямой задачи задача оптимизации. Предпочитайте dual=False, когда n_samples > n_features. `dual="auto"` автоматически выберет значение параметра, на основе значений `n_samples`, `n_features`, `loss`, `multi_class` и `penalty`. Если `n_samples` < `n_features` и оптимизатор поддерживает выбранные `loss`, `multi_class` и `penalty`, тогда dual будет установлен в True, иначе он будет установлен в False. .. versionchanged:: 1.3 Опция `"auto"` добавлена в версии 1.3 и будет использоваться по умолчанию в версии 1.5.	'auto'
	tol tol: float, default=1e-4 Допуск для критериев остановки.	0.0001
	C C: float, default=1.0 Параметр регуляризации. Сила регуляризации обратно пропорционально C. Должно быть строго положительным. Для интуитивной визуализации эффектов масштабирования параметр регуляризации C, см. :ref:`sphx_glr_auto_examples_svm_plot_svm_scale_c.py`.	1.0
	multi_class multi_class: {'ovr', 'crammer_singer'}, default='ovr' Определяет стратегию многоклассовой классификации, если `y` содержит более чем два класса. ``"ovr"`` обучает n_classes классификаторов "один против всех", в то время как ``"crammer_singer"`` оптимизирует совместную целевую функцию по всем классам. Хотя `crammer_singer` интересен с теоретической точки зрения поскольку он последователен, он редко используется на практике, так как редко приводит к лучшей точности и требует больше вычислений. Если выбран ``"crammer_singer"``, опции loss, penalty и dual будет проигнорирован.	'ovr'
	fit_intercept fit_intercept: bool, по умолчанию=True Определяет, нужно ли подгонять свободный член. Если установлено в True, вектор признаков расширена для включения свободного члена: `[x_1, ..., x_n, 1]`, где 1 соответствует свободному члену. Если установлено в False, свободный член не будет используется в вычислениях (т.е. ожидается, что данные уже центрированы).	True
	intercept_scaling intercept_scaling: float, по умолчанию=1.0 Когда `fit_intercept` равен True, вектор экземпляра x становится ``[x_1, ..., x_n, intercept_scaling]``, т.е. “синтетический” признак с постоянное значение, равное `intercept_scaling`, добавляется к экземпляру вектор. Свободный член становится intercept_scaling * синтетический признак вес. Обратите внимание, что liblinear внутренне штрафует intercept, обрабатывая его как любой другой термин в векторе признаков. Чтобы уменьшить влияние регуляризации на пересечение, `intercept_scaling` параметр может быть установлен в значение больше 1; чем выше значение `intercept_scaling`, тем меньше влияние регуляризации на него. Затем веса становятся `[w_x_1, ..., w_x_n, w_intercept*intercept_scaling]`, где `w_x_1, ..., w_x_n` представляют веса признаков и вес пересечения масштабируются на `intercept_scaling`. Это масштабирование позволяет члену пересечения иметь различное поведение регуляризации по сравнению с другими признаками.	1
	class_weight class_weight: dict или 'balanced', по умолчанию=None Установить параметр C класса i в ``class_weight[i]C`` для SVC. Если не указано, предполагается, что все классы имеют вычисление градиента с Режим "balanced" использует значения y для автоматической настройки веса, обратно пропорциональные частотам классов во входных данных как ``n_samples / (n_classes np.bincount(y))``.	None
	verbose verbose: int, по умолчанию=0 Включить подробный вывод. Обратите внимание, что эта настройка использует настройка времени выполнения на процесс в liblinear, которая, если включена, может не работать правильно в многопоточном контексте.	0
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Управляет псевдослучайной генерацией чисел для перемешивания данных для двойственный координатный спуск (если ``dual=True``). Когда ``dual=False`` базовая реализация :class:`LinearSVC` не является случайной и ``random_state`` не влияет на результаты. Передайте целое число для воспроизводимого вывода при множественных вызовах функции. См. :term:`Глоссарий `.	RandomState(M...0x7FE89D36E840
	max_iter max_iter: int, по умолчанию=1000 Максимальное количество итераций для выполнения.	1000

	copy copy: bool, default=True Если False, пытается избежать копирования и выполняет масштабирование на месте. Это не гарантирует всегда работать на месте; например, если данные не массив NumPy или разреженная матрица CSR scipy.sparse, копия все еще может быть возвращается.	True
	with_mean with_mean: bool, default=True Если True, центрировать данные перед масштабированием. Это не работает (и вызовет исключение) при попытке на разреженные матрицы, потому что их центрирование требует построения плотной матрица, которая в типичных случаях использования, вероятно, слишком велика для размещения в памяти.	True
	with_std with_std: bool, default=True Если True, масштабировать данные до единичной дисперсии (или, что эквивалентно, единичное стандартное отклонение).	True