Примечание

Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.

Калибровка вероятностей для классификации на 3 класса#

Этот пример иллюстрирует, как сигмоида калибровка изменяет предсказанные вероятности для задачи классификации с 3 классами. Проиллюстрирован стандартный 2-симплекс, где три угла соответствуют трём классам. Стрелки указывают от векторов вероятностей, предсказанных некалиброванным классификатором, к векторам вероятностей, предсказанным тем же классификатором после сигмоидной калибровки на валидационной выборке. Цвета указывают истинный класс экземпляра (красный: класс 1, зелёный: класс 2, синий: класс 3).

Данные#

Ниже мы генерируем набор данных для классификации с 2000 образцами, 2 признаками и 3 целевыми классами. Затем мы разделяем данные следующим образом:

обучение: 600 образцов (для обучения классификатора)
валидация: 400 образцов (для калибровки предсказанных вероятностей)
тест: 1000 образцов

Обратите внимание, что мы также создаем X_train_valid и y_train_valid, который включает как обучающую, так и валидационную подвыборки. Используется, когда нужно только обучить классификатор без калибровки предсказанных вероятностей.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

import numpy as np

from sklearn.datasets import make_blobs

np.random.seed(0)

X, y = make_blobs(
    n_samples=2000, n_features=2, centers=3, random_state=42, cluster_std=5.0
)
X_train, y_train = X[:600], y[:600]
X_valid, y_valid = X[600:1000], y[600:1000]
X_train_valid, y_train_valid = X[:1000], y[:1000]
X_test, y_test = X[1000:], y[1000:]

Обучение и калибровка#

Сначала мы обучим RandomForestClassifier с 25 базовыми оценщиками (деревьями) на объединенных обучающих и валидационных данных (1000 образцов). Это некалиброванный классификатор.

from sklearn.ensemble import RandomForestClassifier

clf = RandomForestClassifier(n_estimators=25)
clf.fit(X_train_valid, y_train_valid)

RandomForestClassifier(n_estimators=25)

В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту.
На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.

Для обучения калиброванного классификатора мы начинаем с того же RandomForestClassifier но обучить его используя только подмножество обучающих данных (600 образцов), затем откалибровать, с method='sigmoid', используя допустимое подмножество данных (400 образцов) в двухэтапном процессе.

from sklearn.calibration import CalibratedClassifierCV
from sklearn.frozen import FrozenEstimator

clf = RandomForestClassifier(n_estimators=25)
clf.fit(X_train, y_train)
cal_clf = CalibratedClassifierCV(FrozenEstimator(clf), method="sigmoid")
cal_clf.fit(X_valid, y_valid)

CalibratedClassifierCV(estimator=FrozenEstimator(estimator=RandomForestClassifier(n_estimators=25)))

В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту.
На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.

Сравнить вероятности#

Ниже мы строим 2-симплекс со стрелками, показывающими изменение предсказанных вероятностей тестовых выборок.

import matplotlib.pyplot as plt

plt.figure(figsize=(10, 10))
colors = ["r", "g", "b"]

clf_probs = clf.predict_proba(X_test)
cal_clf_probs = cal_clf.predict_proba(X_test)
# Plot arrows
for i in range(clf_probs.shape[0]):
    plt.arrow(
        clf_probs[i, 0],
        clf_probs[i, 1],
        cal_clf_probs[i, 0] - clf_probs[i, 0],
        cal_clf_probs[i, 1] - clf_probs[i, 1],
        color=colors[y_test[i]],
        head_width=1e-2,
    )

# Plot perfect predictions, at each vertex
plt.plot([1.0], [0.0], "ro", ms=20, label="Class 1")
plt.plot([0.0], [1.0], "go", ms=20, label="Class 2")
plt.plot([0.0], [0.0], "bo", ms=20, label="Class 3")

# Plot boundaries of unit simplex
plt.plot([0.0, 1.0, 0.0, 0.0], [0.0, 0.0, 1.0, 0.0], "k", label="Simplex")

# Annotate points 6 points around the simplex, and mid point inside simplex
plt.annotate(
    r"($\frac{1}{3}$, $\frac{1}{3}$, $\frac{1}{3}$)",
    xy=(1.0 / 3, 1.0 / 3),
    xytext=(1.0 / 3, 0.23),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.plot([1.0 / 3], [1.0 / 3], "ko", ms=5)
plt.annotate(
    r"($\frac{1}{2}$, $0$, $\frac{1}{2}$)",
    xy=(0.5, 0.0),
    xytext=(0.5, 0.1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($0$, $\frac{1}{2}$, $\frac{1}{2}$)",
    xy=(0.0, 0.5),
    xytext=(0.1, 0.5),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($\frac{1}{2}$, $\frac{1}{2}$, $0$)",
    xy=(0.5, 0.5),
    xytext=(0.6, 0.6),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($0$, $0$, $1$)",
    xy=(0, 0),
    xytext=(0.1, 0.1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($1$, $0$, $0$)",
    xy=(1, 0),
    xytext=(1, 0.1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($0$, $1$, $0$)",
    xy=(0, 1),
    xytext=(0.1, 1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
# Add grid
plt.grid(False)
for x in [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0]:
    plt.plot([0, x], [x, 0], "k", alpha=0.2)
    plt.plot([0, 0 + (1 - x) / 2], [x, x + (1 - x) / 2], "k", alpha=0.2)
    plt.plot([x, x + (1 - x) / 2], [0, 0 + (1 - x) / 2], "k", alpha=0.2)

plt.title("Change of predicted probabilities on test samples after sigmoid calibration")
plt.xlabel("Probability class 1")
plt.ylabel("Probability class 2")
plt.xlim(-0.05, 1.05)
plt.ylim(-0.05, 1.05)
_ = plt.legend(loc="best")

Change of predicted probabilities on test samples after sigmoid calibration

На рисунке выше каждая вершина симплекса представляет идеально предсказанный класс (например, 1, 0, 0). Средняя точка внутри симплекса представляет предсказание трех классов с равной вероятностью (т.е., 1/3, 1/3, 1/3). Каждая стрелка начинается от некалиброванных вероятностей и заканчивается на калиброванной вероятности. Цвет стрелки представляет истинный класс этого тестового образца.

Некорректированный классификатор излишне уверен в своих предсказаниях и несёт большие логарифмические потери. Калиброванный классификатор имеет более низкую логарифмические потери из-за двух факторов. Во-первых, обратите внимание на рисунок выше, что стрелки обычно указывают от краёв симплекса, где вероятность одного класса равна 0. Во-вторых, большая часть стрелок указывает на истинный класс, например, зелёные стрелки (образцы, где истинный класс — 'зелёный') обычно указывают на зелёную вершину. Это приводит к меньшему количеству излишне уверенных предсказанных вероятностей, равных 0, и одновременно увеличению предсказанных вероятностей правильного класса. Таким образом, калиброванный классификатор даёт более точные предсказанные вероятности, которые приводят к меньшей логарифмические потери

Мы можем показать это объективно, сравнив логарифмические потери некалиброванных и калиброванных классификаторов на предсказаниях 1000 тестовых образцов. Обратите внимание, что альтернативой могло бы быть увеличение количества базовых оценщиков (деревьев) в RandomForestClassifier что привело бы к аналогичному снижению логарифмические потери.

from sklearn.metrics import log_loss

loss = log_loss(y_test, clf_probs)
cal_loss = log_loss(y_test, cal_clf_probs)

print("Log-loss of:")
print(f" - uncalibrated classifier: {loss:.3f}")
print(f" - calibrated classifier: {cal_loss:.3f}")

Log-loss of:
 - uncalibrated classifier: 1.327
 - calibrated classifier: 0.549

Мы также можем оценить калибровку с помощью оценки Брайера для вероятностных предсказаний (ниже — лучше, возможный диапазон [0, 2]):

from sklearn.metrics import brier_score_loss

loss = brier_score_loss(y_test, clf_probs)
cal_loss = brier_score_loss(y_test, cal_clf_probs)

print("Brier score of")
print(f" - uncalibrated classifier: {loss:.3f}")
print(f" - calibrated classifier: {cal_loss:.3f}")

Brier score of
 - uncalibrated classifier: 0.308
 - calibrated classifier: 0.310

Согласно оценке Брайера, калиброванный классификатор не лучше исходной модели.

Наконец, мы генерируем сетку возможных некалиброванных вероятностей над 2-симплексом, вычисляем соответствующие калиброванные вероятности и строим стрелки для каждой. Стрелки окрашены в соответствии с наибольшей некалиброванной вероятностью. Это иллюстрирует изученную карту калибровки:

plt.figure(figsize=(10, 10))
# Generate grid of probability values
p1d = np.linspace(0, 1, 20)
p0, p1 = np.meshgrid(p1d, p1d)
p2 = 1 - p0 - p1
p = np.c_[p0.ravel(), p1.ravel(), p2.ravel()]
p = p[p[:, 2] >= 0]

# Use the three class-wise calibrators to compute calibrated probabilities
calibrated_classifier = cal_clf.calibrated_classifiers_[0]
prediction = np.vstack(
    [
        calibrator.predict(this_p)
        for calibrator, this_p in zip(calibrated_classifier.calibrators, p.T)
    ]
).T

# Re-normalize the calibrated predictions to make sure they stay inside the
# simplex. This same renormalization step is performed internally by the
# predict method of CalibratedClassifierCV on multiclass problems.
prediction /= prediction.sum(axis=1)[:, None]

# Plot changes in predicted probabilities induced by the calibrators
for i in range(prediction.shape[0]):
    plt.arrow(
        p[i, 0],
        p[i, 1],
        prediction[i, 0] - p[i, 0],
        prediction[i, 1] - p[i, 1],
        head_width=1e-2,
        color=colors[np.argmax(p[i])],
    )

# Plot the boundaries of the unit simplex
plt.plot([0.0, 1.0, 0.0, 0.0], [0.0, 0.0, 1.0, 0.0], "k", label="Simplex")

plt.grid(False)
for x in [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0]:
    plt.plot([0, x], [x, 0], "k", alpha=0.2)
    plt.plot([0, 0 + (1 - x) / 2], [x, x + (1 - x) / 2], "k", alpha=0.2)
    plt.plot([x, x + (1 - x) / 2], [0, 0 + (1 - x) / 2], "k", alpha=0.2)

plt.title("Learned sigmoid calibration map")
plt.xlabel("Probability class 1")
plt.ylabel("Probability class 2")
plt.xlim(-0.05, 1.05)
plt.ylim(-0.05, 1.05)

plt.show()

Можно заметить, что в среднем калибратор отталкивает высокоуверенные предсказания от границ симплекса, одновременно приближая неуверенные предсказания к одному из трех мод, по одной для каждого класса. Также можно заметить, что отображение несимметрично. Более того, некоторые стрелки, кажется, пересекают границы назначения классов, что не обязательно ожидается от карты калибровки, так как это означает, что некоторые предсказанные классы изменятся после калибрации.

В целом, стратегия многоклассовой калибровки «Один против остальных», реализованная в CalibratedClassifierCV не следует слепо доверять.

Общее время выполнения скрипта: (0 минут 1.240 секунд)

Связанные примеры

Калибровка вероятностей классификаторов

Сравнение калибровки классификаторов

Кривые калибровки вероятности

Примеры использования FrozenEstimator

Галерея, созданная Sphinx-Gallery

	n_estimators n_estimators: int, default=100 Количество деревьев в лесу. .. versionchanged:: 0.22 Значение по умолчанию для ``n_estimators`` изменилось с 10 на 100 в 0.22.	25
	критерий критерий: {"gini", "entropy", "log_loss"}, по умолчанию="gini" Функция для измерения качества разделения. Поддерживаемые критерии: "gini" для примеси Джини и "log_loss" и "entropy" оба для Информационный выигрыш Шеннона, см. :ref:`tree_mathematical_formulation`. Примечание: Этот параметр специфичен для дерева.	'gini'
	max_depth max_depth: int, default=None Максимальная глубина дерева. Если None, то узлы расширяются до тех пор, пока все листья чисты или пока все листья содержат менее min_samples_split выборок.	None
	min_samples_split min_samples_split: int или float, по умолчанию=2 Минимальное количество образцов, необходимое для разделения внутреннего узла: - Если int, то рассматривать `min_samples_split` как минимальное количество. - Если float, то `min_samples_split` является дробью и `ceil(min_samples_split * n_samples)` являются минимальными количество образцов для каждого разбиения. .. versionchanged:: 0.18 Добавлены дробные значения.	2
	min_samples_leaf min_samples_leaf: int или float, default=1 Минимальное количество образцов, требуемое для узла листа. Точка разделения на любой глубине будет рассматриваться только если она оставляет хотя бы не менее ``min_samples_leaf`` обучающих выборок в каждой из левой и правые ветви. Это может сгладить модель, особенно в регрессии. - Если int, то рассматривайте `min_samples_leaf` как минимальное количество. - Если float, то `min_samples_leaf` является долей и `ceil(min_samples_leaf * n_samples)` являются минимальными количество выборок для каждого узла. .. versionchanged:: 0.18 Добавлены дробные значения.	1
	min_weight_fraction_leaf min_weight_fraction_leaf: float, по умолчанию=0.0 Минимальная взвешенная доля от общей суммы весов (всех входных образцов), требуемых для нахождения в листовом узле. Образцы имеют равный вес, когда sample_weight не предоставлен.	0.0
	max_features max_features: {"sqrt", "log2", None}, int или float, по умолчанию="sqrt" Количество признаков, которые следует учитывать при поиске наилучшего разделения: - Если int, то рассматривать `max_features` признаков на каждом разбиении. - Если float, то `max_features` является дробью и На каждом шаге рассматриваются `max(1, int(max_features * n_features_in_))` признаков разделение. - Если "sqrt", то `max_features=sqrt(n_features)`. - Если "log2", то `max_features=log2(n_features)`. - Если None, то `max_features=n_features`. .. versionchanged:: 1.1 Зависшие pull request'ы Примечание: поиск разделения не останавливается, пока хотя бы один найдено допустимое разделение выборок узла, даже если это требует эффективно проверять более чем ``max_features`` признаков.	'sqrt'
	max_leaf_nodes max_leaf_nodes: int, по умолчанию=None Выращивайте деревья с ``max_leaf_nodes`` в порядке лучшего-первого. Лучшие узлы определяются как относительное снижение нечистоты. Если None, то неограниченное количество листовых узлов.	None
	min_impurity_decrease min_impurity_decrease: float, default=0.0 Узел будет разделен, если это разделение вызывает уменьшение неоднородности больше или равно этому значению. Уравнение взвешенного уменьшения примесей выглядит следующим образом:: N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity) где ``N`` — общее количество образцов, ``N_t`` — количество образцов в текущем узле, ``N_t_L`` - количество образцов в левый дочерний узел, и ``N_t_R`` — количество образцов в правом дочернем узле. ``N``, ``N_t``, ``N_t_R`` и ``N_t_L`` все относятся к взвешенной сумме, если передан ``sample_weight``. .. versionadded:: 0.19	0.0
	bootstrap bootstrap: bool, default=True Используются ли бутстрап-выборки при построении деревьев. Если False, весь набор данных используется для построения каждого дерева.	True
	oob_score oob_score: bool или callable, default=False Использовать ли выборки out-of-bag для оценки обобщающей способности. По умолчанию используется :func:`~sklearn.metrics.accuracy_score`. Предоставьте вызываемый объект с сигнатурой `metric(y_true, y_pred)` для использования пользовательская метрика. Доступно только если `bootstrap=True`. Для иллюстрации оценки ошибки вне пакета (OOB) см. пример :ref:`sphx_glr_auto_examples_ensemble_plot_ensemble_oob.py`.	False
	n_jobs n_jobs: int, default=None Количество параллельно выполняемых задач. :meth:`fit`, :meth:`predict`, :meth:`decision_path` и :meth:`apply` все параллелизованы по деревьев. ``None`` означает 1, если не в :obj:`joblib.parallel_backend` контекст. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации.	None
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Управляет как случайностью бутстрэппинга выборок, используемых при построении деревьев (если ``bootstrap=True``) и выборке признаки для рассмотрения при поиске наилучшего разделения в каждом узле (если ``max_features < n_features``). См. :term:`Глоссарий ` для деталей.	None
	verbose verbose: int, по умолчанию=0 Управляет подробностью вывода при обучении и предсказании.	0
	warm_start warm_start: bool, default=False Когда установлено в ``True``, повторно использовать решение предыдущего вызова fit и добавьте больше оценщиков в ансамбль, в противном случае просто обучите весь новый лес. См. :term:`Глоссарий ` и :ref:`tree_ensemble_warm_start` для деталей.	False
	class_weight class_weight: {"balanced", "balanced_subsample"}, dict или list of dicts, default=None Веса, связанные с классами, в форме ``{class_label: weight}``. Если не задано, предполагается, что все классы имеют вес один. Для для многомерных задач, список словарей может быть предоставлен в том же порядок, как столбцы y. Обратите внимание, что для многомерного вывода (включая многометочный) веса должны быть определяется для каждого класса каждого столбца в собственном словаре. Например, для четырехклассовой многометочной классификации веса должны быть [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] вместо [{1:1}, {2:5}, {3:1}, {4:1}]. Режим "balanced" использует значения y для автоматической настройки веса, обратно пропорциональные частотам классов во входных данных как ``n_samples / (n_classes * np.bincount(y))`` Режим "balanced_subsample" такой же, как "balanced", за исключением того, что веса вычисляются на основе бутстрап-выборки для каждого дерева выращено. Для многомерного выхода веса каждого столбца y будут умножены. Обратите внимание, что эти веса будут умножены на sample_weight (переданный через метод fit), если указан sample_weight.	None
	ccp_alpha ccp_alpha: неотрицательное число с плавающей точкой, по умолчанию=0.0 Параметр сложности, используемый для минимальной стоимостно-сложностной обрезки. поддерево с наибольшей стоимостью сложности, которое меньше чем Будет выбран параметр ``ccp_alpha``. По умолчанию обрезка не выполняется. См. :ref:`minimal_cost_complexity_pruning` для подробностей. См. :ref:`sphx_glr_auto_examples_tree_plot_cost_complexity_pruning.py` для примера такой обрезки. .. versionadded:: 0.22	0.0
	max_samples max_samples: int или float, default=None Если bootstrap равен True, количество выборок для извлечения из X для обучения каждого базового оценщика. - Если None (по умолчанию), то выбирается `X.shape[0]` образцов. - Если int, то извлекается `max_samples` выборок. - Если float, то берётся `max(round(n_samples * max_samples), 1)` образцов. Таким образом, `max_samples` должен быть в интервале `(0.0, 1.0]`. .. versionadded:: 0.22	None
	monotonic_cst monotonic_cst: array-like из int формы (n_features), по умолчанию=None Указывает ограничение монотонности, применяемое к каждому признаку. - 1: монотонное увеличение - 0: без ограничений - -1: монотонное убывание Если monotonic_cst равен None, ограничения не применяются. Ограничения монотонности не поддерживаются для: - многоклассовые классификации (т.е. когда `n_classes > 2`), - многовариантные классификации (т.е. когда `n_outputs_ > 1`), - классификации, обученные на данных с пропущенными значениями. Ограничения выполняются для вероятности положительного класса. Подробнее в :ref:`Руководстве пользователя `. .. versionadded:: 1.4	None

	estimator estimator: экземпляр оценщика, по умолчанию=None Классификатор, выходные данные которого необходимо откалибровать для обеспечения более точные выходы `predict_proba`. Классификатор по умолчанию — a :class:`~sklearn.svm.LinearSVC`. .. versionadded:: 1.2	FrozenEstimat...stimators=25))
	метод method: {'sigmoid', 'isotonic', 'temperature'}, default='sigmoid' Метод, используемый для калибровки. Может быть: - 'sigmoid', что соответствует методу Платта (т.е. бинарная логистическая модель регрессии). - 'isotonic', что является непараметрическим подходом. - 'temperature', температурное масштабирование. Сигмоидные и изотонические методы калибровки изначально поддерживают только бинарную классификаторы и расширяются до многоклассовой классификации с использованием One-vs-Rest (OvR) стратегию с последующей ренормализацией, т.е. корректировкой вероятностей после калибровка, чтобы гарантировать, что они суммируются до 1. В отличие от этого, температурное масштабирование естественным образом поддерживает многоклассовую калибровку, поскольку применение `softmax(classifier_logits/T)` со значением `T` (температура) который оптимизирует логарифмическую потерю. Для очень некалиброванных классификаторов на очень несбалансированных наборах данных, сигмоида калибровка может быть предпочтительнее, поскольку она подгоняет дополнительный свободный член параметр. Это помогает соответствующим образом смещать границы решений, когда калибруемый классификатор смещён в сторону большинства классов. Изотоническая калибровка не рекомендуется, когда количество калибровочных выборок слишком низко ``(≪1000)``, так как это может привести к переобучению. .. versionchanged:: 1.8 Добавлена опция 'temperature'.	'sigmoid'
	cv cv: int, генератор перекрестной проверки или итерируемый объект, по умолчанию=None Определяет стратегию разделения для кросс-валидации. Возможные значения для cv: - None, чтобы использовать стандартную 5-кратную перекрёстную проверку, - целое число, чтобы указать количество фолдов. - :term:`CV splitter`, - Итерируемый объект, возвращающий (обучающая, тестовая) разбиения в виде массивов индексов. Для целочисленных/None входных данных, если ``y`` является бинарным или многоклассовым, :class:`~sklearn.model_selection.StratifiedKFold` используется. Если ``y`` ни бинарная, ни многоклассовая, :class:`~sklearn.model_selection.KFold` используется. См. :ref:`Руководство пользователя ` для различных стратегии перекрестной проверки, которые можно использовать здесь. .. versionchanged:: 0.22 Значение по умолчанию ``cv``, если None, изменено с 3-кратной на 5-кратную перекрестную проверку.	None
	n_jobs n_jobs: int, default=None Количество параллельно выполняемых задач. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. Клоны базовых оценщиков обучаются параллельно при перекрестной проверке итераций. См. :term:`Глоссарий ` для получения дополнительной информации. .. versionadded:: 0.24	None
	ансамбль ensemble: bool, или "auto", по умолчанию="auto" Определяет, как калибратор обучается. "auto" будет использовать `False`, если `estimator` является :class:`~sklearn.frozen.FrozenEstimator`, и `True` в противном случае. Если `True`, `estimator` обучается с использованием обучающих данных, и откалиброван с использованием тестовых данных для каждого сгиба `cv`. Финальный оценщик является ансамблем из `n_cv` пар обученных классификаторов и калибраторов, где `n_cv` — количество фолдов перекрестной проверки. Выходные данные — это средние предсказанные вероятности всех пар. Если `False`, `cv` используется для вычисления несмещенных предсказаний через :func:`~sklearn.model_selection.cross_val_predict`, которые затем используется для калибровки. Во время предсказания используется классификатор `estimator`, обученный на всех данных. Обратите внимание, что этот метод также внутренне реализован в :mod:`sklearn.svm` оценки с параметром `probabilities=True`. .. versionadded:: 0.24 .. versionchanged:: 1.6 добавлена опция `"auto"` и является значением по умолчанию.	'auto'

	n_estimators n_estimators: int, default=100 Количество деревьев в лесу. .. versionchanged:: 0.22 Значение по умолчанию для ``n_estimators`` изменилось с 10 на 100 в 0.22.	25
	критерий критерий: {"gini", "entropy", "log_loss"}, по умолчанию="gini" Функция для измерения качества разделения. Поддерживаемые критерии: "gini" для примеси Джини и "log_loss" и "entropy" оба для Информационный выигрыш Шеннона, см. :ref:`tree_mathematical_formulation`. Примечание: Этот параметр специфичен для дерева.	'gini'
	max_depth max_depth: int, default=None Максимальная глубина дерева. Если None, то узлы расширяются до тех пор, пока все листья чисты или пока все листья содержат менее min_samples_split выборок.	None
	min_samples_split min_samples_split: int или float, по умолчанию=2 Минимальное количество образцов, необходимое для разделения внутреннего узла: - Если int, то рассматривать `min_samples_split` как минимальное количество. - Если float, то `min_samples_split` является дробью и `ceil(min_samples_split * n_samples)` являются минимальными количество образцов для каждого разбиения. .. versionchanged:: 0.18 Добавлены дробные значения.	2
	min_samples_leaf min_samples_leaf: int или float, default=1 Минимальное количество образцов, требуемое для узла листа. Точка разделения на любой глубине будет рассматриваться только если она оставляет хотя бы не менее ``min_samples_leaf`` обучающих выборок в каждой из левой и правые ветви. Это может сгладить модель, особенно в регрессии. - Если int, то рассматривайте `min_samples_leaf` как минимальное количество. - Если float, то `min_samples_leaf` является долей и `ceil(min_samples_leaf * n_samples)` являются минимальными количество выборок для каждого узла. .. versionchanged:: 0.18 Добавлены дробные значения.	1
	min_weight_fraction_leaf min_weight_fraction_leaf: float, по умолчанию=0.0 Минимальная взвешенная доля от общей суммы весов (всех входных образцов), требуемых для нахождения в листовом узле. Образцы имеют равный вес, когда sample_weight не предоставлен.	0.0
	max_features max_features: {"sqrt", "log2", None}, int или float, по умолчанию="sqrt" Количество признаков, которые следует учитывать при поиске наилучшего разделения: - Если int, то рассматривать `max_features` признаков на каждом разбиении. - Если float, то `max_features` является дробью и На каждом шаге рассматриваются `max(1, int(max_features * n_features_in_))` признаков разделение. - Если "sqrt", то `max_features=sqrt(n_features)`. - Если "log2", то `max_features=log2(n_features)`. - Если None, то `max_features=n_features`. .. versionchanged:: 1.1 Зависшие pull request'ы Примечание: поиск разделения не останавливается, пока хотя бы один найдено допустимое разделение выборок узла, даже если это требует эффективно проверять более чем ``max_features`` признаков.	'sqrt'
	max_leaf_nodes max_leaf_nodes: int, по умолчанию=None Выращивайте деревья с ``max_leaf_nodes`` в порядке лучшего-первого. Лучшие узлы определяются как относительное снижение нечистоты. Если None, то неограниченное количество листовых узлов.	None
	min_impurity_decrease min_impurity_decrease: float, default=0.0 Узел будет разделен, если это разделение вызывает уменьшение неоднородности больше или равно этому значению. Уравнение взвешенного уменьшения примесей выглядит следующим образом:: N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity) где ``N`` — общее количество образцов, ``N_t`` — количество образцов в текущем узле, ``N_t_L`` - количество образцов в левый дочерний узел, и ``N_t_R`` — количество образцов в правом дочернем узле. ``N``, ``N_t``, ``N_t_R`` и ``N_t_L`` все относятся к взвешенной сумме, если передан ``sample_weight``. .. versionadded:: 0.19	0.0
	bootstrap bootstrap: bool, default=True Используются ли бутстрап-выборки при построении деревьев. Если False, весь набор данных используется для построения каждого дерева.	True
	oob_score oob_score: bool или callable, default=False Использовать ли выборки out-of-bag для оценки обобщающей способности. По умолчанию используется :func:`~sklearn.metrics.accuracy_score`. Предоставьте вызываемый объект с сигнатурой `metric(y_true, y_pred)` для использования пользовательская метрика. Доступно только если `bootstrap=True`. Для иллюстрации оценки ошибки вне пакета (OOB) см. пример :ref:`sphx_glr_auto_examples_ensemble_plot_ensemble_oob.py`.	False
	n_jobs n_jobs: int, default=None Количество параллельно выполняемых задач. :meth:`fit`, :meth:`predict`, :meth:`decision_path` и :meth:`apply` все параллелизованы по деревьев. ``None`` означает 1, если не в :obj:`joblib.parallel_backend` контекст. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации.	None
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Управляет как случайностью бутстрэппинга выборок, используемых при построении деревьев (если ``bootstrap=True``) и выборке признаки для рассмотрения при поиске наилучшего разделения в каждом узле (если ``max_features < n_features``). См. :term:`Глоссарий ` для деталей.	None
	verbose verbose: int, по умолчанию=0 Управляет подробностью вывода при обучении и предсказании.	0
	warm_start warm_start: bool, default=False Когда установлено в ``True``, повторно использовать решение предыдущего вызова fit и добавьте больше оценщиков в ансамбль, в противном случае просто обучите весь новый лес. См. :term:`Глоссарий ` и :ref:`tree_ensemble_warm_start` для деталей.	False
	class_weight class_weight: {"balanced", "balanced_subsample"}, dict или list of dicts, default=None Веса, связанные с классами, в форме ``{class_label: weight}``. Если не задано, предполагается, что все классы имеют вес один. Для для многомерных задач, список словарей может быть предоставлен в том же порядок, как столбцы y. Обратите внимание, что для многомерного вывода (включая многометочный) веса должны быть определяется для каждого класса каждого столбца в собственном словаре. Например, для четырехклассовой многометочной классификации веса должны быть [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] вместо [{1:1}, {2:5}, {3:1}, {4:1}]. Режим "balanced" использует значения y для автоматической настройки веса, обратно пропорциональные частотам классов во входных данных как ``n_samples / (n_classes * np.bincount(y))`` Режим "balanced_subsample" такой же, как "balanced", за исключением того, что веса вычисляются на основе бутстрап-выборки для каждого дерева выращено. Для многомерного выхода веса каждого столбца y будут умножены. Обратите внимание, что эти веса будут умножены на sample_weight (переданный через метод fit), если указан sample_weight.	None
	ccp_alpha ccp_alpha: неотрицательное число с плавающей точкой, по умолчанию=0.0 Параметр сложности, используемый для минимальной стоимостно-сложностной обрезки. поддерево с наибольшей стоимостью сложности, которое меньше чем Будет выбран параметр ``ccp_alpha``. По умолчанию обрезка не выполняется. См. :ref:`minimal_cost_complexity_pruning` для подробностей. См. :ref:`sphx_glr_auto_examples_tree_plot_cost_complexity_pruning.py` для примера такой обрезки. .. versionadded:: 0.22	0.0
	max_samples max_samples: int или float, default=None Если bootstrap равен True, количество выборок для извлечения из X для обучения каждого базового оценщика. - Если None (по умолчанию), то выбирается `X.shape[0]` образцов. - Если int, то извлекается `max_samples` выборок. - Если float, то берётся `max(round(n_samples * max_samples), 1)` образцов. Таким образом, `max_samples` должен быть в интервале `(0.0, 1.0]`. .. versionadded:: 0.22	None
	monotonic_cst monotonic_cst: array-like из int формы (n_features), по умолчанию=None Указывает ограничение монотонности, применяемое к каждому признаку. - 1: монотонное увеличение - 0: без ограничений - -1: монотонное убывание Если monotonic_cst равен None, ограничения не применяются. Ограничения монотонности не поддерживаются для: - многоклассовые классификации (т.е. когда `n_classes > 2`), - многовариантные классификации (т.е. когда `n_outputs_ > 1`), - классификации, обученные на данных с пропущенными значениями. Ограничения выполняются для вероятности положительного класса. Подробнее в :ref:`Руководстве пользователя `. .. versionadded:: 1.4	None

Калибровка вероятностей для классификации на 3 класса#

Данные#

Обучение и калибровка#

Сравнить вероятности#

Эта страница