Примечание

Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.

Визуализация вероятностных предсказаний VotingClassifier#

Постройте предсказанные вероятности классов в игрушечном наборе данных, предсказанные тремя разными классификаторами и усредненные с помощью VotingClassifier.

Сначала инициализируются три линейных классификатора. Два из них - сплайновые модели с членами взаимодействия, один использует постоянную экстраполяцию, а другой - периодическую экстраполяцию. Третий классификатор - это Nystroem с ядром по умолчанию "rbf".

В первой части этого примера эти три классификатора используются для демонстрации мягкого голосования с использованием VotingClassifier со взвешенным средним. Мы устанавливаем weights=[2, 1, 3], что означает, что предсказания модели сплайна с постоянной экстраполяцией взвешиваются в два раза больше, чем предсказания модели периодического сплайна, а предсказания модели Nystroem взвешиваются в три раза больше, чем предсказания периодического сплайна.

Вторая часть демонстрирует, как мягкие прогнозы могут быть преобразованы в жесткие прогнозы.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Сначала мы генерируем зашумленный набор данных XOR, который представляет собой задачу бинарной классификации.

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from matplotlib.colors import ListedColormap

n_samples = 500
rng = np.random.default_rng(0)
feature_names = ["Feature #0", "Feature #1"]
common_scatter_plot_params = dict(
    cmap=ListedColormap(["tab:red", "tab:blue"]),
    edgecolor="white",
    linewidth=1,
)

xor = pd.DataFrame(
    np.random.RandomState(0).uniform(low=-1, high=1, size=(n_samples, 2)),
    columns=feature_names,
)
noise = rng.normal(loc=0, scale=0.1, size=(n_samples, 2))
target_xor = np.logical_xor(
    xor["Feature #0"] + noise[:, 0] > 0, xor["Feature #1"] + noise[:, 1] > 0
)

X = xor[feature_names]
y = target_xor.astype(np.int32)

fig, ax = plt.subplots()
ax.scatter(X["Feature #0"], X["Feature #1"], c=y, **common_scatter_plot_params)
ax.set_title("The XOR dataset")
plt.show()

Из-за присущей нелинейной разделимости набора данных XOR модели на основе деревьев часто предпочтительнее. Однако соответствующая инженерия признаков в сочетании с линейной моделью может дать эффективные результаты, с дополнительным преимуществом получения лучше калиброванных вероятностей для образцов, расположенных в переходных областях, подверженных шуму.

Мы определяем и обучаем модели на всём наборе данных.

from sklearn.ensemble import VotingClassifier
from sklearn.kernel_approximation import Nystroem
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import PolynomialFeatures, SplineTransformer, StandardScaler

clf1 = make_pipeline(
    SplineTransformer(degree=2, n_knots=2),
    PolynomialFeatures(interaction_only=True),
    LogisticRegression(C=10),
)
clf2 = make_pipeline(
    SplineTransformer(
        degree=2,
        n_knots=4,
        extrapolation="periodic",
        include_bias=True,
    ),
    PolynomialFeatures(interaction_only=True),
    LogisticRegression(C=10),
)
clf3 = make_pipeline(
    StandardScaler(),
    Nystroem(gamma=2, random_state=0),
    LogisticRegression(C=10),
)
weights = [2, 1, 3]
eclf = VotingClassifier(
    estimators=[
        ("constant splines model", clf1),
        ("periodic splines model", clf2),
        ("nystroem model", clf3),
    ],
    voting="soft",
    weights=weights,
)

clf1.fit(X, y)
clf2.fit(X, y)
clf3.fit(X, y)
eclf.fit(X, y)

Наконец, мы используем DecisionBoundaryDisplay для построения предсказанных вероятностей. Используя расходящуюся цветовую карту (такую как "RdBu"), мы можем гарантировать, что более темные цвета соответствуют predict_proba близко к 0 или 1, а белый соответствует predict_proba 0.5.

from itertools import product

from sklearn.inspection import DecisionBoundaryDisplay

fig, axarr = plt.subplots(2, 2, sharex="col", sharey="row", figsize=(10, 8))
for idx, clf, title in zip(
    product([0, 1], [0, 1]),
    [clf1, clf2, clf3, eclf],
    [
        "Splines with\nconstant extrapolation",
        "Splines with\nperiodic extrapolation",
        "RBF Nystroem",
        "Soft Voting",
    ],
):
    disp = DecisionBoundaryDisplay.from_estimator(
        clf,
        X,
        response_method="predict_proba",
        plot_method="pcolormesh",
        cmap="RdBu",
        alpha=0.8,
        ax=axarr[idx[0], idx[1]],
    )
    axarr[idx[0], idx[1]].scatter(
        X["Feature #0"],
        X["Feature #1"],
        c=y,
        **common_scatter_plot_params,
    )
    axarr[idx[0], idx[1]].set_title(title)
    fig.colorbar(disp.surface_, ax=axarr[idx[0], idx[1]], label="Probability estimate")

plt.show()

Splines with constant extrapolation, Splines with periodic extrapolation, RBF Nystroem, Soft Voting

В качестве проверки мы можем убедиться для заданной выборки, что вероятность, предсказанная VotingClassifier действительно является взвешенным средним мягких предсказаний отдельных классификаторов.

В случае бинарной классификации, как в данном примере, predict_proba массивы содержат вероятность принадлежности к классу 0 (здесь красным) как первую запись, и вероятность принадлежности к классу 1 (здесь синим) как вторую запись.

test_sample = pd.DataFrame({"Feature #0": [-0.5], "Feature #1": [1.5]})
predict_probas = [est.predict_proba(test_sample).ravel() for est in eclf.estimators_]
for (est_name, _), est_probas in zip(eclf.estimators, predict_probas):
    print(f"{est_name}'s predicted probabilities: {est_probas}")

constant splines model's predicted probabilities: [0.11272662 0.88727338]
periodic splines model's predicted probabilities: [0.99726573 0.00273427]
nystroem model's predicted probabilities: [0.3185838 0.6814162]

print(
    "Weighted average of soft-predictions: "
    f"{np.dot(weights, predict_probas) / np.sum(weights)}"
)

Weighted average of soft-predictions: [0.3630784 0.6369216]

Мы видим, что ручной расчет предсказанных вероятностей выше эквивалентен тому, что производится VotingClassifier:

print(
    "Predicted probability of VotingClassifier: "
    f"{eclf.predict_proba(test_sample).ravel()}"
)

Predicted probability of VotingClassifier: [0.3630784 0.6369216]

Чтобы преобразовать мягкие предсказания в жесткие при наличии весов, вычисляются взвешенные средние предсказанные вероятности для каждого класса. Затем итоговая метка класса выводится из метки класса с наибольшей средней вероятностью, что соответствует порогу по умолчанию на predict_proba=0.5 в случае бинарной классификации.

print(
    "Class with the highest weighted average of soft-predictions: "
    f"{np.argmax(np.dot(weights, predict_probas) / np.sum(weights))}"
)

Class with the highest weighted average of soft-predictions: 1

Это эквивалентно выводу VotingClassifier’s predict method:

print(f"Predicted class of VotingClassifier: {eclf.predict(test_sample).ravel()}")

Predicted class of VotingClassifier: [1]

Мягкие голоса могут быть пороговыми, как и для любого другого вероятностного классификатора. Это позволяет установить пороговую вероятность, при которой будет предсказан положительный класс, вместо простого выбора класса с наибольшей предсказанной вероятностью.

from sklearn.model_selection import FixedThresholdClassifier

eclf_other_threshold = FixedThresholdClassifier(
    eclf, threshold=0.7, response_method="predict_proba"
).fit(X, y)
print(
    "Predicted class of thresholded VotingClassifier: "
    f"{eclf_other_threshold.predict(test_sample)}"
)

Predicted class of thresholded VotingClassifier: [0]

Общее время выполнения скрипта: (0 минут 0.727 секунд)

Связанные примеры

Построить график вероятности классификации

Полиномиальная и сплайновая интерполяция

Сравнение калибровки классификаторов

Граница решения полуконтролируемых классификаторов против SVM на наборе данных Iris

Галерея, созданная Sphinx-Gallery

	оценщики оценщики: список кортежей (str, estimator) Вызов метода ``fit`` на ``VotingClassifier`` обучит клоны тех исходных оценщиков, которые будут сохранены в атрибуте класса ``self.estimators_``. Оценщик может быть установлен в ``'drop'`` с помощью :meth:`set_params`. SpectralClustering ``'drop'`` принимается. Использование None было устаревшим в 0.22 и поддержка была удалена в 0.24.	[('модель постоянных сплайнов', ...), ('модель периодических сплайнов', ...), ...]
	голосование voting: {'hard', 'soft'}, default='hard' Если 'hard', использует предсказанные метки классов для голосования по большинству. Иначе если 'soft', предсказывает метку класса на основе argmax от изменил свои входные данные ансамбль хорошо калиброванных классификаторов.	'soft'
	веса weights: array-like формы (n_classifiers,), по умолчанию=None Последовательность весов (`float` или `int`) для взвешивания вхождений предсказанные метки классов (жесткое голосование) или вероятности классов перед усреднением (`soft` голосование). Использует равномерные веса, если `None`.	[2, 1, ...]
	n_jobs n_jobs: int, default=None Количество заданий для параллельного выполнения в ``fit``. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации. .. versionadded:: 0.18	None
	flatten_transform flatten_transform: bool, default=True Влияет на форму выходных данных преобразования только при voting='soft' Если voting='soft' и flatten_transform=True, метод transform возвращает матрица формы (n_samples, n_classifiers * n_classes). Если flatten_transform=False, возвращает (n_classifiers, n_samples, n_classes).	True
	verbose verbose: bool, default=False Если True, затраченное на обучение время будет выводиться по мере завершено. .. versionadded:: 0.23	False

	n_knots n_knots: int, default=5 Количество узлов сплайнов, если `knots` равен одному из {'uniform', 'quantile'}. Должно быть больше или равно 2. Игнорируется, если `knots` является array-like.	2
	степень degree: int, по умолчанию=3 Полиномиальная степень базиса сплайна. Должна быть неотрицательной целое число.	2
	узлы knots: {'uniform', 'quantile'} или array-like формы (n_knots, n_features), по умолчанию='uniform' Установите позиции узлов так, чтобы первый узел <= признаки <= последний узел. - Если 'uniform', `n_knots` количество узлов распределены равномерно от минимальных до максимальных значений признаков. - Если 'quantile', они распределены равномерно вдоль квантилей признаки. - Если задан массивоподобный объект, он напрямую указывает отсортированный узел позиций, включая граничные узлы. Обратите внимание, что внутренне `degree` количество узлов добавляется перед первым узлом, то же самое после последнего узла.	'uniform'
	экстраполяция экстраполяция: {'error', 'constant', 'linear', 'continue', 'periodic'}, по умолчанию='constant' Если 'error', значения вне минимального и максимального значений обучающих признаков вызывает `ValueError`. Если 'constant', значение сплайны в минимальном и максимальном значениях признаков используются как постоянная экстраполяция. Если 'linear', используется линейная экстраполяция. Если 'continue', сплайны экстраполируются как есть, т.е. опция `extrapolate=True` в :class:`scipy.interpolate.BSpline`. Если 'periodic', периодические сплайны с периодичностью, равной расстоянию между первым и последним узлом используются. Периодические сплайны обеспечивают равные значения функции и производные в первом и последнем узле. Например, это позволяет избежать введения произвольного скачок между 31 декабря и 1 января в сплайн-признаках, полученных из естественно периодический признак "день года". В этом случае это рекомендуется вручную устанавливать значения узлов для управления периодом.	'constant'
	include_bias include_bias: bool, default=True Если False, то последний элемент сплайна внутри диапазона данных признака отбрасывается. Поскольку B-сплайны суммируются до единицы по базису сплайна функции для каждой точки данных, они неявно включают член смещения, т.е. столбец из единиц. Он действует как член перехвата в линейных моделях.	True
	порядок порядок: {'C', 'F'}, по умолчанию='C' Порядок выходного массива в плотном случае. Порядок 'F' вычисляется быстрее, но может замедлить последующие оценщики.	'C'
	handle_missing handle_missing: {'error', 'zeros'}, default='error' Определяет способ обработки пропущенных значений. - 'error' : Вызвать ошибку, если значения `np.nan` присутствуют во время :meth:`fit`. - 'zeros': Кодировать сплайны отсутствующих значений значениями `0`. Обратите внимание, что `handle_missing='zeros'` отличается от первоначального заполнения пропущенных значений нулями, а затем создание сплайн-базиса. Последнее создаёт сплайн-базис функции, которые имеют ненулевые значения в пропущенных значениях тогда как эта опция просто устанавливает все значения базисных функций сплайна в ноль на пропущенные значения. .. versionadded:: 1.8	'error'
	sparse_output sparse_output: bool, default=False Будет возвращать разреженную матрицу CSR, если установлено True, иначе вернет массив. .. versionadded:: 1.2	False

	степень степень: int или кортеж (min_degree, max_degree), по умолчанию=2 Если задано одно целое число, оно указывает максимальную степень полиномиальные признаки. Если передается кортеж `(min_degree, max_degree)`, тогда `min_degree` — это минимум, а `max_degree` — максимум полиномиальная степень сгенерированных признаков. Обратите внимание, что `min_degree=0` и `min_degree=1` эквивалентны, так как вывод члена нулевой степени определяется `include_bias`.	2
	interaction_only interaction_only: bool, по умолчанию=False Если `True`, создаются только признаки взаимодействия: признаки, которые являются произведения не более чем `degree` различных входных признаков, т.е. члены с степени 2 или выше того же входного признака исключаются: - включены: `x[0]`, `x[1]`, `x[0] * x[1]` и т.д. - исключено: `x[0] 2`, `x[0] 2 * x[1]`, и т.д.	True
	include_bias include_bias: bool, default=True Если `True` (по умолчанию), то включает столбец смещения, признак, в котором все полиномиальные степени равны нулю (т.е. столбец из единиц - действует как свободный член в линейной модели).	True
	порядок порядок: {'C', 'F'}, по умолчанию='C' Порядок выходного массива в плотном случае. Порядок `'F'` быстрее для вычисляется, но может замедлить последующие оценки. .. versionadded:: 0.21	'C'

	штраф penalty: {'l1', 'l2', 'elasticnet', None}, default='l2' Укажите норму штрафа: - `None`: штраф не добавляется; - `'l2'`: добавляет штрафной член L2 и является выбором по умолчанию; - `'l1'`: добавить штрафной член L1; - `'elasticnet'`: добавляются как L1, так и L2 штрафные члены. .. предупреждение:: Некоторые штрафы могут не работать с некоторыми решателями. См. параметр `solver` ниже, чтобы узнать совместимость между штрафом и решатель. .. versionadded:: 0.19 штраф l1 с решателем SAGA (разрешающий 'multinomial' + L1) .. устарело:: 1.8 `penalty` устарел в версии 1.8 и будет удален в 1.10. Используйте `l1_ratio` вместо этого. `l1_ratio=0` для `penalty='l2'`, `l1_ratio=1` для `penalty='l1'` и `l1_ratio`, установленный в любое число с плавающей запятой от 0 до 1 для `'penalty='elasticnet'`.	'устаревший'
	C C: float, default=1.0 Обратная величина силы регуляризации; должно быть положительным числом с плавающей точкой. Как и в машинах опорных векторов, меньшие значения указывают на более сильное регуляризация. `C=np.inf` приводит к нештрафуемой логистической регрессии. Для визуального примера эффекта настройки параметра `C` с L1-штрафом, см.: :ref:`sphx_glr_auto_examples_linear_model_plot_logistic_path.py`.	10
	l1_ratio l1_ratio: float, default=0.0 Параметр смешивания Elastic-Net, где `0 <= l1_ratio <= 1`. Установка `l1_ratio=1` даёт чистое L1-штрафование, установка `l1_ratio=0` — чистое L2-штрафование. Любое значение между 0 и 1 дает штраф Elastic-Net вида `l1_ratio * L1 + (1 - l1_ratio) * L2`. .. предупреждение:: Некоторые значения `l1_ratio`, т.е. некоторые штрафы, могут не работать с некоторыми решатели. См. параметр `solver` ниже, чтобы узнать совместимость между штраф и решатель. .. versionchanged:: 1.8 Значение по умолчанию изменено с None на 0.0. .. устарело:: 1.8 `None` устарел и будет удален в версии 1.10. Всегда используйте `l1_ratio` для указания типа штрафа.	0.0
	dual dual: bool, по умолчанию=False Двойственная (ограниченная) или прямая (регуляризованная, см. также :ref:`это уравнение `) формулировка. Двойственная формулировка реализован только для штрафа l2 с решателем liblinear. Предпочтительнее `dual=False` когда n_samples > n_features.	False
	tol tol: float, default=1e-4 Допуск для критериев остановки.	0.0001
	fit_intercept fit_intercept: bool, по умолчанию=True Указывает, должна ли быть добавлена константа (также называемая смещением или перехватом) добавлено в функцию принятия решений.	True
	intercept_scaling intercept_scaling: float, по умолчанию=1 Полезно только при использовании решателя `liblinear` и `self.fit_intercept` установлен в `True`. В этом случае `x` становится `[x, self.intercept_scaling]`, т.е. "синтетический" признак с постоянным значением, равным `intercept_scaling` добавляется к вектору экземпляра. Интерсепт становится ``intercept_scaling * synthetic_feature_weight``. .. примечание:: Вес синтетического признака подчиняется L1 или L2 регуляризация, как и все остальные признаки. Чтобы уменьшить влияние регуляризации на вес синтетического признака (и, следовательно, на intercept) `intercept_scaling` должен быть увеличен.	1
	class_weight class_weight: dict или 'balanced', по умолчанию=None Веса, связанные с классами, в форме ``{class_label: weight}``. Если не указано, предполагается, что все классы имеют вес один. Режим "balanced" использует значения y для автоматической настройки веса, обратно пропорциональные частотам классов во входных данных как ``n_samples / (n_classes * np.bincount(y))``. Обратите внимание, что эти веса будут умножены на sample_weight (переданный через метод fit), если указан sample_weight. .. versionadded:: 0.17 результаты	None
	random_state random_state: int, RandomState instance, default=None Используется, когда ``solver`` == 'sag', 'saga' или 'liblinear' для перемешивания данные. См.: термин `Glossary ` для деталей.	None
	solver solver: {'lbfgs', 'liblinear', 'newton-cg', 'newton-cholesky', 'sag', 'saga'}, по умолчанию='lbfgs' Алгоритм для использования в задаче оптимизации. По умолчанию 'lbfgs'. Для выбора решателя вы можете рассмотреть следующие аспекты: - 'lbfgs' - хороший решатель по умолчанию, так как он достаточно хорошо работает для широкого класс проблем. - Для :term:`многоклассовых` задач (`n_classes >= 3`), все решатели, кроме 'liblinear' минимизирует полную мультиномиальную потерю, 'liblinear' вызовет ошибка. - 'newton-cholesky' является хорошим выбором для `n_samples` >> `n_features * n_classes`, особенно при one-hot кодировании категориальные признаки с редкими категориями. Учтите, что использование памяти этого решателя имеет квадратичную зависимость от `n_features * n_classes` поскольку он явно вычисляет полную матрицу Гессе. - Для небольших наборов данных 'liblinear' является хорошим выбором, тогда как 'sag' и 'saga' быстрее для больших; - 'liblinear' по умолчанию может обрабатывать только бинарную классификацию. Чтобы применить схему один-против-всех для многоклассовой настройки можно обернуть с помощью :class:`~sklearn.multiclass.OneVsRestClassifier`. .. предупреждение:: Выбор алгоритма зависит от выбранного штрафа (`l1_ratio=0` для L2-штрафа, `l1_ratio=1` для L1-штрафа и `0 < l1_ratio < 1` для Elastic-Net) и на (мультиномиальной) многоклассовой поддержке: ================= ======================== ====================== solver l1_ratio multinomial multiclass ================= ======================== ====================== 'lbfgs' l1_ratio=0 да 'liblinear' l1_ratio=1 или l1_ratio=0 нет 'newton-cg' l1_ratio=0 да 'newton-cholesky' l1_ratio=0 да 'sag' l1_ratio=0 да 'saga' 0<=l1_ratio<=1 да ================= ======================== ====================== .. примечание:: 'sag' и 'saga' быстрая сходимость гарантируется только для признаков с примерно одинаковым масштабом. Вы можете предобработать данные с помощью скейлер из :mod:`sklearn.preprocessing`. .. см. также:: См. :ref:`Руководство пользователя ` для дополнительной информации информация о :class:`LogisticRegression` и, в частности, о :ref:`Таблица ` обобщение поддержки решателя/штрафа. .. versionadded:: 0.17 Решатель стохастического среднего градиента (SAG). Поддержка мультиномиального распределения в версия 0.18. .. versionadded:: 0.19 SAGA solver. .. versionchanged:: 0.22 Стандартный решатель изменился с 'liblinear' на 'lbfgs' в версии 0.22. .. versionadded:: 1.2 newton-cholesky решатель. Поддержка мультиномиальной версии в версии 1.6.	'lbfgs'
	max_iter max_iter: int, по умолчанию=100 Максимальное количество итераций, выполняемых решателями для сходимости.	100
	verbose verbose: int, по умолчанию=0 Для решателей liblinear и lbfgs установите verbose в любое положительное число для уровня детализации вывода.	0
	warm_start warm_start: bool, default=False При установке в True повторно использовать решение предыдущего вызова fit в качестве инициализация, в противном случае просто удалить предыдущее решение. Бесполезно для решателя liblinear. См.: термин `the Glossary `. .. versionadded:: 0.17 warm_start для поддержки решателей lbfgs, newton-cg, sag, saga.	False
	n_jobs n_jobs: int, default=None Не оказывает никакого эффекта. .. устарело:: 1.8 `n_jobs` устарел в версии 1.8 и будет удален в 1.10.	None

	n_knots n_knots: int, default=5 Количество узлов сплайнов, если `knots` равен одному из {'uniform', 'quantile'}. Должно быть больше или равно 2. Игнорируется, если `knots` является array-like.	4
	степень degree: int, по умолчанию=3 Полиномиальная степень базиса сплайна. Должна быть неотрицательной целое число.	2
	узлы knots: {'uniform', 'quantile'} или array-like формы (n_knots, n_features), по умолчанию='uniform' Установите позиции узлов так, чтобы первый узел <= признаки <= последний узел. - Если 'uniform', `n_knots` количество узлов распределены равномерно от минимальных до максимальных значений признаков. - Если 'quantile', они распределены равномерно вдоль квантилей признаки. - Если задан массивоподобный объект, он напрямую указывает отсортированный узел позиций, включая граничные узлы. Обратите внимание, что внутренне `degree` количество узлов добавляется перед первым узлом, то же самое после последнего узла.	'uniform'
	экстраполяция экстраполяция: {'error', 'constant', 'linear', 'continue', 'periodic'}, по умолчанию='constant' Если 'error', значения вне минимального и максимального значений обучающих признаков вызывает `ValueError`. Если 'constant', значение сплайны в минимальном и максимальном значениях признаков используются как постоянная экстраполяция. Если 'linear', используется линейная экстраполяция. Если 'continue', сплайны экстраполируются как есть, т.е. опция `extrapolate=True` в :class:`scipy.interpolate.BSpline`. Если 'periodic', периодические сплайны с периодичностью, равной расстоянию между первым и последним узлом используются. Периодические сплайны обеспечивают равные значения функции и производные в первом и последнем узле. Например, это позволяет избежать введения произвольного скачок между 31 декабря и 1 января в сплайн-признаках, полученных из естественно периодический признак "день года". В этом случае это рекомендуется вручную устанавливать значения узлов для управления периодом.	'periodic'
	include_bias include_bias: bool, default=True Если False, то последний элемент сплайна внутри диапазона данных признака отбрасывается. Поскольку B-сплайны суммируются до единицы по базису сплайна функции для каждой точки данных, они неявно включают член смещения, т.е. столбец из единиц. Он действует как член перехвата в линейных моделях.	True
	порядок порядок: {'C', 'F'}, по умолчанию='C' Порядок выходного массива в плотном случае. Порядок 'F' вычисляется быстрее, но может замедлить последующие оценщики.	'C'
	handle_missing handle_missing: {'error', 'zeros'}, default='error' Определяет способ обработки пропущенных значений. - 'error' : Вызвать ошибку, если значения `np.nan` присутствуют во время :meth:`fit`. - 'zeros': Кодировать сплайны отсутствующих значений значениями `0`. Обратите внимание, что `handle_missing='zeros'` отличается от первоначального заполнения пропущенных значений нулями, а затем создание сплайн-базиса. Последнее создаёт сплайн-базис функции, которые имеют ненулевые значения в пропущенных значениях тогда как эта опция просто устанавливает все значения базисных функций сплайна в ноль на пропущенные значения. .. versionadded:: 1.8	'error'
	sparse_output sparse_output: bool, default=False Будет возвращать разреженную матрицу CSR, если установлено True, иначе вернет массив. .. versionadded:: 1.2	False

	copy copy: bool, default=True Если False, пытается избежать копирования и выполняет масштабирование на месте. Это не гарантирует всегда работать на месте; например, если данные не массив NumPy или разреженная матрица CSR scipy.sparse, копия все еще может быть возвращается.	True
	with_mean with_mean: bool, default=True Если True, центрировать данные перед масштабированием. Это не работает (и вызовет исключение) при попытке на разреженные матрицы, потому что их центрирование требует построения плотной матрица, которая в типичных случаях использования, вероятно, слишком велика для размещения в памяти.	True
	with_std with_std: bool, default=True Если True, масштабировать данные до единичной дисперсии (или, что эквивалентно, единичное стандартное отклонение).	True

	ядро kernel: str или callable, по умолчанию='rbf' Ядро для приближенного отображения. Вызываемый объект должен принимать два аргумента и аргументы ключевых слов, передаваемые этому объекту как `kernel_params`, и должен возвращать число с плавающей точкой.	'rbf'
	gamma gamma: float, по умолчанию=None Параметр Gamma для RBF, лапласиана, полиномиального, экспоненциального chi2 и сигмоидных ядер. Интерпретация значения по умолчанию оставлена на усмотрение ядро; см. документацию для sklearn.metrics.pairwise. Игнорируется другими ядрами.	2
	coef0 coef0: float, default=None Нулевой коэффициент для полиномиальных и сигмоидальных ядер. Игнорируется другими ядрами.	None
	степень degree: float, default=None Степень полиномиального ядра. Игнорируется другими ядрами.	None
	kernel_params kernel_params: dict, по умолчанию=None Дополнительные параметры (именованные аргументы) для функции ядра, передаваемые как вызываемый объект.	None
	n_components n_components: int, default=100 Количество признаков для построения. Сколько точек данных будет использовано для построения отображения.	100
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Генератор псевдослучайных чисел для управления равномерной выборкой без замена `n_components` обучающих данных для построения базовое ядро. Передайте целое число для воспроизводимого вывода при множественных вызовах функции. См. :term:`Глоссарий `.	0
	n_jobs n_jobs: int, default=None Количество заданий для вычисления. Это работает путем разбиения разбиение матрицы ядра на `n_jobs` четных срезов и их вычисление в параллельно. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации. .. versionadded:: 0.24	None

Визуализация вероятностных предсказаний VotingClassifier#

Эта страница