Примечание

Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.

Сравнение Target Encoder с другими кодировщиками#

The TargetEncoder использует значение целевой переменной для кодирования каждого категориального признака. В этом примере мы сравним три различных подхода к обработке категориальных признаков: TargetEncoder, OrdinalEncoder, OneHotEncoder и удаление категории.

Примечание

fit(X, y).transform(X) . Наличие образца fit_transform(X, y) поскольку используется схема перекрестного обучения в fit_transform для кодирования. См. Руководство пользователя подробности.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Загрузка данных из OpenML#

Сначала мы загружаем набор данных обзоров вин, где целевой переменной являются баллы, выставленные рецензентом:

from sklearn.datasets import fetch_openml

wine_reviews = fetch_openml(data_id=42074, as_frame=True)

df = wine_reviews.frame
df.head()

	страна	описание	обозначение	точки	цена	провинция	region_1	region_2	разнообразие	винодельня
0	США	Это потрясающее 100% сортовое вино происходит из ...	Мартас-Винъярд	96	235.0	Калифорния	Napa Valley	Napa	Каберне Совиньон	Хайтц
1	Испания	Спелые ароматы инжира, ежевики и чёрной смородины...	Carodorum Selección Especial Reserva	96	110.0	Северная Испания	Торо	NaN	Tinta de Toro	Бодега Кармен Родригес
2	США	Mac Watson чтит память вина, которое когда-то было...	Специальный отбор позднего урожая	96	90.0	Калифорния	Knights Valley	Sonoma	Совиньон Блан	Macauley
3	США	Это провело 20 месяцев в 30% нового французского дуба, ...	Резерв	96	65.0	Oregon	Долина Уилламетт	Долина Уилламетт	Pinot Noir	Понци
4	Франция	Это лучшее вино от La Bégude, названное в честь...	La Brûlade	95	66.0	Provence	Bandol	NaN	Прованс красное купаж	Domaine de la Bégude

Для этого примера мы используем следующий подмножество числовых и категориальных признаков в данных. Целевая переменная — непрерывные значения от 80 до 100:

numerical_features = ["price"]
categorical_features = [
    "country",
    "province",
    "region_1",
    "region_2",
    "variety",
    "winery",
]
target_name = "points"

X = df[numerical_features + categorical_features]
y = df[target_name]

_ = y.hist()

Обучение и оценка конвейеров с различными кодировщиками#

В этом разделе мы оценим конвейеры с HistGradientBoostingRegressor с различными стратегиями кодирования. Сначала перечислим кодировщики, которые будем использовать для предобработки категориальных признаков:

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder, OrdinalEncoder, TargetEncoder

categorical_preprocessors = [
    ("drop", "drop"),
    ("ordinal", OrdinalEncoder(handle_unknown="use_encoded_value", unknown_value=-1)),
    (
        "one_hot",
        OneHotEncoder(handle_unknown="ignore", max_categories=20, sparse_output=False),
    ),
    ("target", TargetEncoder(target_type="continuous")),
]

Далее мы оцениваем модели с помощью перекрестной проверки и записываем результаты:

from sklearn.ensemble import HistGradientBoostingRegressor
from sklearn.model_selection import cross_validate
from sklearn.pipeline import make_pipeline

n_cv_folds = 3
max_iter = 20
results = []


def evaluate_model_and_store(name, pipe):
    result = cross_validate(
        pipe,
        X,
        y,
        scoring="neg_root_mean_squared_error",
        cv=n_cv_folds,
        return_train_score=True,
    )
    rmse_test_score = -result["test_score"]
    rmse_train_score = -result["train_score"]
    results.append(
        {
            "preprocessor": name,
            "rmse_test_mean": rmse_test_score.mean(),
            "rmse_test_std": rmse_train_score.std(),
            "rmse_train_mean": rmse_train_score.mean(),
            "rmse_train_std": rmse_train_score.std(),
        }
    )


for name, categorical_preprocessor in categorical_preprocessors:
    preprocessor = ColumnTransformer(
        [
            ("numerical", "passthrough", numerical_features),
            ("categorical", categorical_preprocessor, categorical_features),
        ]
    )
    pipe = make_pipeline(
        preprocessor, HistGradientBoostingRegressor(random_state=0, max_iter=max_iter)
    )
    evaluate_model_and_store(name, pipe)

Нативная поддержка категориальных признаков#

В этом разделе мы строим и оцениваем конвейер, использующий нативную поддержку категориальных признаков в HistGradientBoostingRegressor, которая поддерживает только до 255 уникальных категорий. В нашем наборе данных большинство категориальных признаков имеют более 255 уникальных категорий:

n_unique_categories = df[categorical_features].nunique().sort_values(ascending=False)
n_unique_categories

winery      14810
region_1     1236
variety       632
province      455
country        48
region_2       18
dtype: int64

Чтобы обойти указанное ограничение, мы группируем категориальные признаки на признаки с низкой и высокой кардинальностью. Признаки с высокой кардинальностью будут закодированы через target encoding, а признаки с низкой кардинальностью будут использовать нативную категориальную поддержку в градиентном бустинге.

high_cardinality_features = n_unique_categories[n_unique_categories > 255].index
low_cardinality_features = n_unique_categories[n_unique_categories <= 255].index
mixed_encoded_preprocessor = ColumnTransformer(
    [
        ("numerical", "passthrough", numerical_features),
        (
            "high_cardinality",
            TargetEncoder(target_type="continuous"),
            high_cardinality_features,
        ),
        (
            "low_cardinality",
            OrdinalEncoder(handle_unknown="use_encoded_value", unknown_value=-1),
            low_cardinality_features,
        ),
    ],
    verbose_feature_names_out=False,
)

# The output of the of the preprocessor must be set to pandas so the
# gradient boosting model can detect the low cardinality features.
mixed_encoded_preprocessor.set_output(transform="pandas")
mixed_pipe = make_pipeline(
    mixed_encoded_preprocessor,
    HistGradientBoostingRegressor(
        random_state=0, max_iter=max_iter, categorical_features=low_cardinality_features
    ),
)
mixed_pipe

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(transformers=[('numerical', 'passthrough',
                                                  ['price']),
                                                 ('high_cardinality',
                                                  TargetEncoder(target_type='continuous'),
                                                  Index(['winery', 'region_1', 'variety', 'province'], dtype='object')),
                                                 ('low_cardinality',
                                                  OrdinalEncoder(handle_unknown='use_encoded_value',
                                                                 unknown_value=-1),
                                                  Index(['country', 'region_2'], dtype='object'))],
                                   verbose_feature_names_out=False)),
                ('histgradientboostingregressor',
                 HistGradientBoostingRegressor(categorical_features=Index(['country', 'region_2'], dtype='object'),
                                               max_iter=20, random_state=0))])

В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту.
На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.

Наконец, мы оцениваем конвейер с помощью перекрестной проверки и записываем результаты:

evaluate_model_and_store("mixed_target", mixed_pipe)

Построение графиков результатов#

В этом разделе мы отображаем результаты, строя графики оценок тестовой и обучающей выборок:

import matplotlib.pyplot as plt
import pandas as pd

results_df = (
    pd.DataFrame(results).set_index("preprocessor").sort_values("rmse_test_mean")
)

fig, (ax1, ax2) = plt.subplots(
    1, 2, figsize=(12, 8), sharey=True, constrained_layout=True
)
xticks = range(len(results_df))
name_to_color = dict(
    zip((r["preprocessor"] for r in results), ["C0", "C1", "C2", "C3", "C4"])
)

for subset, ax in zip(["test", "train"], [ax1, ax2]):
    mean, std = f"rmse_{subset}_mean", f"rmse_{subset}_std"
    data = results_df[[mean, std]].sort_values(mean)
    ax.bar(
        x=xticks,
        height=data[mean],
        yerr=data[std],
        width=0.9,
        color=[name_to_color[name] for name in data.index],
    )
    ax.set(
        title=f"RMSE ({subset.title()})",
        xlabel="Encoding Scheme",
        xticks=xticks,
        xticklabels=data.index,
    )

При оценке прогностической производительности на тестовом наборе, удаление категорий показывает наихудшие результаты, а кодировщики целевой переменной — наилучшие. Это можно объяснить следующим образом:

Удаление категориальных признаков делает конвейер менее выразительным и приводит к недообучению;
Из-за высокой кардинальности и для сокращения времени обучения схема one-hot кодирования использует max_categories=20 что предотвращает чрезмерное расширение признаков, которое может привести к недообучению.
Если бы мы не установили max_categories=20, схема one-hot кодирования, вероятно, привела бы к переобучению конвейера, так как количество признаков взрывается с редкими вхождениями категорий, которые коррелируют с целью случайно (только на обучающей выборке);
Порядковое кодирование накладывает произвольный порядок на признаки, которые затем обрабатываются как числовые значения с помощью HistGradientBoostingRegressor. Поскольку эта модель группирует числовые признаки в 256 бинов на признак, многие несвязанные категории могут быть сгруппированы вместе, и в результате весь конвейер может недообучаться;
При использовании кодировщика целевой переменной происходит то же самое бинирование, но поскольку закодированные значения статистически упорядочены по маргинальной связи с целевой переменной, бинирование, используемое HistGradientBoostingRegressor имеет смысл и приводит к хорошим результатам: комбинация сглаженного целевого кодирования и бинирования работает как хорошая стратегия регуляризации против переобучения, не слишком ограничивая выразительность конвейера.

Общее время выполнения скрипта: (0 минут 21.865 секунд)

Связанные примеры

Поддержка категориальных признаков в градиентном бустинге

Внутренняя перекрестная подгонка Target Encoder

Трансформер столбцов со смешанными типами

Основные нововведения выпуска scikit-learn 1.4

Галерея, созданная Sphinx-Gallery

	шаги steps: список кортежей Список кортежей (имя шага, оценщик), которые должны быть соединены в цепочку последовательный порядок. Для совместимости с API scikit-learn, все шаги должен определять `fit`. Все не последние шаги также должны определять `transform`. См. :ref:`Комбинирование оценщиков ` для получения дополнительной информации.	[('columntransformer', ...), ('histgradientboostingregressor', ...)]
	transform_input transform_input: list of str, default=None Имена параметров :term:`metadata`, которые должны быть преобразованы конвейер перед передачей его шагу, который его потребляет. Это позволяет преобразовывать некоторые входные аргументы для ``fit`` (кроме ``X``) для преобразования шагами конвейера до шага, который требует их. Требование определяется через :ref:`маршрутизацию метаданных `. Например, это можно использовать для передачи набора валидации через конвейер. Вы можете установить это только если включена маршрутизация метаданных, что вы можно включить, используя ``sklearn.set_config(enable_metadata_routing=True)``. .. versionadded:: 1.6	None
	память memory: строка или объект с интерфейсом joblib.Memory, по умолчанию=None Используется для кэширования обученных трансформеров конвейера. Последний шаг никогда не будет кэшироваться, даже если это трансформер. По умолчанию, никакие кэширование выполняется. Если задана строка, это путь к директория кэширования. Включение кэширования запускает клонирование преобразователей перед обучением. Следовательно, экземпляр трансформатора, переданный в конвейер не может быть проверен напрямую. Используйте атрибут `named_steps` или ``steps`` для проверки оценщиков внутри конвейера. Кэширование трансформеры выгодны, когда подгонка занимает много времени. См. :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` для примера о том, как включить кэширование.	None
	verbose verbose: bool, default=False Если True, затраченное время на обучение каждого шага будет выводиться по мере его выполнения. завершено.	False

	преобразователи transformers: список кортежей Список кортежей (имя, transformer, столбцы), определяющих объекты трансформеров, которые должны быть применены к подмножествам данных. name : str Как и в Pipeline и FeatureUnion, это позволяет преобразователю и его параметры могут быть установлены с помощью ``set_params`` и найдены в сетке поиск. transformer: {'drop', 'passthrough'} или estimator Оценщик должен поддерживать :term:`fit` и :term:`transform`. Специальные строки 'drop' и 'passthrough' принимаются как хорошо, чтобы указать, удалить столбцы или пропустить их непреобразованные, соответственно. столбцы : str, массив строк, int, массив int, массив bool, срез или вызываемый объект Индексирует данные по второй оси. Целые числа интерпретируются как позиционные столбцы, в то время как строки могут ссылаться на столбцы DataFrame по имени. Скалярная строка или целое число должны использоваться там, где ``transformer`` ожидает, что X будет одномерным array-like (вектором), иначе в преобразователь будет передан двумерный массив. Вызываемый объект получает входные данные `X` и может возвращать любой из выше. Чтобы выбрать несколько столбцов по имени или типу данных, можно использовать :obj:`make_column_selector`.	[('numerical', ...), ('high_cardinality', ...), ...]
	остаток остаток: {'drop', 'passthrough'} или оценщик, по умолчанию='drop' По умолчанию только указанные столбцы в `transformers` являются преобразованы и объединены в выходных данных, а не указанные столбцы удаляются. (по умолчанию ``'drop'``). Указав ``remainder='passthrough'``, все оставшиеся столбцы, которые не были указаны в `transformers`, но присутствуют в переданных данных к `fit` будут автоматически переданы. Это подмножество столбцов объединяется с выходом преобразователей. Для датафреймов, дополнительные столбцы, не встречавшиеся во время `fit`, будут исключены из вывода `transform`. Установив ``remainder`` в качестве оценщика, оставшиеся неуказанные столбцы будут использовать оценщик ``remainder``. оценщик должен поддерживать :term:`fit` и :term:`transform`. Обратите внимание, что использование этой функции требует, чтобы столбцы DataFrame входные данные в :term:`fit` и :term:`transform` имеют одинаковый порядок.	'drop'
	sparse_threshold sparse_threshold: float, default=0.3 Если выход разных преобразователей содержит разреженные матрицы, они будут сложены в разреженную матрицу, если общая плотность составляет ниже этого значения. Используйте ``sparse_threshold=0``, чтобы всегда возвращать плотный. Когда преобразованный вывод состоит из всех плотных данных, результат будет плотным, и этот ключевой параметр будет проигнорирован.	0.3
	n_jobs n_jobs: int, default=None Количество параллельно выполняемых задач. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации.	None
	transformer_weights transformer_weights: dict, по умолчанию=None Мультипликативные веса для признаков на трансформер. Выходные данные преобразователь умножается на эти веса. Ключи — это имена преобразователей, значения весов.	None
	verbose verbose: bool, default=False Если True, затраченное время на подгонку каждого трансформатора будет печатается по завершении.	False
	verbose_feature_names_out verbose_feature_names_out: bool, str или Callable[[str, str], str], default=True - Если True, :meth:`ColumnTransformer.get_feature_names_out` добавит префикс все имена признаков с именем преобразователя, который их сгенерировал признак. Эквивалентно установке `verbose_feature_names_out="{transformer_name}__{feature_name}"`. - Если False, :meth:`ColumnTransformer.get_feature_names_out` не будет добавляет префикс к любым именам признаков и вызовет ошибку, если имена признаков отсутствуют уникальные. - Если ``Callable[[str, str], str]``, :meth:`ColumnTransformer.get_feature_names_out` переименует все признаки используя имя преобразователя. Первый аргумент вызываемого объекта - это имя трансформера и второй аргумент — имя признака. Возвращаемый строка будет новым именем признака. - Если ``str``, это должна быть строка, готовая к форматированию. Данная строка будет должны форматироваться с использованием двух имен полей: ``transformer_name`` и ``feature_name``. например, ``"{feature_name}__{transformer_name}"``. См. метод :meth:`str.format` из стандартной библиотеки для получения дополнительной информации. .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` может быть вызываемым объектом или строкой для форматирования.	False
	force_int_remainder_cols force_int_remainder_cols: bool, default=False Этот параметр не оказывает влияния. .. примечание:: Если вы не обращаетесь к списку столбцов для оставшихся столбцов в атрибуте `transformers_` после обучения, вам не нужно устанавливать этот параметр. .. versionadded:: 1.5 .. versionchanged:: 1.7 Значение по умолчанию для `force_int_remainder_cols` изменится с с `True` на `False` в версии 1.7. .. устарело:: 1.7 `force_int_remainder_cols` устарел и будет удалён в версии 1.9.	'устаревший'

	категории categories: "auto" или список формы (n_features,) из array-like, по умолчанию="auto" Категории (уникальные значения) для каждого признака: - `"auto"` : Автоматически определять категории на основе обучающих данных. - список: `categories[i]` содержит категории, ожидаемые в i-м столбце. переданные категории не должны смешивать строки и числовые значения в одной признак, и должен быть отсортирован в случае числовых значений. Используемые категории хранятся в подогнанном атрибуте `categories_`.	'auto'
	target_type target_type: {"auto", "continuous", "binary", "multiclass"}, default="auto" Тип цели. - `"auto"` : Тип цели определяется с помощью :func:`~sklearn.utils.multiclass.type_of_target`. - `"continuous"` : Непрерывная целевая переменная - `"binary"` : Бинарная целевая переменная - `"multiclass"` : Многоклассовая целевая переменная .. примечание:: Тип целевой переменной, выведенный с помощью `"auto"`, может не соответствовать желаемой цели тип, используемый для моделирования. Например, если целевая переменная состояла из целых чисел между 0 и 100, тогда :func:`~sklearn.utils.multiclass.type_of_target` будет определять цель как `"multiclass"`. В этом случае, установка `target_type="continuous"` задаст цель как регрессию задача. Атрибут `target_type_` указывает тип цели, используемый кодировщик. .. versionchanged:: 1.4 Добавлена опция 'multiclass'.	'continuous'
	сглаживать smooth: "auto" или float, default="auto" Степень смешивания среднего целевого значения, обусловленного значением категорию с глобальным средним целевой переменной. Большее значение `smooth` будет помещать больший вес на глобальное среднее целевой переменной. Если `"auto"`, то `smooth` устанавливается в эмпирическую байесовскую оценку.	'auto'
	cv cv: int, по умолчанию=5 Определяет количество фолдов в стратегии :term:`перекрестного обучения`, используемой в :meth:`fit_transform`. Для целевых переменных классификации используется `StratifiedKFold` а для непрерывных целевых переменных используется `KFold`.	5
	перемешивание shuffle: bool, default=True Перемешивать ли данные в :meth:`fit_transform` перед разделением на фолдов. Обратите внимание, что образцы внутри каждого разбиения не будут перемешаны.	True
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Когда `shuffle` равен True, `random_state` влияет на порядок индексы, которые контролируют случайность каждого сгиба. В противном случае это параметр не имеет эффекта. Передайте целое число для воспроизводимого вывода при множественных вызовах функции. См. :term:`Глоссарий `.	None

	категории категории: 'auto' или список массивоподобных объектов, по умолчанию='auto' Категории (уникальные значения) для каждого признака: - 'auto' : Автоматически определять категории из обучающих данных. - список: ``categories[i]`` содержит категории, ожидаемые в i-м столбец. Переданные категории не должны смешивать строки и числа значений и должны быть отсортированы в случае числовых значений. Используемые категории можно найти в атрибуте ``categories_``.	'auto'
	dtype dtype: number type, default=np.float64 Желаемый тип данных выходных данных.
	handle_unknown handle_unknown: {'error', 'use_encoded_value'}, default='error' Когда установлено значение 'error', будет вызвана ошибка в случае неизвестного категориальный признак присутствует во время transform. Когда установлено в 'use_encoded_value', закодированное значение неизвестных категорий будет установлено в значение, заданное для параметра `unknown_value`. В :meth:`inverse_transform`, неизвестная категория будет обозначена как None. .. versionadded:: 0.24	'use_encoded_value'
	unknown_value unknown_value: int или np.nan, по умолчанию=None Когда параметр handle_unknown установлен в 'use_encoded_value', это параметр обязателен и установит закодированное значение неизвестного категории. Он должен отличаться от значений, используемых для кодирования любой из категории в `fit`. Если установлено в np.nan, параметр `dtype` должен должен быть типом данных float. .. versionadded:: 0.24	-1
	encoded_missing_value encoded_missing_value: int или np.nan, по умолчанию=np.nan Закодированное значение отсутствующих категорий. Если установлено в `np.nan`, то `dtype` параметр должен иметь тип данных float. .. versionadded:: 1.1	nan
	min_frequency min_frequency: int или float, по умолчанию=None Определяет минимальную частоту, ниже которой категория будет считается редким. - Если `int`, категории с меньшей мощностью будут считаться редко. - Если `float`, категории с меньшей мощностью, чем `min_frequency * n_samples` будет считаться нечастым. .. versionadded:: 1.3 Подробнее в :ref:`Руководстве пользователя `.	None
	max_categories max_categories: int, default=None Задаёт верхний предел количества выходных категорий для каждого входного особенность при рассмотрении редких категорий. Если есть редкие категории, `max_categories` включает категорию, представляющую редкие категории вместе с частыми категориями. Если `None`, нет ограничения на количество выходных признаков. `max_categories` не учитывают пропущенные или неизвестные категории. Установка `unknown_value` или `encoded_missing_value` в целое число будет увеличивать количество уникальных целочисленных кодов на один каждый раз. Это может привести к кодам целых чисел вплоть до `max_categories + 2`. .. versionadded:: 1.3 Подробнее в :ref:`Руководстве пользователя `.	None

	потеря loss: {'squared_error', 'absolute_error', 'gamma', 'poisson', 'quantile'}, default='squared_error' Функция потерь, используемая в процессе бустинга. Обратите внимание, что Фактически реализуют потери "squared error", "gamma" и "poisson" "половина квадратичных потерь", "половина девиансы гамма" и "половина пуассона deviance" для упрощения вычисления градиента. Кроме того, "gamma" и "poisson" потери внутренне используют логарифмическую связь, "gamma" требует ``y > 0``, а "poisson" требует ``y >= 0``. "quantile" использует потерю пинбола. .. versionchanged:: 0.23 Добавлена опция 'poisson'. .. versionchanged:: 1.1 Добавлена опция 'quantile'. .. versionchanged:: 1.3 Добавлена опция 'gamma'.	'squared_error'
	квантиль quantile: float, default=None Если loss равно "quantile", этот параметр указывает, какой квантиль оценивать и должен быть между 0 и 1.	None
	learning_rate learning_rate: float, по умолчанию=0.1 Скорость обучения, также известная как сжатие. Используется как мультипликативный коэффициент для значений листьев. Используйте ``1`` для отсутствия сжатие.	0.1
	max_iter max_iter: int, по умолчанию=100 Максимальное количество итераций процесса бустинга, т.е. максимальное количество деревьев.	20
	max_leaf_nodes max_leaf_nodes: int или None, по умолчанию=31 Максимальное количество листьев для каждого дерева. Должно быть строго больше чем 1. Если None, максимального предела нет.	31
	max_depth max_depth: int или None, по умолчанию=None Максимальная глубина каждого дерева. Глубина дерева — это количество ребра для перехода от корня к самому глубокому листу. Глубина по умолчанию не ограничена.	None
	min_samples_leaf min_samples_leaf: int, по умолчанию=20 Минимальное количество образцов на лист. Для небольших наборов данных с менее чем чем несколько сотен образцов, рекомендуется уменьшить это значение поскольку строились бы только очень мелкие деревья.	20
	l2_regularization l2_regularization: float, по умолчанию=0 Параметр регуляризации L2, штрафующий листья с малыми гессианами. Используйте ``0`` для отсутствия регуляризации (по умолчанию).	0.0
	max_features max_features: float, default=1.0 Доля случайно выбранных признаков в каждом разделении узла. Это форма регуляризации: меньшие значения делают деревья слабее обучающихся моделей и может предотвратить переобучение. Если присутствуют ограничения взаимодействия из `interaction_cst`, разрешены только признаки учитываются для субдискретизации. .. versionadded:: 1.4	1.0
	max_bins max_bins: int, default=255 Максимальное количество бинов для использования с ненулевыми значениями. До обучения, каждый признак входного массива `X` разбивается на бины в целочисленные бины, что позволяет значительно ускорить этап обучения. Признаки с небольшим количеством уникальных значений могут использовать меньше чем ``max_bins`` бинов. В дополнение к ``max_bins`` бинам, еще один бин всегда зарезервировано для пропущенных значений. Не должно быть больше 255.	255
	categorical_features categorical_features: array-like из {bool, int, str} формы (n_features) или формы (n_categorical_features,), по умолчанию='from_dtype' Указывает категориальные признаки. - None : ни один признак не будет считаться категориальным. - массив булевых значений: булева маска, указывающая категориальные признаки. - целочисленный массивоподобный : целочисленные индексы, указывающие категориальные признаков. - str array-like: имена категориальных признаков (предполагается, что обучающие данные имеют имена признаков). - `"from_dtype"`: столбцы датафрейма с типом данных "category" являются считаются категориальными признаками. Входные данные должны быть объектом предоставляя метод ``__dataframe__``, такой как pandas или polars DataFrames для использования этой функции. Для каждой категориальной характеристики должно быть не более `max_bins` уникальных категории. Отрицательные значения для категориальных признаков, закодированных как числовые dtypes обрабатываются как пропущенные значения. Все категориальные значения преобразуются в числа с плавающей точкой. Это означает, что категориальные значения значения 1.0 и 1 рассматриваются как одна и та же категория. Подробнее в :ref:`Руководстве пользователя ` и :ref:`sphx_glr_auto_examples_ensemble_plot_gradient_boosting_categorical.py`. .. versionadded:: 0.24 .. versionchanged:: 1.2 Добавлена поддержка имён признаков. .. versionchanged:: 1.4 Добавлена опция `"from_dtype"`. .. versionchanged:: 1.6 Значение по умолчанию изменилось с `None` на `"from_dtype"`.	Index(['count...type='object')
	monotonic_cst monotonic_cst: array-like из int формы (n_features) или dict, по умолчанию=None Монотонное ограничение, накладываемое на каждый признак, задается с помощью следующие целочисленные значения: - 1: монотонное увеличение - 0: без ограничений - -1: монотонное убывание Если это словарь со строковыми ключами, сопоставьте признак с монотонными ограничениями по имени. Если передан массив, признаки сопоставляются с ограничениями по позиции. См. :ref:`monotonic_cst_features_names` для примера использования. Подробнее в :ref:`Руководстве пользователя `. .. versionadded:: 0.23 .. versionchanged:: 1.2 Принимает словарь ограничений с именами признаков в качестве ключей.	None
	interaction_cst interaction_cst: {"pairwise", "no_interactions"} или последовательность списков/кортежей/множеств int, по умолчанию=None Задайте ограничения взаимодействия, наборы признаков, которые могут взаимодействуют друг с другом в разбиениях дочерних узлов. Каждый элемент указывает набор индексов признаков, которые разрешены взаимодействовать друг с другом. Если признаков больше, чем указаны в этих ограничениях, они рассматриваются как если бы они были указан как дополнительный набор. Строки "pairwise" и "no_interactions" являются сокращениями для разрешая только попарные взаимодействия или их отсутствие соответственно. Например, при 5 признаках в общей сложности, `interaction_cst=[{0, 1}]` эквивалентно `interaction_cst=[{0, 1}, {2, 3, 4}]`, и указывает, что каждая ветвь дерева будет либо только разделять по признакам 0 и 1 или только по признакам 2, 3 и 4. См. :ref:`этот пример` о том, как использовать `interaction_cst`. .. versionadded:: 1.2	None
	warm_start warm_start: bool, default=False Когда установлено в ``True``, повторно использовать решение предыдущего вызова fit и добавьте больше оценщиков в ансамбль. Для валидности результатов, оценщик должен быть переобучен на тех же данных. См. :term:`Глоссарий `.	False
	early_stopping early_stopping: 'auto' или bool, по умолчанию='auto' Если 'auto', ранняя остановка включается, если размер выборки больше 10000 или если `X_val` и `y_val` переданы в `fit`. Если True, ранняя остановка включено, в противном случае ранняя остановка отключена. .. versionadded:: 0.23	'auto'
	оценка scoring: str или callable или None, по умолчанию='loss' Метод оценки для ранней остановки. Используется только если `early_stopping` включено. Опции: - str: см. :ref:`scoring_string_names` для вариантов. - вызываемый объект: вызываемый объект оценки (например, функция) с сигнатурой ``scorer(estimator, X, y)``. См. :ref:`scoring_callable` для подробностей. - `None`: :ref:`коэффициент детерминации ` (:math:`R^2`) используется. - 'loss': ранняя остановка проверяется относительно значения потерь.	'loss'
	validation_fraction validation_fraction: int или float или None, default=0.1 Доля (или абсолютный размер) обучающих данных, которые следует отложить как валидационные данные для ранней остановки. Если None, ранняя остановка выполняется на обучающие данные. Значение игнорируется, если ранняя остановка не выполняется, например, `early_stopping=False`, или если `X_val` и `y_val` переданы в fit.	0.1
	n_iter_no_change n_iter_no_change: int, default=10 Используется для определения момента "ранней остановки". Процесс обучения остановка, когда ни один из последних ``n_iter_no_change`` результатов не улучшается чем ``n_iter_no_change - 1``-я с конца, до некоторого допуск. Используется только при досрочной остановке.	10
	tol tol: float, default=1e-7 Абсолютный допуск, используемый при сравнении оценок во время ранней остановки. Чем выше допуск, тем более вероятна ранняя остановка: более высокая толерантность означает, что последующим будет сложнее итераций, чтобы считаться улучшением по сравнению с эталонным результатом.	1e-07
	verbose verbose: int, по умолчанию=0 Уровень подробности вывода. Если не ноль, выводит некоторую информацию о процесс обучения. ``1`` выводит только сводную информацию, ``2`` выводит информацию на итерация.	0
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Псевдослучайный генератор чисел для управления субдискретизацией в процесс бинирования и разделение данных на обучающую/валидационную выборку, если используется ранняя остановка включен. Передайте целое число для воспроизводимого вывода при множественных вызовах функции. См. :term:`Глоссарий `.	0