Примечание

Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.

Графики частичной зависимости и индивидуального условного ожидания#

Графики частной зависимости показывают зависимость между целевой функцией [2] и набор интересующих признаков, маргинализируя по значениям всех других признаков (дополнительных признаков). Из-за ограничений человеческого восприятия размер набора интересующих признаков должен быть небольшим (обычно один или два), поэтому они обычно выбираются среди наиболее важных признаков.

Аналогично, график индивидуального условного ожидания (ICE) [3] показывает зависимость между целевой функцией и интересующим признаком. Однако, в отличие от графиков частичной зависимости, которые показывают средний эффект интересующих признаков, ICE-графики визуализируют зависимость предсказания от признака для каждого sample отдельно, с одной строкой на образец. Только один интересующий признак поддерживается для ICE-графиков.

Этот пример показывает, как получить графики частичной зависимости и ICE из MLPRegressor и HistGradientBoostingRegressor обученная на наборе данных о прокате велосипедов. Пример вдохновлен [1].

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

1-сторонняя частичная зависимость с разными моделями#

В этом разделе мы вычислим 1-стороннюю частичную зависимость с двумя разными моделями машинного обучения: (i) многослойный перцептрон и (ii) градиентный бустинг. С этими двумя моделями мы проиллюстрируем, как вычислять и интерпретировать как график частичной зависимости (PDP) для числовых и категориальных признаков, так и индивидуальное условное ожидание (ICE).

Многослойный перцептрон#

Давайте обучим MLPRegressor и вычислить графики частной зависимости для одной переменной.

from time import time

from sklearn.neural_network import MLPRegressor
from sklearn.pipeline import make_pipeline

print("Training MLPRegressor...")
tic = time()
mlp_model = make_pipeline(
    mlp_preprocessor,
    MLPRegressor(
        hidden_layer_sizes=(30, 15),
        learning_rate_init=0.01,
        early_stopping=True,
        random_state=0,
    ),
)
mlp_model.fit(X_train, y_train)
print(f"done in {time() - tic:.3f}s")
print(f"Test R2 score: {mlp_model.score(X_test, y_test):.2f}")

Training MLPRegressor...
done in 0.662s
Test R2 score: 0.61

Мы настроили конвейер, используя предобработчик, который мы создали специально для нейронной сети, и настроили размер нейронной сети и скорость обучения, чтобы получить разумный компромисс между временем обучения и прогнозной производительностью на тестовом наборе.

Важно отметить, что этот табличный набор данных имеет сильно различающиеся динамические диапазоны для своих признаков. Нейронные сети обычно очень чувствительны к признакам с разными масштабами, и забывание предобработать числовые признаки приведёт к очень плохой модели.

Можно было бы достичь еще более высокой предсказательной производительности с более крупной нейронной сетью, но обучение также было бы значительно дороже.

Обратите внимание, что важно проверить, что модель достаточно точна на тестовом наборе, прежде чем строить график частной зависимости, поскольку было бы мало смысла объяснять влияние данного признака на функцию предсказания модели с плохой предсказательной способностью. В этом отношении наша модель MLP работает достаточно хорошо.

Мы построим усредненную частную зависимость.

import matplotlib.pyplot as plt

from sklearn.inspection import PartialDependenceDisplay

common_params = {
    "subsample": 50,
    "n_jobs": 2,
    "grid_resolution": 20,
    "random_state": 0,
}

print("Computing partial dependence plots...")
features_info = {
    # features of interest
    "features": ["temp", "humidity", "windspeed", "season", "weather", "hour"],
    # type of partial dependence plot
    "kind": "average",
    # information regarding categorical features
    "categorical_features": categorical_features,
}
tic = time()
_, ax = plt.subplots(ncols=3, nrows=2, figsize=(9, 8), constrained_layout=True)
display = PartialDependenceDisplay.from_estimator(
    mlp_model,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)
print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle(
    (
        "Partial dependence of the number of bike rentals\n"
        "for the bike rental dataset with an MLPRegressor"
    ),
    fontsize=16,
)

Partial dependence of the number of bike rentals for the bike rental dataset with an MLPRegressor

Computing partial dependence plots...
done in 0.635s

Градиентный бустинг#

Давайте теперь обучим HistGradientBoostingRegressor и вычисляем частичную зависимость по тем же признакам. Мы также используем конкретный препроцессор, созданный для этой модели.

from sklearn.ensemble import HistGradientBoostingRegressor

print("Training HistGradientBoostingRegressor...")
tic = time()
hgbdt_model = make_pipeline(
    hgbdt_preprocessor,
    HistGradientBoostingRegressor(
        categorical_features=categorical_features,
        random_state=0,
        max_iter=50,
    ),
)
hgbdt_model.fit(X_train, y_train)
print(f"done in {time() - tic:.3f}s")
print(f"Test R2 score: {hgbdt_model.score(X_test, y_test):.2f}")

Training HistGradientBoostingRegressor...
done in 0.119s
Test R2 score: 0.62

Здесь мы использовали гиперпараметры по умолчанию для модели градиентного бустинга без какой-либо предварительной обработки, так как древовидные модели естественно устойчивы к монотонным преобразованиям числовых признаков.

Обратите внимание, что на этом табличном наборе данных градиентный бустинг на деревьях значительно быстрее обучается и точнее, чем нейронные сети. Также значительно дешевле настраивать их гиперпараметры (значения по умолчанию обычно работают хорошо, в то время как для нейронных сетей это часто не так).

Мы построим частичную зависимость для некоторых числовых и категориальных признаков.

print("Computing partial dependence plots...")
tic = time()
_, ax = plt.subplots(ncols=3, nrows=2, figsize=(9, 8), constrained_layout=True)
display = PartialDependenceDisplay.from_estimator(
    hgbdt_model,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)
print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle(
    (
        "Partial dependence of the number of bike rentals\n"
        "for the bike rental dataset with a gradient boosting"
    ),
    fontsize=16,
)

Partial dependence of the number of bike rentals for the bike rental dataset with a gradient boosting

Computing partial dependence plots...
done in 1.169s

Анализ графиков#

Сначала рассмотрим частные зависимости предсказания (PDP) для числовых признаков. Для обеих моделей общая тенденция PDP температуры заключается в том, что количество прокатов велосипедов увеличивается с температурой. Можно провести аналогичный анализ, но с противоположной тенденцией для признаков влажности. Количество прокатов велосипедов уменьшается при увеличении влажности. Наконец, мы видим ту же тенденцию для признака скорости ветра. Количество прокатов велосипедов уменьшается при увеличении скорости ветра для обеих моделей. Также наблюдаем, что MLPRegressor имеет гораздо более гладкие предсказания, чем HistGradientBoostingRegressor.

Теперь мы рассмотрим графики частных зависимостей для категориальных признаков.

Мы наблюдаем, что весенний сезон является самым низким баром для признака сезона. Для признака погоды категория дождя является самым низким баром. Что касается признака часа, мы видим два пика около 7 утра и 6 вечера. Эти выводы соответствуют наблюдениям, сделанным ранее на наборе данных.

Однако стоит отметить, что мы создаем потенциально бессмысленные синтетические выборки, если признаки коррелированы.

ICE против PDP#

PDP — это среднее значение маргинальных эффектов признаков. Мы усредняем отклик всех образцов предоставленного набора. Таким образом, некоторые эффекты могут быть скрыты. В этом отношении можно построить каждый индивидуальный отклик. Это представление называется графиком индивидуального эффекта (ICE). На графике ниже мы строим 50 случайно выбранных ICE для признаков температуры и влажности.

print("Computing partial dependence plots and individual conditional expectation...")
tic = time()
_, ax = plt.subplots(ncols=2, figsize=(6, 4), sharey=True, constrained_layout=True)

features_info = {
    "features": ["temp", "humidity"],
    "kind": "both",
    "centered": True,
}

display = PartialDependenceDisplay.from_estimator(
    hgbdt_model,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)
print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle("ICE and PDP representations", fontsize=16)

Computing partial dependence plots and individual conditional expectation...
done in 0.477s

Мы видим, что ICE для признака температуры дает нам дополнительную информацию: Некоторые линии ICE плоские, а другие показывают уменьшение зависимости для температуры выше 35 градусов Цельсия. Мы наблюдаем аналогичную картину для признака влажности: некоторые линии ICE показывают резкое уменьшение, когда влажность выше 80%.

Не все линии ICE параллельны, это указывает на то, что модель находит взаимодействия между признаками. Мы можем повторить эксперимент, ограничив модель градиентного бустинга, чтобы она не использовала взаимодействия между признаками, с помощью параметра interaction_cst:

from sklearn.base import clone

interaction_cst = [[i] for i in range(X_train.shape[1])]
hgbdt_model_without_interactions = (
    clone(hgbdt_model)
    .set_params(histgradientboostingregressor__interaction_cst=interaction_cst)
    .fit(X_train, y_train)
)
print(f"Test R2 score: {hgbdt_model_without_interactions.score(X_test, y_test):.2f}")

Test R2 score: 0.38

_, ax = plt.subplots(ncols=2, figsize=(6, 4), sharey=True, constrained_layout=True)

features_info["centered"] = False
display = PartialDependenceDisplay.from_estimator(
    hgbdt_model_without_interactions,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)
_ = display.figure_.suptitle("ICE and PDP representations", fontsize=16)

2D графики взаимодействий#

PDP с двумя интересующими признаками позволяют нам визуализировать взаимодействия между ними. Однако ICE не могут быть легко построены и, следовательно, интерпретированы. Мы покажем представление доступное в from_estimator что представляет собой 2D тепловую карту.

print("Computing partial dependence plots...")
features_info = {
    "features": ["temp", "humidity", ("temp", "humidity")],
    "kind": "average",
}
_, ax = plt.subplots(ncols=3, figsize=(10, 4), constrained_layout=True)
tic = time()
display = PartialDependenceDisplay.from_estimator(
    hgbdt_model,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)
print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle(
    "1-way vs 2-way of numerical PDP using gradient boosting", fontsize=16
)

1-way vs 2-way of numerical PDP using gradient boosting

Computing partial dependence plots...
done in 7.839s

Двусторонний график частичной зависимости показывает зависимость количества прокатов велосипедов от совместных значений температуры и влажности. Мы ясно видим взаимодействие между двумя признаками. При температуре выше 20 градусов Цельсия влажность влияет на количество прокатов велосипедов, и это влияние, кажется, не зависит от температуры.

С другой стороны, для температур ниже 20 градусов Цельсия и температура, и влажность постоянно влияют на количество аренд велосипедов.

Кроме того, наклон гребня воздействия порога в 20 градусов Цельсия сильно зависит от уровня влажности: гребень крутой при сухих условиях, но гораздо более плавный при более влажных условиях выше 70% влажности.

Теперь мы сопоставляем эти результаты с теми же графиками, вычисленными для модели, ограниченной изучением предсказательной функции, которая не зависит от таких нелинейных взаимодействий признаков.

print("Computing partial dependence plots...")
features_info = {
    "features": ["temp", "humidity", ("temp", "humidity")],
    "kind": "average",
}
_, ax = plt.subplots(ncols=3, figsize=(10, 4), constrained_layout=True)
tic = time()
display = PartialDependenceDisplay.from_estimator(
    hgbdt_model_without_interactions,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)
print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle(
    "1-way vs 2-way of numerical PDP using gradient boosting", fontsize=16
)

Computing partial dependence plots...
done in 6.837s

1D графики частной зависимости для модели, ограниченной запретом на моделирование взаимодействий признаков, показывают локальные всплески для каждого признака в отдельности, в частности для признака «влажность». Эти всплески могут отражать ухудшенное поведение модели, которая пытается каким-то образом компенсировать запрещённые взаимодействия путём переобучения на определённых точках обучения. Отметим, что прогностическая производительность этой модели, измеренная на тестовом наборе, значительно хуже, чем у исходной, неограниченной модели.

Также обратите внимание, что количество локальных пиков, видимых на этих графиках, зависит от параметра разрешения сетки самого графика PD.

Эти локальные всплески приводят к шумному сетчатому 2D PD графику. Довольно сложно определить, есть ли взаимодействие между этими признаками из-за высокочастотных колебаний в признаке влажности. Однако можно четко увидеть, что простое эффект взаимодействия, наблюдаемый при пересечении температурой границы в 20 градусов, больше не виден для этой модели.

Частичная зависимость между категориальными признаками предоставит дискретное представление, которое можно показать в виде тепловой карты. Например, взаимодействие между сезоном, погодой и целью будет следующим:

print("Computing partial dependence plots...")
features_info = {
    "features": ["season", "weather", ("season", "weather")],
    "kind": "average",
    "categorical_features": categorical_features,
}
_, ax = plt.subplots(ncols=3, figsize=(14, 6), constrained_layout=True)
tic = time()
display = PartialDependenceDisplay.from_estimator(
    hgbdt_model,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
)

print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle(
    "1-way vs 2-way PDP of categorical features using gradient boosting", fontsize=16
)

1-way vs 2-way PDP of categorical features using gradient boosting

Computing partial dependence plots...
done in 0.327s

3D-представление#

Давайте построим тот же график частной зависимости для взаимодействия 2 признаков, на этот раз в 3-х измерениях.

# unused but required import for doing 3d projections with matplotlib < 3.2
import mpl_toolkits.mplot3d  # noqa: F401
import numpy as np

from sklearn.inspection import partial_dependence

fig = plt.figure(figsize=(5.5, 5))

features = ("temp", "humidity")
pdp = partial_dependence(
    hgbdt_model, X_train, features=features, kind="average", grid_resolution=10
)
XX, YY = np.meshgrid(pdp["grid_values"][0], pdp["grid_values"][1])
Z = pdp.average[0].T
ax = fig.add_subplot(projection="3d")
fig.add_axes(ax)

surf = ax.plot_surface(XX, YY, Z, rstride=1, cstride=1, cmap=plt.cm.BuPu, edgecolor="k")
ax.set_xlabel(features[0])
ax.set_ylabel(features[1])
fig.suptitle(
    "PD of number of bike rentals on\nthe temperature and humidity GBDT model",
    fontsize=16,
)
# pretty init view
ax.view_init(elev=22, azim=122)
clb = plt.colorbar(surf, pad=0.08, shrink=0.6, aspect=10)
clb.ax.set_title("Partial\ndependence")
plt.show()

PD of number of bike rentals on the temperature and humidity GBDT model, Partial dependence

Пользовательские точки инспекции#

Ни один из примеров до сих пор не указывает, _какие_ точки оцениваются для создания графиков частичной зависимости. По умолчанию мы используем процентили, определенные входным набором данных. В некоторых случаях может быть полезно указать точные точки, где вы хотите оценить модель. Например, если пользователь хочет проверить поведение модели на данных вне распределения или сравнить две модели, обученные на немного разных данных. custom_values параметр позволяет пользователю передавать значения, на которых они хотят оценить модель. Это переопределяет grid_resolution и percentiles параметры. Вернемся к нашему примеру с градиентным бустингом выше, но с пользовательскими значениями

print("Computing partial dependence plots with custom evaluation values...")
tic = time()
_, ax = plt.subplots(ncols=2, figsize=(6, 4), sharey=True, constrained_layout=True)

features_info = {
    "features": ["temp", "humidity"],
    "kind": "both",
}

display = PartialDependenceDisplay.from_estimator(
    hgbdt_model,
    X_train,
    **features_info,
    ax=ax,
    **common_params,
    # we set custom values for temp feature -
    # all other features are evaluated based on the data
    custom_values={"temp": np.linspace(0, 40, 10)},
)
print(f"done in {time() - tic:.3f}s")
_ = display.figure_.suptitle(
    (
        "Partial dependence of the number of bike rentals\n"
        "for the bike rental dataset with a gradient boosting"
    ),
    fontsize=16,
)

Computing partial dependence plots with custom evaluation values...
done in 0.452s

Общее время выполнения скрипта: (0 минут 23.253 секунды)

Связанные примеры

Расширенное построение графиков с частичной зависимостью

Инженерия временных признаков

Основные нововведения scikit-learn 0.24

Основные новости выпуска scikit-learn 1.2

Галерея, созданная Sphinx-Gallery

	преобразователи transformers: список кортежей Список кортежей (имя, transformer, столбцы), определяющих объекты трансформеров, которые должны быть применены к подмножествам данных. name : str Как и в Pipeline и FeatureUnion, это позволяет преобразователю и его параметры могут быть установлены с помощью ``set_params`` и найдены в сетке поиск. transformer: {'drop', 'passthrough'} или estimator Оценщик должен поддерживать :term:`fit` и :term:`transform`. Специальные строки 'drop' и 'passthrough' принимаются как хорошо, чтобы указать, удалить столбцы или пропустить их непреобразованные, соответственно. столбцы : str, массив строк, int, массив int, массив bool, срез или вызываемый объект Индексирует данные по второй оси. Целые числа интерпретируются как позиционные столбцы, в то время как строки могут ссылаться на столбцы DataFrame по имени. Скалярная строка или целое число должны использоваться там, где ``transformer`` ожидает, что X будет одномерным array-like (вектором), иначе в преобразователь будет передан двумерный массив. Вызываемый объект получает входные данные `X` и может возвращать любой из выше. Чтобы выбрать несколько столбцов по имени или типу данных, можно использовать :obj:`make_column_selector`.	[('num', ...), ('cat', ...)]
	остаток остаток: {'drop', 'passthrough'} или оценщик, по умолчанию='drop' По умолчанию только указанные столбцы в `transformers` являются преобразованы и объединены в выходных данных, а не указанные столбцы удаляются. (по умолчанию ``'drop'``). Указав ``remainder='passthrough'``, все оставшиеся столбцы, которые не были указаны в `transformers`, но присутствуют в переданных данных к `fit` будут автоматически переданы. Это подмножество столбцов объединяется с выходом преобразователей. Для датафреймов, дополнительные столбцы, не встречавшиеся во время `fit`, будут исключены из вывода `transform`. Установив ``remainder`` в качестве оценщика, оставшиеся неуказанные столбцы будут использовать оценщик ``remainder``. оценщик должен поддерживать :term:`fit` и :term:`transform`. Обратите внимание, что использование этой функции требует, чтобы столбцы DataFrame входные данные в :term:`fit` и :term:`transform` имеют одинаковый порядок.	'drop'
	sparse_threshold sparse_threshold: float, default=0.3 Если выход разных преобразователей содержит разреженные матрицы, они будут сложены в разреженную матрицу, если общая плотность составляет ниже этого значения. Используйте ``sparse_threshold=0``, чтобы всегда возвращать плотный. Когда преобразованный вывод состоит из всех плотных данных, результат будет плотным, и этот ключевой параметр будет проигнорирован.	0.3
	n_jobs n_jobs: int, default=None Количество параллельно выполняемых задач. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации.	None
	transformer_weights transformer_weights: dict, по умолчанию=None Мультипликативные веса для признаков на трансформер. Выходные данные преобразователь умножается на эти веса. Ключи — это имена преобразователей, значения весов.	None
	verbose verbose: bool, default=False Если True, затраченное время на подгонку каждого трансформатора будет печатается по завершении.	False
	verbose_feature_names_out verbose_feature_names_out: bool, str или Callable[[str, str], str], default=True - Если True, :meth:`ColumnTransformer.get_feature_names_out` добавит префикс все имена признаков с именем преобразователя, который их сгенерировал признак. Эквивалентно установке `verbose_feature_names_out="{transformer_name}__{feature_name}"`. - Если False, :meth:`ColumnTransformer.get_feature_names_out` не будет добавляет префикс к любым именам признаков и вызовет ошибку, если имена признаков отсутствуют уникальные. - Если ``Callable[[str, str], str]``, :meth:`ColumnTransformer.get_feature_names_out` переименует все признаки используя имя преобразователя. Первый аргумент вызываемого объекта - это имя трансформера и второй аргумент — имя признака. Возвращаемый строка будет новым именем признака. - Если ``str``, это должна быть строка, готовая к форматированию. Данная строка будет должны форматироваться с использованием двух имен полей: ``transformer_name`` и ``feature_name``. например, ``"{feature_name}__{transformer_name}"``. См. метод :meth:`str.format` из стандартной библиотеки для получения дополнительной информации. .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` может быть вызываемым объектом или строкой для форматирования.	True
	force_int_remainder_cols force_int_remainder_cols: bool, default=False Этот параметр не оказывает влияния. .. примечание:: Если вы не обращаетесь к списку столбцов для оставшихся столбцов в атрибуте `transformers_` после обучения, вам не нужно устанавливать этот параметр. .. versionadded:: 1.5 .. versionchanged:: 1.7 Значение по умолчанию для `force_int_remainder_cols` изменится с с `True` на `False` в версии 1.7. .. устарело:: 1.7 `force_int_remainder_cols` устарел и будет удалён в версии 1.9.	'устаревший'

	n_quantiles n_quantiles: int, по умолчанию=1000 или n_samples Количество квантилей для вычисления. Соответствует количеству ориентиров, используемых для дискретизации функции кумулятивного распределения. Если n_quantiles больше количества выборок, n_quantiles устанавливается к количеству выборок, так как большее количество квантилей не даёт более точное приближение функции распределения оценщик.	100
	output_distribution output_distribution: {'uniform', 'normal'}, по умолчанию='uniform' Маргинальное распределение для преобразованных данных. Варианты: 'uniform' (по умолчанию) или 'normal'.	'uniform'
	ignore_implicit_zeros ignore_implicit_zeros: bool, default=False Применяется только к разреженным матрицам. Если True, разреженные элементы матрицы отбрасываются для вычисления квантильной статистики. Если False, эти записи обрабатываются как нули.	False
	subsample subsample: int или None, по умолчанию=10_000 Максимальное количество выборок, используемых для оценки квантилей для вычислительная эффективность. Обратите внимание, что процедура субдискретизации может различаются для разреженных и плотных матриц с одинаковыми значениями. Отключить субдискретизацию, установив `subsample=None`. .. versionadded:: 1.5 Была добавлена опция `None` для отключения субдискретизации.	10000
	random_state random_state: int, экземпляр RandomState или None, по умолчанию=None Определяет генерацию случайных чисел для субдискретизации и сглаживания шум. Пожалуйста, см. ``subsample`` для подробностей. Передайте целое число для воспроизводимых результатов при многократных вызовах функции. См. :term:`Глоссарий `.	None
	copy copy: bool, default=True Установите значение False для выполнения преобразования на месте и избежания копирования (если вход уже является массивом numpy).	True

	категории категории: 'auto' или список массивоподобных объектов, по умолчанию='auto' Категории (уникальные значения) для каждого признака: - 'auto' : Автоматически определять категории из обучающих данных. - список: ``categories[i]`` содержит категории, ожидаемые в i-м столбец. Переданные категории не должны смешивать строки и числа значения в пределах одного признака и должны быть отсортированы в случае числовые значения. Используемые категории можно найти в атрибуте ``categories_``. .. versionadded:: 0.20	'auto'
	drop drop: {'first', 'if_binary'} или array-like формы (n_features,), default=None Определяет методологию для удаления одной из категорий на признак. Это полезно в ситуациях, когда идеально коллинеарные признаки вызывают проблемы, например, при передаче полученных данных в нерегуляризованную линейную регрессионную модель. Однако удаление одной категории нарушает симметрию исходной представление и, следовательно, может вызвать смещение в последующих моделях, например, для штрафных линейных моделей классификации или регрессии. - None : сохранить все признаки (по умолчанию). - 'first' : удалить первую категорию в каждом признаке. Если только одна если категория присутствует, признак будет полностью удалён. - 'if_binary' : удалить первую категорию в каждом признаке с двумя категории. Признаки с 1 или более чем 2 категориями являются оставлены без изменений. - array : ``drop[i]`` — это категория в признаке ``X[:, i]``, которая должны быть удалены. Когда `max_categories` или `min_frequency` настроены для группировки редкие категории, поведение отбрасывания обрабатывается после группировка. .. versionadded:: 0.21 Параметр `drop` был добавлен в версии 0.21. .. versionchanged:: 0.23 Опция `drop='if_binary'` была добавлена в версии 0.23. .. versionchanged:: 1.1 Поддержка удаления редких категорий.	None
	sparse_output sparse_output: bool, default=True Когда ``True``, возвращает :class:`scipy.sparse.csr_matrix`, т.е. разреженная матрица в формате "Compressed Sparse Row" (CSR). .. versionadded:: 1.2 `sparse` был переименован в `sparse_output`	True
	dtype dtype: number type, default=np.float64 Желаемый тип данных выходных данных.
	handle_unknown handle_unknown: {'error', 'ignore', 'infrequent_if_exist', 'warn'}, default='error' Определяет способ обработки неизвестных категорий во время :meth:`transform`. - 'error': Вызвать ошибку, если во время преобразования присутствует неизвестная категория. - 'ignore' : Когда во время transform, результирующие one-hot кодированные столбцы для этого признака будут все нули. При обратном преобразовании неизвестная категория будет обозначаться как None. - 'infrequent_if_exist' : Когда встречается неизвестная категория во время преобразования, результирующие one-hot кодированные столбцы для этой признак будет отображаться в редкую категорию, если она существует. редкая категория будет отображена в последнюю позицию в кодировку. При обратном преобразовании неизвестная категория будет сопоставляется с категорией, обозначенной `'infrequent'`, если она существует. Если категория `'infrequent'` не существует, тогда :meth:`transform` и :meth:`inverse_transform` обработает неизвестную категорию как с `handle_unknown='ignore'`. Редкие категории существуют на основе `min_frequency` и `max_categories`. Подробнее в :ref:`Руководство пользователя `. - 'warn' : Когда во время преобразования встречается неизвестная категория выдается предупреждение, и кодирование затем продолжается, как описано для `handle_unknown="infrequent_if_exist"`. .. versionchanged:: 1.1 `'infrequent_if_exist'` был добавлен для автоматической обработки неизвестных категории и редкие категории. .. versionadded:: 1.6 Опция `"warn"` была добавлена в версии 1.6.	'ignore'
	min_frequency min_frequency: int или float, по умолчанию=None Определяет минимальную частоту, ниже которой категория будет считается редким. - Если `int`, категории с меньшей мощностью будут считаться редко. - Если `float`, категории с меньшей мощностью, чем `min_frequency * n_samples` будет считаться нечастым. .. versionadded:: 1.1 Подробнее в :ref:`Руководстве пользователя `.	None
	max_categories max_categories: int, default=None Задает верхний предел количества выходных признаков для каждого входного особенность при рассмотрении редких категорий. Если есть редкие категории, `max_categories` включает категорию, представляющую редкие категории вместе с частыми категориями. Если `None`, нет ограничения на количество выходных признаков. .. versionadded:: 1.1 Подробнее в :ref:`Руководстве пользователя `.	None
	feature_name_combiner feature_name_combiner: "concat" или callable, по умолчанию="concat" Вызываемый объект с сигнатурой `def callable(input_feature, category)`, который возвращает string. Используется для создания имен признаков, возвращаемых :meth:`get_feature_names_out`. `"concat"` объединяет закодированное имя признака и категорию с `feature + "_" + str(category)`. Например, признак X со значениями 1, 6, 7 создает имена признаков `X_1, X_6, X_7`. .. versionadded:: 1.3	'concat'

	преобразователи transformers: список кортежей Список кортежей (имя, transformer, столбцы), определяющих объекты трансформеров, которые должны быть применены к подмножествам данных. name : str Как и в Pipeline и FeatureUnion, это позволяет преобразователю и его параметры могут быть установлены с помощью ``set_params`` и найдены в сетке поиск. transformer: {'drop', 'passthrough'} или estimator Оценщик должен поддерживать :term:`fit` и :term:`transform`. Специальные строки 'drop' и 'passthrough' принимаются как хорошо, чтобы указать, удалить столбцы или пропустить их непреобразованные, соответственно. столбцы : str, массив строк, int, массив int, массив bool, срез или вызываемый объект Индексирует данные по второй оси. Целые числа интерпретируются как позиционные столбцы, в то время как строки могут ссылаться на столбцы DataFrame по имени. Скалярная строка или целое число должны использоваться там, где ``transformer`` ожидает, что X будет одномерным array-like (вектором), иначе в преобразователь будет передан двумерный массив. Вызываемый объект получает входные данные `X` и может возвращать любой из выше. Чтобы выбрать несколько столбцов по имени или типу данных, можно использовать :obj:`make_column_selector`.	[('cat', ...), ('num', ...)]
	остаток остаток: {'drop', 'passthrough'} или оценщик, по умолчанию='drop' По умолчанию только указанные столбцы в `transformers` являются преобразованы и объединены в выходных данных, а не указанные столбцы удаляются. (по умолчанию ``'drop'``). Указав ``remainder='passthrough'``, все оставшиеся столбцы, которые не были указаны в `transformers`, но присутствуют в переданных данных к `fit` будут автоматически переданы. Это подмножество столбцов объединяется с выходом преобразователей. Для датафреймов, дополнительные столбцы, не встречавшиеся во время `fit`, будут исключены из вывода `transform`. Установив ``remainder`` в качестве оценщика, оставшиеся неуказанные столбцы будут использовать оценщик ``remainder``. оценщик должен поддерживать :term:`fit` и :term:`transform`. Обратите внимание, что использование этой функции требует, чтобы столбцы DataFrame входные данные в :term:`fit` и :term:`transform` имеют одинаковый порядок.	'drop'
	sparse_threshold sparse_threshold: float, default=0.3 Если выход разных преобразователей содержит разреженные матрицы, они будут сложены в разреженную матрицу, если общая плотность составляет ниже этого значения. Используйте ``sparse_threshold=0``, чтобы всегда возвращать плотный. Когда преобразованный вывод состоит из всех плотных данных, результат будет плотным, и этот ключевой параметр будет проигнорирован.	1
	n_jobs n_jobs: int, default=None Количество параллельно выполняемых задач. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации.	None
	transformer_weights transformer_weights: dict, по умолчанию=None Мультипликативные веса для признаков на трансформер. Выходные данные преобразователь умножается на эти веса. Ключи — это имена преобразователей, значения весов.	None
	verbose verbose: bool, default=False Если True, затраченное время на подгонку каждого трансформатора будет печатается по завершении.	False
	verbose_feature_names_out verbose_feature_names_out: bool, str или Callable[[str, str], str], default=True - Если True, :meth:`ColumnTransformer.get_feature_names_out` добавит префикс все имена признаков с именем преобразователя, который их сгенерировал признак. Эквивалентно установке `verbose_feature_names_out="{transformer_name}__{feature_name}"`. - Если False, :meth:`ColumnTransformer.get_feature_names_out` не будет добавляет префикс к любым именам признаков и вызовет ошибку, если имена признаков отсутствуют уникальные. - Если ``Callable[[str, str], str]``, :meth:`ColumnTransformer.get_feature_names_out` переименует все признаки используя имя преобразователя. Первый аргумент вызываемого объекта - это имя трансформера и второй аргумент — имя признака. Возвращаемый строка будет новым именем признака. - Если ``str``, это должна быть строка, готовая к форматированию. Данная строка будет должны форматироваться с использованием двух имен полей: ``transformer_name`` и ``feature_name``. например, ``"{feature_name}__{transformer_name}"``. См. метод :meth:`str.format` из стандартной библиотеки для получения дополнительной информации. .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` может быть вызываемым объектом или строкой для форматирования.	False
	force_int_remainder_cols force_int_remainder_cols: bool, default=False Этот параметр не оказывает влияния. .. примечание:: Если вы не обращаетесь к списку столбцов для оставшихся столбцов в атрибуте `transformers_` после обучения, вам не нужно устанавливать этот параметр. .. versionadded:: 1.5 .. versionchanged:: 1.7 Значение по умолчанию для `force_int_remainder_cols` изменится с с `True` на `False` в версии 1.7. .. устарело:: 1.7 `force_int_remainder_cols` устарел и будет удалён в версии 1.9.	'устаревший'

	категории категории: 'auto' или список массивоподобных объектов, по умолчанию='auto' Категории (уникальные значения) для каждого признака: - 'auto' : Автоматически определять категории из обучающих данных. - список: ``categories[i]`` содержит категории, ожидаемые в i-м столбец. Переданные категории не должны смешивать строки и числа значений и должны быть отсортированы в случае числовых значений. Используемые категории можно найти в атрибуте ``categories_``.	'auto'
	dtype dtype: number type, default=np.float64 Желаемый тип данных выходных данных.
	handle_unknown handle_unknown: {'error', 'use_encoded_value'}, default='error' Когда установлено значение 'error', будет вызвана ошибка в случае неизвестного категориальный признак присутствует во время transform. Когда установлено в 'use_encoded_value', закодированное значение неизвестных категорий будет установлено в значение, заданное для параметра `unknown_value`. В :meth:`inverse_transform`, неизвестная категория будет обозначена как None. .. versionadded:: 0.24	'error'
	unknown_value unknown_value: int или np.nan, по умолчанию=None Когда параметр handle_unknown установлен в 'use_encoded_value', это параметр обязателен и установит закодированное значение неизвестного категории. Он должен отличаться от значений, используемых для кодирования любой из категории в `fit`. Если установлено в np.nan, параметр `dtype` должен должен быть типом данных float. .. versionadded:: 0.24	None
	encoded_missing_value encoded_missing_value: int или np.nan, по умолчанию=np.nan Закодированное значение отсутствующих категорий. Если установлено в `np.nan`, то `dtype` параметр должен иметь тип данных float. .. versionadded:: 1.1	nan
	min_frequency min_frequency: int или float, по умолчанию=None Определяет минимальную частоту, ниже которой категория будет считается редким. - Если `int`, категории с меньшей мощностью будут считаться редко. - Если `float`, категории с меньшей мощностью, чем `min_frequency * n_samples` будет считаться нечастым. .. versionadded:: 1.3 Подробнее в :ref:`Руководстве пользователя `.	None
	max_categories max_categories: int, default=None Задаёт верхний предел количества выходных категорий для каждого входного особенность при рассмотрении редких категорий. Если есть редкие категории, `max_categories` включает категорию, представляющую редкие категории вместе с частыми категориями. Если `None`, нет ограничения на количество выходных признаков. `max_categories` не учитывают пропущенные или неизвестные категории. Установка `unknown_value` или `encoded_missing_value` в целое число будет увеличивать количество уникальных целочисленных кодов на один каждый раз. Это может привести к кодам целых чисел вплоть до `max_categories + 2`. .. versionadded:: 1.3 Подробнее в :ref:`Руководстве пользователя `.	None

Графики частичной зависимости и индивидуального условного ожидания#

Препроцессор для моделей машинного обучения#

Препроцессор для модели нейронной сети#

Препроцессор для модели градиентного бустинга#

1-сторонняя частичная зависимость с разными моделями#

Многослойный перцептрон#

Градиентный бустинг#

Анализ графиков#

ICE против PDP#

2D графики взаимодействий#

3D-представление#

Пользовательские точки инспекции#

Эта страница

Графики частичной зависимости и индивидуального условного ожидания#

Предобработка набора данных о прокате велосипедов#

Препроцессор для моделей машинного обучения#

Препроцессор для модели нейронной сети#

Препроцессор для модели градиентного бустинга#

1-сторонняя частичная зависимость с разными моделями#

Многослойный перцептрон#

Градиентный бустинг#

Анализ графиков#

ICE против PDP#

2D графики взаимодействий#

3D-представление#

Пользовательские точки инспекции#

Эта страница