Примечание
Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.
Отображение конвейеров#
Конфигурация по умолчанию для отображения пайплайна в Jupyter Notebook —
'diagram' где set_config(display='diagram'). Чтобы деактивировать HTML-представление, используйте set_config(display='text').
Чтобы увидеть более подробные шаги в визуализации конвейера, нажмите на шаги в конвейере.
# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause
Отображение конвейера с шагом предобработки и классификатором#
В этом разделе строится Pipeline с шагом предварительной обработки, StandardScaler, и классификатор,
LogisticRegression, и отображает его визуальное
представление.
from sklearn import set_config
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
steps = [
("preprocessing", StandardScaler()),
("classifier", LogisticRegression()),
]
pipe = Pipeline(steps)
Для визуализации диаграммы по умолчанию используется display='diagram'.
set_config(display="diagram")
pipe # click on the diagram below to see the details of each step
Pipeline(steps=[('preprocessing', StandardScaler()),
('classifier', LogisticRegression())])В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту. На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.
Параметры
Параметры
Параметры
Чтобы просмотреть текстовый конвейер, перейдите к display='text'.
set_config(display="text")
pipe
Pipeline(steps=[('preprocessing', StandardScaler()),
('classifier', LogisticRegression())])
Вернуть отображение по умолчанию
set_config(display="diagram")
Отображение конвейера, связывающего несколько шагов предобработки и классификатор#
В этом разделе строится Pipeline с несколькими
этапами предобработки, PolynomialFeatures и
StandardScaler, и шаг классификатора,
LogisticRegression, и отображает его визуальное
представление.
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures, StandardScaler
steps = [
("standard_scaler", StandardScaler()),
("polynomial", PolynomialFeatures(degree=3)),
("classifier", LogisticRegression(C=2.0)),
]
pipe = Pipeline(steps)
pipe # click on the diagram below to see the details of each step
Pipeline(steps=[('standard_scaler', StandardScaler()),
('polynomial', PolynomialFeatures(degree=3)),
('classifier', LogisticRegression(C=2.0))])В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту. На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.
Параметры
Параметры
Параметры
Параметры
Отображение конвейера, уменьшения размерности и классификатора#
В этом разделе строится Pipeline с шагом уменьшения размерности, PCA, классификатор, SVC, и отображает его визуальное
представление.
Pipeline(steps=[('reduce_dim', PCA(n_components=4)),
('classifier', SVC(kernel='linear'))])В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту. На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.
Параметры
Параметры
Параметры
Отображение сложного конвейера, связывающего преобразователь столбцов#
Этот раздел строит сложный Pipeline с
ColumnTransformer и классификатор,
LogisticRegression, и отображает его визуальное
представление.
import numpy as np
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline, make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler
numeric_preprocessor = Pipeline(
steps=[
("imputation_mean", SimpleImputer(missing_values=np.nan, strategy="mean")),
("scaler", StandardScaler()),
]
)
categorical_preprocessor = Pipeline(
steps=[
(
"imputation_constant",
SimpleImputer(fill_value="missing", strategy="constant"),
),
("onehot", OneHotEncoder(handle_unknown="ignore")),
]
)
preprocessor = ColumnTransformer(
[
("categorical", categorical_preprocessor, ["state", "gender"]),
("numerical", numeric_preprocessor, ["age", "weight"]),
]
)
pipe = make_pipeline(preprocessor, LogisticRegression(max_iter=500))
pipe # click on the diagram below to see the details of each step
Pipeline(steps=[('columntransformer',
ColumnTransformer(transformers=[('categorical',
Pipeline(steps=[('imputation_constant',
SimpleImputer(fill_value='missing',
strategy='constant')),
('onehot',
OneHotEncoder(handle_unknown='ignore'))]),
['state', 'gender']),
('numerical',
Pipeline(steps=[('imputation_mean',
SimpleImputer()),
('scaler',
StandardScaler())]),
['age', 'weight'])])),
('logisticregression', LogisticRegression(max_iter=500))])В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту. На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.
Параметры
Параметры
['state', 'gender']
Параметры
Параметры
['age', 'weight']
Параметры
Параметры
Параметры
Отображение поиска по сетке для конвейера с классификатором#
В этом разделе строится GridSearchCV
над Pipeline с
RandomForestClassifier и отображает его визуальное
представление.
import numpy as np
from sklearn.compose import ColumnTransformer
from sklearn.ensemble import RandomForestClassifier
from sklearn.impute import SimpleImputer
from sklearn.model_selection import GridSearchCV
from sklearn.pipeline import Pipeline, make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler
numeric_preprocessor = Pipeline(
steps=[
("imputation_mean", SimpleImputer(missing_values=np.nan, strategy="mean")),
("scaler", StandardScaler()),
]
)
categorical_preprocessor = Pipeline(
steps=[
(
"imputation_constant",
SimpleImputer(fill_value="missing", strategy="constant"),
),
("onehot", OneHotEncoder(handle_unknown="ignore")),
]
)
preprocessor = ColumnTransformer(
[
("categorical", categorical_preprocessor, ["state", "gender"]),
("numerical", numeric_preprocessor, ["age", "weight"]),
]
)
pipe = Pipeline(
steps=[("preprocessor", preprocessor), ("classifier", RandomForestClassifier())]
)
param_grid = {
"classifier__n_estimators": [200, 500],
"classifier__max_features": ["auto", "sqrt", "log2"],
"classifier__max_depth": [4, 5, 6, 7, 8],
"classifier__criterion": ["gini", "entropy"],
}
grid_search = GridSearchCV(pipe, param_grid=param_grid, n_jobs=1)
grid_search # click on the diagram below to see the details of each step
GridSearchCV(estimator=Pipeline(steps=[('preprocessor',
ColumnTransformer(transformers=[('categorical',
Pipeline(steps=[('imputation_constant',
SimpleImputer(fill_value='missing',
strategy='constant')),
('onehot',
OneHotEncoder(handle_unknown='ignore'))]),
['state',
'gender']),
('numerical',
Pipeline(steps=[('imputation_mean',
SimpleImputer()),
('scaler',
StandardScaler())]),
['age',
'weight'])])),
('classifier',
RandomForestClassifier())]),
n_jobs=1,
param_grid={'classifier__criterion': ['gini', 'entropy'],
'classifier__max_depth': [4, 5, 6, 7, 8],
'classifier__max_features': ['auto', 'sqrt', 'log2'],
'classifier__n_estimators': [200, 500]})В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту. На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.
Параметры
Параметры
['state', 'gender']
Параметры
Параметры
['age', 'weight']
Параметры
Параметры
Параметры
Общее время выполнения скрипта: (0 минут 0.139 секунд)
Связанные примеры