make_column_selector#

класс sklearn.compose.make_column_selector(pattern=None, *, dtype_include=None, dtype_exclude=None)[источник]#

Создать вызываемый объект для выбора столбцов для использования с ColumnTransformer.

make_column_selector может выбирать столбцы на основе типа данных или имени столбца с помощью регулярного выражения. При использовании нескольких критериев выбора, все критерии должны совпадать для выбора столбца.

Пример использования make_column_selector внутри ColumnTransformer для выбора столбцов на основе типа данных (т.е. dtype), см. Трансформер столбцов со смешанными типами.

Параметры:
patternstr, default=None

Имена столбцов, содержащих этот шаблон регулярного выражения, будут включены. Если None, выбор столбцов не будет производиться на основе шаблона.

dtype_includeтип данных столбца или список типов данных столбцов, по умолчанию=None

Выбор типов данных для включения. Подробнее см. pandas.DataFrame.select_dtypes.

dtype_excludeтип данных столбца или список типов данных столбцов, по умолчанию=None

Выбор типов данных для исключения. Для получения дополнительной информации см. pandas.DataFrame.select_dtypes.

Возвращает:
селекторcallable

Вызываемый объект для выбора столбцов, используемый ColumnTransformer.

Смотрите также

ColumnTransformer

Класс, позволяющий объединять выходы нескольких объектов-трансформеров, используемых на подмножествах столбцов данных, в единое пространство признаков.

Примеры

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> from sklearn.compose import make_column_selector
>>> import numpy as np
>>> import pandas as pd
>>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'],
...                   'rating': [5, 3, 4, 5]})
>>> ct = make_column_transformer(
...       (StandardScaler(),
...        make_column_selector(dtype_include=np.number)),  # rating
...       (OneHotEncoder(),
...        make_column_selector(dtype_include=[object, "string"])))  # city
>>> ct.fit_transform(X)
array([[ 0.90453403,  1.        ,  0.        ,  0.        ],
       [-1.50755672,  1.        ,  0.        ,  0.        ],
       [-0.30151134,  0.        ,  1.        ,  0.        ],
       [ 0.90453403,  0.        ,  0.        ,  1.        ]])
__call__(df)[источник]#

Вызываемый объект для выбора столбцов, используемый ColumnTransformer.

Параметры:
dfdataframe формы (n_features, n_samples)

DataFrame для выбора столбцов.