make_column_selector#
- класс sklearn.compose.make_column_selector(pattern=None, *, dtype_include=None, dtype_exclude=None)[источник]#
Создать вызываемый объект для выбора столбцов для использования с
ColumnTransformer.make_column_selectorможет выбирать столбцы на основе типа данных или имени столбца с помощью регулярного выражения. При использовании нескольких критериев выбора, все критерии должны совпадать для выбора столбца.Пример использования
make_column_selectorвнутриColumnTransformerдля выбора столбцов на основе типа данных (т.е.dtype), см. Трансформер столбцов со смешанными типами.- Параметры:
- patternstr, default=None
Имена столбцов, содержащих этот шаблон регулярного выражения, будут включены. Если None, выбор столбцов не будет производиться на основе шаблона.
- dtype_includeтип данных столбца или список типов данных столбцов, по умолчанию=None
Выбор типов данных для включения. Подробнее см.
pandas.DataFrame.select_dtypes.- dtype_excludeтип данных столбца или список типов данных столбцов, по умолчанию=None
Выбор типов данных для исключения. Для получения дополнительной информации см.
pandas.DataFrame.select_dtypes.
- Возвращает:
- селекторcallable
Вызываемый объект для выбора столбцов, используемый
ColumnTransformer.
Смотрите также
ColumnTransformerКласс, позволяющий объединять выходы нескольких объектов-трансформеров, используемых на подмножествах столбцов данных, в единое пространство признаков.
Примеры
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> from sklearn.compose import make_column_selector >>> import numpy as np >>> import pandas as pd >>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'], ... 'rating': [5, 3, 4, 5]}) >>> ct = make_column_transformer( ... (StandardScaler(), ... make_column_selector(dtype_include=np.number)), # rating ... (OneHotEncoder(), ... make_column_selector(dtype_include=[object, "string"]))) # city >>> ct.fit_transform(X) array([[ 0.90453403, 1. , 0. , 0. ], [-1.50755672, 1. , 0. , 0. ], [-0.30151134, 0. , 1. , 0. ], [ 0.90453403, 0. , 0. , 1. ]])
- __call__(df)[источник]#
Вызываемый объект для выбора столбцов, используемый
ColumnTransformer.- Параметры:
- dfdataframe формы (n_features, n_samples)
DataFrame для выбора столбцов.
Примеры галереи#
Поддержка категориальных признаков в градиентном бустинге