sklearn.preprocessing#

Методы для масштабирования, центрирования, нормализации, бинаризации и другие.

Руководство пользователя. См. Предобработка данных раздел для дальнейших деталей.

Binarizer

Бинаризация данных (установка значений признаков в 0 или 1) в соответствии с порогом.

FunctionTransformer

Создает преобразователь из произвольной вызываемой функции.

KBinsDiscretizer

Бинирование непрерывных данных в интервалы.

KernelCenterer

Центрирование произвольной матрицы ядра \(K\).

LabelBinarizer

Бинаризация меток в формате one-vs-all.

LabelEncoder

Кодировать целевые метки значениями от 0 до n_classes-1.

MaxAbsScaler

Масштабировать каждый признак по его максимальному абсолютному значению.

MinMaxScaler

Преобразование признаков путем масштабирования каждого признака до заданного диапазона.

MultiLabelBinarizer

Преобразование между итерируемыми объектами и многометочным форматом.

Normalizer

Нормализовать образцы индивидуально до единичной нормы.

OneHotEncoder

Закодировать категориальные признаки как однократно закодированный числовой массив.

OrdinalEncoder

Кодирует категориальные признаки как целочисленный массив.

PolynomialFeatures

Генерирует полиномиальные и интерактивные признаки.

PowerTransformer

Применить степенное преобразование по признакам, чтобы сделать данные более похожими на гауссовы.

QuantileTransformer

Преобразование признаков с использованием информации о квантилях.

RobustScaler

Масштабирование признаков с использованием статистики, устойчивой к выбросам.

SplineTransformer

Генерация одномерных B-сплайновых базисов для признаков.

StandardScaler

Стандартизировать признаки, удаляя среднее и масштабируя до единичной дисперсии.

TargetEncoder

Кодировщик целевой переменной для регрессии и классификации.

add_dummy_feature

Дополнить набор данных дополнительным фиктивным признаком.

binarize

Булево пороговое преобразование массивоподобных объектов или разреженной матрицы scipy.sparse.

label_binarize

Бинаризация меток в формате one-vs-all.

maxabs_scale

Масштабируйте каждый признак до диапазона [-1, 1] без нарушения разреженности.

minmax_scale

Преобразование признаков путем масштабирования каждого признака до заданного диапазона.

normalize

Масштабирование входных векторов индивидуально до единичной нормы (длины вектора).

power_transform

Параметрическое, монотонное преобразование для приведения данных к более гауссовскому виду.

quantile_transform

Преобразование признаков с использованием информации о квантилях.

robust_scale

Стандартизировать набор данных вдоль любой оси.

scale

Стандартизировать набор данных вдоль любой оси.