MaxAbsScaler#

класс sklearn.preprocessing.MaxAbsScaler(*, copy=True, clip=False)[источник]#

Масштабировать каждый признак по его максимальному абсолютному значению.

Этот оценщик масштабирует и переводит каждый признак индивидуально так, что максимальное абсолютное значение каждого признака в обучающем наборе будет 1.0. Он не смещает/центрирует данные и, таким образом, не разрушает разреженность.

Этот масштабатор также может применяться к разреженным матрицам CSR или CSC.

MaxAbsScaler не уменьшает влияние выбросов; он только линейно масштабирует их вниз. Для примера визуализации обратитесь к Сравните MaxAbsScaler с другими масштабаторами.

Добавлено в версии 0.17.

Параметры:

copybool, по умолчанию=True: Установите в False для выполнения масштабирования на месте и избежания копирования (если входные данные уже являются массивом numpy).
clipbool, по умолчанию=False: Установите значение True, чтобы обрезать преобразованные значения отложенных данных до [-1, 1]. Поскольку этот параметр будет обрезать значения, inverse_transform может не восстановить исходные данные.

Примечание

Установка clip=True не предотвращает дрейф признаков (сдвиг распределения между обучающими и тестовыми данными). Преобразованные значения обрезаются до диапазона [-1, 1], что помогает избежать нежелательного поведения в моделях, чувствительных к входам вне диапазона (например, линейные модели). Используйте с осторожностью, так как обрезка может исказить распределение тестовых данных.

Атрибуты:

scale_ndarray формы (n_features,): Относительное масштабирование данных для каждого признака.

Добавлено в версии 0.17: scale_ атрибут.
max_abs_ndarray формы (n_features,): Максимальное абсолютное значение для каждого признака.
n_features_in_int: Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.
feature_names_in_ndarray формы (n_features_in_,): Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.
n_samples_seen_int: Количество выборок, обработанных оценщиком. Будет сброшено при новых вызовах fit, но увеличивается при partial_fit вызовы.

Смотрите также

maxabs_scale: коммуникация вокруг scikit-learn

Примечания

NaN обрабатываются как пропущенные значения: игнорируются при обучении и сохраняются при преобразовании.

Примеры

>>> from sklearn.preprocessing import MaxAbsScaler
>>> X = [[ 1., -1.,  2.],
...      [ 2.,  0.,  0.],
...      [ 0.,  1., -1.]]
>>> transformer = MaxAbsScaler().fit(X)
>>> transformer
MaxAbsScaler()
>>> transformer.transform(X)
array([[ 0.5, -1. ,  1. ],
       [ 1. ,  0. ,  0. ],
       [ 0. ,  1. , -0.5]])

fit(X, y=None)[источник]#

Вычислить максимальное абсолютное значение для последующего масштабирования.

Параметры:

X{array-like, sparse matrix} формы (n_samples, n_features): Данные, используемые для вычисления минимального и максимального значения для каждого признака, используемых для последующего масштабирования по оси признаков.
yNone: Игнорируется.

Возвращает:

selfobject: Обученный масштабатор.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:

Xarray-like формы (n_samples, n_features): Входные выборки.
yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None: Целевые значения (None для неконтролируемых преобразований).
**fit_paramsdict: Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:

X_newndarray массив формы (n_samples, n_features_new): Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Параметры:

input_featuresarray-like из str или None, по умолчанию=None

Входные признаки.

Если input_features является None, затем feature_names_in_ используется как имена признаков в. Если feature_names_in_ не определено, тогда генерируются следующие имена входных признаков: ["x0", "x1", ..., "x(n_features_in_ - 1)"].
Если input_features является массивоподобным, тогда input_features должен соответствовать feature_names_in_ if feature_names_in_ определен.

Возвращает:

feature_names_outndarray из str объектов: То же, что и входные признаки.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:

маршрутизацияMetadataRequest: A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:

глубокийbool, по умолчанию=True: Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:

paramsdict: Имена параметров, сопоставленные с их значениями.

inverse_transform(X)[источник]#

Масштабировать данные обратно к исходному представлению.

Параметры:

X{array-like, sparse matrix} формы (n_samples, n_features): Данные, которые должны быть преобразованы обратно.

Возвращает:

X_original{ndarray, разреженная матрица} формы (n_samples, n_features): Преобразованный массив.

partial_fit(X, y=None)[источник]#

Онлайн вычисление максимального абсолютного значения X для последующего масштабирования.

Весь X обрабатывается как единый пакет. Это предназначено для случаев, когда fit неосуществимо из-за очень большого количества n_samples или потому что X считывается из непрерывного потока.

Параметры:

X{array-like, sparse matrix} формы (n_samples, n_features): Данные, используемые для вычисления среднего и стандартного отклонения используемых для последующего масштабирования по оси признаков.
yNone: Игнорируется.

Возвращает:

selfobject: Обученный масштабатор.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:

преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

"default": Формат вывода трансформера по умолчанию
"pandas": DataFrame вывод
"polars": Вывод Polars
None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:

**paramsdict: Параметры оценщика.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

преобразовать(X)[источник]#

Масштабировать данные.

Параметры:

X{array-like, sparse matrix} формы (n_samples, n_features): Данные, которые должны быть масштабированы.

Возвращает:

X_tr{ndarray, разреженная матрица} формы (n_samples, n_features): Преобразованный массив.

Примеры галереи#

Сравнение влияния различных масштабировщиков на данные с выбросами

MaxAbsScaler#

Примеры галереи#

Эта страница