MaxAbsScaler#
- класс sklearn.preprocessing.MaxAbsScaler(*, copy=True, clip=False)[источник]#
Масштабировать каждый признак по его максимальному абсолютному значению.
Этот оценщик масштабирует и переводит каждый признак индивидуально так, что максимальное абсолютное значение каждого признака в обучающем наборе будет 1.0. Он не смещает/центрирует данные и, таким образом, не разрушает разреженность.
Этот масштабатор также может применяться к разреженным матрицам CSR или CSC.
MaxAbsScalerне уменьшает влияние выбросов; он только линейно масштабирует их вниз. Для примера визуализации обратитесь к Сравните MaxAbsScaler с другими масштабаторами.Добавлено в версии 0.17.
- Параметры:
- copybool, по умолчанию=True
Установите в False для выполнения масштабирования на месте и избежания копирования (если входные данные уже являются массивом numpy).
- clipbool, по умолчанию=False
Установите значение True, чтобы обрезать преобразованные значения отложенных данных до [-1, 1]. Поскольку этот параметр будет обрезать значения,
inverse_transformможет не восстановить исходные данные.Примечание
Установка
clip=Trueне предотвращает дрейф признаков (сдвиг распределения между обучающими и тестовыми данными). Преобразованные значения обрезаются до диапазона [-1, 1], что помогает избежать нежелательного поведения в моделях, чувствительных к входам вне диапазона (например, линейные модели). Используйте с осторожностью, так как обрезка может исказить распределение тестовых данных.
- Атрибуты:
- scale_ndarray формы (n_features,)
Относительное масштабирование данных для каждого признака.
Добавлено в версии 0.17: scale_ атрибут.
- max_abs_ndarray формы (n_features,)
Максимальное абсолютное значение для каждого признака.
- n_features_in_int
Количество признаков, замеченных во время fit.
Добавлено в версии 0.24.
- feature_names_in_ndarray формы (
n_features_in_,) Имена признаков, наблюдаемых во время fit. Определено только когда
Xимеет имена признаков, которые все являются строками.Добавлено в версии 1.0.
- n_samples_seen_int
Количество выборок, обработанных оценщиком. Будет сброшено при новых вызовах fit, но увеличивается при
partial_fitвызовы.
Смотрите также
maxabs_scaleкоммуникация вокруг scikit-learn
Примечания
NaN обрабатываются как пропущенные значения: игнорируются при обучении и сохраняются при преобразовании.
Примеры
>>> from sklearn.preprocessing import MaxAbsScaler >>> X = [[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]] >>> transformer = MaxAbsScaler().fit(X) >>> transformer MaxAbsScaler() >>> transformer.transform(X) array([[ 0.5, -1. , 1. ], [ 1. , 0. , 0. ], [ 0. , 1. , -0.5]])
- fit(X, y=None)[источник]#
Вычислить максимальное абсолютное значение для последующего масштабирования.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Данные, используемые для вычисления минимального и максимального значения для каждого признака, используемых для последующего масштабирования по оси признаков.
- yNone
Игнорируется.
- Возвращает:
- selfobject
Обученный масштабатор.
- fit_transform(X, y=None, **fit_params)[источник]#
Обучение на данных с последующим преобразованием.
Обучает преобразователь на
Xиyс необязательными параметрамиfit_paramsи возвращает преобразованную версиюX.- Параметры:
- Xarray-like формы (n_samples, n_features)
Входные выборки.
- yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None
Целевые значения (None для неконтролируемых преобразований).
- **fit_paramsdict
Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем
fitметод.
- Возвращает:
- X_newndarray массив формы (n_samples, n_features_new)
Преобразованный массив.
- get_feature_names_out(input_features=None)[источник]#
Получить имена выходных признаков для преобразования.
- Параметры:
- input_featuresarray-like из str или None, по умолчанию=None
Входные признаки.
Если
input_featuresявляетсяNone, затемfeature_names_in_используется как имена признаков в. Еслиfeature_names_in_не определено, тогда генерируются следующие имена входных признаков:["x0", "x1", ..., "x(n_features_in_ - 1)"].Если
input_featuresявляется массивоподобным, тогдаinput_featuresдолжен соответствоватьfeature_names_in_iffeature_names_in_определен.
- Возвращает:
- feature_names_outndarray из str объектов
То же, что и входные признаки.
- 6332()[источник]#
Получить маршрутизацию метаданных этого объекта.
Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.
- Возвращает:
- маршрутизацияMetadataRequest
A
MetadataRequestИнкапсуляция информации о маршрутизации.
- get_params(глубокий=True)[источник]#
Получить параметры для этого оценщика.
- Параметры:
- глубокийbool, по умолчанию=True
Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.
- Возвращает:
- paramsdict
Имена параметров, сопоставленные с их значениями.
- inverse_transform(X)[источник]#
Масштабировать данные обратно к исходному представлению.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Данные, которые должны быть преобразованы обратно.
- Возвращает:
- X_original{ndarray, разреженная матрица} формы (n_samples, n_features)
Преобразованный массив.
- partial_fit(X, y=None)[источник]#
Онлайн вычисление максимального абсолютного значения X для последующего масштабирования.
Весь X обрабатывается как единый пакет. Это предназначено для случаев, когда
fitнеосуществимо из-за очень большого количестваn_samplesили потому что X считывается из непрерывного потока.- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Данные, используемые для вычисления среднего и стандартного отклонения используемых для последующего масштабирования по оси признаков.
- yNone
Игнорируется.
- Возвращает:
- selfobject
Обученный масштабатор.
- set_output(*, преобразовать=None)[источник]#
Установить контейнер вывода.
См. Введение API set_output для примера использования API.
- Параметры:
- преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None
Настройка вывода
transformиfit_transform."default": Формат вывода трансформера по умолчанию"pandas": DataFrame вывод"polars": Вывод PolarsNone: Конфигурация преобразования не изменена
Добавлено в версии 1.4:
"polars"опция была добавлена.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- set_params(**params)[источник]#
Установить параметры этого оценщика.
Метод работает как на простых оценщиках, так и на вложенных объектах (таких как
Pipeline). Последние имеют параметры видачтобы можно было обновить каждый компонент вложенного объекта.__ - Параметры:
- **paramsdict
Параметры оценщика.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- преобразовать(X)[источник]#
Масштабировать данные.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Данные, которые должны быть масштабированы.
- Возвращает:
- X_tr{ndarray, разреженная матрица} формы (n_samples, n_features)
Преобразованный массив.
Примеры галереи#
Сравнение влияния различных масштабировщиков на данные с выбросами