maxabs_scale#

sklearn.preprocessing.maxabs_scale(X, *, ось=0, copy=True)[источник]#

Масштабируйте каждый признак до диапазона [-1, 1] без нарушения разреженности.

Этот оценщик масштабирует каждый признак индивидуально так, чтобы максимальное абсолютное значение каждого признака в обучающем наборе было 1.0.

Этот масштабатор также может применяться к разреженным матрицам CSR или CSC.

Параметры:
X{array-like, sparse matrix} формы (n_samples, n_features)

Данные.

ось{0, 1}, по умолчанию=0

Ось для масштабирования. Если 0, масштабировать каждый признак независимо, иначе (если 1) масштабировать каждый образец.

copybool, по умолчанию=True

Если False, попытаться избежать копирования и масштабировать на месте. Это не гарантирует, что всегда будет работать на месте; например, если данные являются массивом numpy с целочисленным типом данных, копия будет возвращена даже при copy=False.

Возвращает:
X_tr{ndarray, разреженная матрица} формы (n_samples, n_features)

Преобразованные данные.

Предупреждение

Риск утечки данных. Не используйте maxabs_scale если вы не знаете, что делаете. Распространённая ошибка — применять его ко всем данным до разделение на обучающую и тестовую выборки. Это сместит оценку модели, потому что информация могла бы просочиться из тестовой выборки в обучающую. В целом, мы рекомендуем использовать MaxAbsScaler внутри Pipeline чтобы предотвратить большинство рисков утечки данных: pipe = make_pipeline(MaxAbsScaler(), LogisticRegression()).

Смотрите также

MaxAbsScaler

Выполняет масштабирование до диапазона [-1, 1] с использованием API Transformer (например, как часть предобработки Pipeline).

Примечания

NaN обрабатываются как пропущенные значения: игнорируются при вычислении статистики и сохраняются во время преобразования данных.

Для сравнения различных масштабировщиков, преобразователей и нормализаторов см.: Сравнение влияния различных масштабировщиков на данные с выбросами.

Примеры

>>> from sklearn.preprocessing import maxabs_scale
>>> X = [[-2, 1, 2], [-1, 0, 1]]
>>> maxabs_scale(X, axis=0)  # scale each column independently
array([[-1. ,  1. ,  1. ],
       [-0.5,  0. ,  0.5]])
>>> maxabs_scale(X, axis=1)  # scale each row independently
array([[-1. ,  0.5,  1. ],
       [-1. ,  0. ,  1. ]])