maxabs_scale#
- sklearn.preprocessing.maxabs_scale(X, *, ось=0, copy=True)[источник]#
Масштабируйте каждый признак до диапазона [-1, 1] без нарушения разреженности.
Этот оценщик масштабирует каждый признак индивидуально так, чтобы максимальное абсолютное значение каждого признака в обучающем наборе было 1.0.
Этот масштабатор также может применяться к разреженным матрицам CSR или CSC.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Данные.
- ось{0, 1}, по умолчанию=0
Ось для масштабирования. Если 0, масштабировать каждый признак независимо, иначе (если 1) масштабировать каждый образец.
- copybool, по умолчанию=True
Если False, попытаться избежать копирования и масштабировать на месте. Это не гарантирует, что всегда будет работать на месте; например, если данные являются массивом numpy с целочисленным типом данных, копия будет возвращена даже при copy=False.
- Возвращает:
- X_tr{ndarray, разреженная матрица} формы (n_samples, n_features)
Преобразованные данные.
Предупреждение
Риск утечки данных. Не используйте
maxabs_scaleесли вы не знаете, что делаете. Распространённая ошибка — применять его ко всем данным до разделение на обучающую и тестовую выборки. Это сместит оценку модели, потому что информация могла бы просочиться из тестовой выборки в обучающую. В целом, мы рекомендуем использоватьMaxAbsScalerвнутри Pipeline чтобы предотвратить большинство рисков утечки данных:pipe = make_pipeline(MaxAbsScaler(), LogisticRegression()).
Смотрите также
MaxAbsScalerВыполняет масштабирование до диапазона [-1, 1] с использованием API Transformer (например, как часть предобработки
Pipeline).
Примечания
NaN обрабатываются как пропущенные значения: игнорируются при вычислении статистики и сохраняются во время преобразования данных.
Для сравнения различных масштабировщиков, преобразователей и нормализаторов см.: Сравнение влияния различных масштабировщиков на данные с выбросами.
Примеры
>>> from sklearn.preprocessing import maxabs_scale >>> X = [[-2, 1, 2], [-1, 0, 1]] >>> maxabs_scale(X, axis=0) # scale each column independently array([[-1. , 1. , 1. ], [-0.5, 0. , 0.5]]) >>> maxabs_scale(X, axis=1) # scale each row independently array([[-1. , 0.5, 1. ], [-1. , 0. , 1. ]])