GaussianRandomProjection#

класс sklearn.random_projection.GaussianRandomProjection(n_components='auto', *, eps=0.1, compute_inverse_components=False, random_state=None)[источник]#

Уменьшение размерности с помощью гауссовской случайной проекции.

Компоненты случайной матрицы извлекаются из N(0, 1 / n_components).

Подробнее в Руководство пользователя.

Добавлено в версии 0.13.

Параметры:
n_componentsint или 'auto', по умолчанию='auto'

Размерность пространства проекции целевых переменных.

n_components может быть автоматически скорректирован в соответствии с количеством образцов в наборе данных и границей, заданной леммой Джонсона-Линденштраусса. В этом случае качество вложения контролируется eps параметр.

Следует отметить, что лемма Джонсона-Линденштраусса может давать очень консервативные оценки требуемого количества компонентов, поскольку она не делает предположений о структуре набора данных.

epsfloat, по умолчанию=0.1

Параметр для управления качеством вложения согласно лемме Джонсона-Линденштрауса, когда n_components установлен в 'auto'. Значение должно быть строго положительным.

Меньшие значения приводят к лучшему вложению и большему количеству измерений (n_components) в целевом пространстве проекции.

compute_inverse_componentsbool, по умолчанию=False

Изучите обратное преобразование, вычисляя псевдообратную матрицу компонентов во время обучения. Обратите внимание, что вычисление псевдообратной матрицы плохо масштабируется для больших матриц.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Управляет псевдослучайным генератором чисел, используемым для создания матрицы проекции во время обучения. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Атрибуты:
n_components_int

Конкретное количество компонентов, вычисляемое при n_components=”auto”.

components_ndarray формы (n_components, n_features)

Случайная матрица, используемая для проекции.

inverse_components_ndarray формы (n_features, n_components)

Псевдообратная матрица компонентов, вычисляется только если compute_inverse_components равно True.

Добавлено в версии 1.1.

n_features_in_int

Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.

feature_names_in_ndarray формы (n_features_in_,)

Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

SparseRandomProjection

Уменьшение размерности с помощью разреженного случайного проецирования.

Примеры

>>> import numpy as np
>>> from sklearn.random_projection import GaussianRandomProjection
>>> rng = np.random.RandomState(42)
>>> X = rng.rand(25, 3000)
>>> transformer = GaussianRandomProjection(random_state=rng)
>>> X_new = transformer.fit_transform(X)
>>> X_new.shape
(25, 2759)
fit(X, y=None)[источник]#

Сгенерировать разреженную матрицу случайной проекции.

Параметры:
X{ndarray, разреженная матрица} формы (n_samples, n_features)

Обучающая выборка: только форма используется для нахождения оптимальных размеров случайной матрицы на основе теории, упомянутой в вышеуказанных статьях.

yИгнорируется

Не используется, присутствует здесь для согласованности API по соглашению.

Возвращает:
selfobject

Экземпляр класса BaseRandomProjection.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:
Xarray-like формы (n_samples, n_features)

Входные выборки.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

**fit_paramsdict

Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:
X_newndarray массив формы (n_samples, n_features_new)

Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Имена признаков на выходе будут иметь префикс в виде имени класса в нижнем регистре. Например, если преобразователь выводит 3 признака, то имена признаков на выходе: ["class_name0", "class_name1", "class_name2"].

Параметры:
input_featuresarray-like из str или None, по умолчанию=None

Используется только для проверки имен признаков с именами, встреченными в fit.

Возвращает:
feature_names_outndarray из str объектов

Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

inverse_transform(X)[источник]#

Проецирование данных обратно в исходное пространство.

Возвращает массив X_original, преобразование которого дало бы X. Обратите внимание, что даже если X разрежен, X_original плотный: это может использовать много оперативной памяти.

Если compute_inverse_components равно False, обратная матрица компонентов вычисляется при каждом вызове inverse_transform что может быть затратным.

Параметры:
X{array-like, sparse matrix} формы (n_samples, n_components)

Данные для обратного преобразования.

Возвращает:
X_originalndarray формы (n_samples, n_features)

Восстановленные данные.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(X)[источник]#

Спроецировать данные, используя матричное произведение со случайной матрицей.

Параметры:
X{ndarray, разреженная матрица} формы (n_samples, n_features)

Входные данные для проецирования в пространство меньшей размерности.

Возвращает:
X_newndarray формы (n_samples, n_components)

Спроецированный массив.