GaussianRandomProjection#
- класс sklearn.random_projection.GaussianRandomProjection(n_components='auto', *, eps=0.1, compute_inverse_components=False, random_state=None)[источник]#
Уменьшение размерности с помощью гауссовской случайной проекции.
Компоненты случайной матрицы извлекаются из N(0, 1 / n_components).
Подробнее в Руководство пользователя.
Добавлено в версии 0.13.
- Параметры:
- n_componentsint или 'auto', по умолчанию='auto'
Размерность пространства проекции целевых переменных.
n_components может быть автоматически скорректирован в соответствии с количеством образцов в наборе данных и границей, заданной леммой Джонсона-Линденштраусса. В этом случае качество вложения контролируется
epsпараметр.Следует отметить, что лемма Джонсона-Линденштраусса может давать очень консервативные оценки требуемого количества компонентов, поскольку она не делает предположений о структуре набора данных.
- epsfloat, по умолчанию=0.1
Параметр для управления качеством вложения согласно лемме Джонсона-Линденштрауса, когда
n_componentsустановлен в 'auto'. Значение должно быть строго положительным.Меньшие значения приводят к лучшему вложению и большему количеству измерений (n_components) в целевом пространстве проекции.
- compute_inverse_componentsbool, по умолчанию=False
Изучите обратное преобразование, вычисляя псевдообратную матрицу компонентов во время обучения. Обратите внимание, что вычисление псевдообратной матрицы плохо масштабируется для больших матриц.
- random_stateint, экземпляр RandomState или None, по умолчанию=None
Управляет псевдослучайным генератором чисел, используемым для создания матрицы проекции во время обучения. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.
- Атрибуты:
- n_components_int
Конкретное количество компонентов, вычисляемое при n_components=”auto”.
- components_ndarray формы (n_components, n_features)
Случайная матрица, используемая для проекции.
- inverse_components_ndarray формы (n_features, n_components)
Псевдообратная матрица компонентов, вычисляется только если
compute_inverse_componentsравно True.Добавлено в версии 1.1.
- n_features_in_int
Количество признаков, замеченных во время fit.
Добавлено в версии 0.24.
- feature_names_in_ndarray формы (
n_features_in_,) Имена признаков, наблюдаемых во время fit. Определено только когда
Xимеет имена признаков, которые все являются строками.Добавлено в версии 1.0.
Смотрите также
SparseRandomProjectionУменьшение размерности с помощью разреженного случайного проецирования.
Примеры
>>> import numpy as np >>> from sklearn.random_projection import GaussianRandomProjection >>> rng = np.random.RandomState(42) >>> X = rng.rand(25, 3000) >>> transformer = GaussianRandomProjection(random_state=rng) >>> X_new = transformer.fit_transform(X) >>> X_new.shape (25, 2759)
- fit(X, y=None)[источник]#
Сгенерировать разреженную матрицу случайной проекции.
- Параметры:
- X{ndarray, разреженная матрица} формы (n_samples, n_features)
Обучающая выборка: только форма используется для нахождения оптимальных размеров случайной матрицы на основе теории, упомянутой в вышеуказанных статьях.
- yИгнорируется
Не используется, присутствует здесь для согласованности API по соглашению.
- Возвращает:
- selfobject
Экземпляр класса BaseRandomProjection.
- fit_transform(X, y=None, **fit_params)[источник]#
Обучение на данных с последующим преобразованием.
Обучает преобразователь на
Xиyс необязательными параметрамиfit_paramsи возвращает преобразованную версиюX.- Параметры:
- Xarray-like формы (n_samples, n_features)
Входные выборки.
- yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None
Целевые значения (None для неконтролируемых преобразований).
- **fit_paramsdict
Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем
fitметод.
- Возвращает:
- X_newndarray массив формы (n_samples, n_features_new)
Преобразованный массив.
- get_feature_names_out(input_features=None)[источник]#
Получить имена выходных признаков для преобразования.
Имена признаков на выходе будут иметь префикс в виде имени класса в нижнем регистре. Например, если преобразователь выводит 3 признака, то имена признаков на выходе:
["class_name0", "class_name1", "class_name2"].- Параметры:
- input_featuresarray-like из str или None, по умолчанию=None
Используется только для проверки имен признаков с именами, встреченными в
fit.
- Возвращает:
- feature_names_outndarray из str объектов
Преобразованные имена признаков.
- 6332()[источник]#
Получить маршрутизацию метаданных этого объекта.
Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.
- Возвращает:
- маршрутизацияMetadataRequest
A
MetadataRequestИнкапсуляция информации о маршрутизации.
- get_params(глубокий=True)[источник]#
Получить параметры для этого оценщика.
- Параметры:
- глубокийbool, по умолчанию=True
Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.
- Возвращает:
- paramsdict
Имена параметров, сопоставленные с их значениями.
- inverse_transform(X)[источник]#
Проецирование данных обратно в исходное пространство.
Возвращает массив X_original, преобразование которого дало бы X. Обратите внимание, что даже если X разрежен, X_original плотный: это может использовать много оперативной памяти.
Если
compute_inverse_componentsравно False, обратная матрица компонентов вычисляется при каждом вызовеinverse_transformчто может быть затратным.- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_components)
Данные для обратного преобразования.
- Возвращает:
- X_originalndarray формы (n_samples, n_features)
Восстановленные данные.
- set_output(*, преобразовать=None)[источник]#
Установить контейнер вывода.
См. Введение API set_output для примера использования API.
- Параметры:
- преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None
Настройка вывода
transformиfit_transform."default": Формат вывода трансформера по умолчанию"pandas": DataFrame вывод"polars": Вывод PolarsNone: Конфигурация преобразования не изменена
Добавлено в версии 1.4:
"polars"опция была добавлена.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- set_params(**params)[источник]#
Установить параметры этого оценщика.
Метод работает как на простых оценщиках, так и на вложенных объектах (таких как
Pipeline). Последние имеют параметры видачтобы можно было обновить каждый компонент вложенного объекта.__ - Параметры:
- **paramsdict
Параметры оценщика.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- преобразовать(X)[источник]#
Спроецировать данные, используя матричное произведение со случайной матрицей.
- Параметры:
- X{ndarray, разреженная матрица} формы (n_samples, n_features)
Входные данные для проецирования в пространство меньшей размерности.
- Возвращает:
- X_newndarray формы (n_samples, n_components)
Спроецированный массив.