Nystroem#

класс sklearn.kernel_approximation.Nystroem(ядро='rbf', *, gamma=None, coef0=None, степень=None, kernel_params=None, n_components=100, random_state=None, n_jobs=None)[источник]#

Приближение карты ядра с использованием подмножества обучающих данных.

Создает приближенное отображение признаков для произвольного ядра используя подмножество данных в качестве базиса.

Подробнее в Руководство пользователя.

Добавлено в версии 0.13.

Параметры:
ядроstr или callable, по умолчанию='rbf'

Ядерное отображение для аппроксимации. Вызываемый объект должен принимать два аргумента и ключевые аргументы, переданные этому объекту, как kernel_params, и должен возвращать число с плавающей точкой.

gammafloat, по умолчанию=None

Параметр Gamma для RBF, лапласиана, полинома, экспоненциального chi2 и сигмоидных ядер. Интерпретация значения по умолчанию оставлена на усмотрение ядра; см. документацию sklearn.metrics.pairwise. Игнорируется другими ядрами.

coef0float, по умолчанию=None

Нулевой коэффициент для полиномиальных и сигмоидных ядер. Игнорируется другими ядрами.

степеньfloat, по умолчанию=None

Степень полиномиального ядра. Игнорируется другими ядрами.

kernel_paramsdict, по умолчанию=None

Дополнительные параметры (ключевые аргументы) для функции ядра, передаваемые как вызываемый объект.

n_componentsint, по умолчанию=100

Количество признаков для построения. Сколько точек данных будет использовано для построения отображения.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Генератор псевдослучайных чисел для управления равномерной выборкой без возвращения n_components обучающих данных для построения базового ядра. Передайте целое число для воспроизводимого вывода при множественных вызовах функции. См. Глоссарий.

n_jobsint, default=None

Количество заданий для вычисления. Это работает путем разбиения матрицы ядра на n_jobs равномерные срезы и вычислять их параллельно.

None означает 1, если только не в joblib.parallel_backend контекст. -1 означает использование всех процессоров. См. Глоссарий для получения дополнительной информации.

Добавлено в версии 0.24.

Атрибуты:
components_ndarray формы (n_components, n_features)

Подмножество обучающих точек, используемых для построения карты признаков.

component_indices_ndarray формы (n_components)

Индексы components_ в обучающем наборе.

normalization_ndarray формы (n_components, n_components)

Матрица нормализации, необходимая для встраивания. Квадратный корень из матрицы ядра на components_.

n_features_in_int

Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.

feature_names_in_ndarray формы (n_features_in_,)

Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

AdditiveChi2Sampler

Приближенное отображение признаков для аддитивного хи-квадрат ядра.

PolynomialCountSketch

Аппроксимация полиномиального ядра с помощью Tensor Sketch.

RBFSampler

Аппроксимируйте карту признаков ядра RBF с использованием случайных признаков Фурье.

SkewedChi2Sampler

Приближенное отображение признаков для "скошенного хи-квадрат" ядра.

sklearn.metrics.pairwise.kernel_metrics

Список встроенных ядер.

Ссылки

  • Williams, C.K.I. and Seeger, M. “Using the Nystroem method to speed up kernel machines”, Advances in neural information processing systems 2001

  • T. Yang, Y. Li, M. Mahdavi, R. Jin и Z. Zhou "Метод Нистрёма против случайных фурье-признаков: теоретическое и эмпирическое сравнение", Advances in Neural Information Processing Systems 2012

Примеры

>>> from sklearn import datasets, svm
>>> from sklearn.kernel_approximation import Nystroem
>>> X, y = datasets.load_digits(n_class=9, return_X_y=True)
>>> data = X / 16.
>>> clf = svm.LinearSVC()
>>> feature_map_nystroem = Nystroem(gamma=.2,
...                                 random_state=1,
...                                 n_components=300)
>>> data_transformed = feature_map_nystroem.fit_transform(data)
>>> clf.fit(data_transformed, y)
LinearSVC()
>>> clf.score(data_transformed, y)
0.9987...
fit(X, y=None)[источник]#

Обучить оценщик на данных.

Выбирает подмножество обучающих точек, вычисляет ядро на них и вычисляет матрицу нормализации.

Параметры:
Xarray-like, shape (n_samples, n_features)

Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.

yarray-like, shape (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

Возвращает:
selfobject

Возвращает сам экземпляр.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:
Xarray-like формы (n_samples, n_features)

Входные выборки.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

**fit_paramsdict

Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:
X_newndarray массив формы (n_samples, n_features_new)

Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Имена признаков на выходе будут иметь префикс в виде имени класса в нижнем регистре. Например, если преобразователь выводит 3 признака, то имена признаков на выходе: ["class_name0", "class_name1", "class_name2"].

Параметры:
input_featuresarray-like из str или None, по умолчанию=None

Используется только для проверки имен признаков с именами, встреченными в fit.

Возвращает:
feature_names_outndarray из str объектов

Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(X)[источник]#

Применить отображение признаков к X.

Вычисляет приближенное отображение признаков с использованием ядра между некоторыми точками обучения и X.

Параметры:
Xarray-like формы (n_samples, n_features)

Данные для преобразования.

Возвращает:
X_transformedndarray формы (n_samples, n_components)

Преобразованные данные.