SkewedChi2Sampler#

класс sklearn.kernel_approximation.SkewedChi2Sampler(*, асимметрия=1.0, n_components=100, random_state=None)[источник]#

Приближенное отображение признаков для "скошенного хи-квадрат" ядра.

Подробнее в Руководство пользователя.

Параметры:
асимметрияfloat, по умолчанию=1.0

параметр "асимметрии" ядра. Требует кросс-валидации.

n_componentsint, по умолчанию=100

Количество выборок Монте-Карло на исходный признак. Равно размерности вычисленного пространства признаков.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Псевдослучайный генератор чисел для управления генерацией случайных весов и случайного смещения при обучении на тренировочных данных. Передайте целое число для воспроизводимого вывода при множественных вызовах функции. См. Глоссарий.

Атрибуты:
random_weights_ndarray формы (n_features, n_components)

Массив весов, взятый из секанс-гиперболического распределения, который будет использоваться для линейного преобразования логарифма данных.

random_offset_ndarray формы (n_features, n_components)

Смещение, которое будет добавлено к данным. Оно равномерно распределено между 0 и 2*pi.

n_features_in_int

Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.

feature_names_in_ndarray формы (n_features_in_,)

Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

AdditiveChi2Sampler

Приближенное отображение признаков для аддитивного хи-квадрат ядра.

Nystroem

Приближение карты ядра с использованием подмножества обучающих данных.

RBFSampler

Аппроксимируйте карту признаков ядра RBF с использованием случайных признаков Фурье.

SkewedChi2Sampler

Приближенное отображение признаков для "скошенного хи-квадрат" ядра.

sklearn.metrics.pairwise.chi2_kernel

Точное ядро хи-квадрат.

sklearn.metrics.pairwise.kernel_metrics

Список встроенных ядер.

Ссылки

См. "Random Fourier Approximations for Skewed Multiplicative Histogram Kernels" от Fuxin Li, Catalin Ionescu и Cristian Sminchisescu.

Примеры

>>> from sklearn.kernel_approximation import SkewedChi2Sampler
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> chi2_feature = SkewedChi2Sampler(skewedness=.01,
...                                  n_components=10,
...                                  random_state=0)
>>> X_features = chi2_feature.fit_transform(X, y)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0
fit(X, y=None)[источник]#

Обучите модель с X.

Выполняет случайное проецирование в соответствии с n_features.

Параметры:
Xarray-like, shape (n_samples, n_features)

Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.

yarray-like, shape (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

Возвращает:
selfobject

Возвращает сам экземпляр.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:
Xarray-like формы (n_samples, n_features)

Входные выборки.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

**fit_paramsdict

Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:
X_newndarray массив формы (n_samples, n_features_new)

Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Имена признаков на выходе будут иметь префикс в виде имени класса в нижнем регистре. Например, если преобразователь выводит 3 признака, то имена признаков на выходе: ["class_name0", "class_name1", "class_name2"].

Параметры:
input_featuresarray-like из str или None, по умолчанию=None

Используется только для проверки имен признаков с именами, встреченными в fit.

Возвращает:
feature_names_outndarray из str объектов

Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(X)[источник]#

Применить приближенное отображение признаков к X.

Параметры:
Xarray-like, shape (n_samples, n_features)

Новые данные, где n_samples это количество образцов и n_features — это количество признаков. Все значения X должны быть строго больше «-скошенности».

Возвращает:
X_newarray-like, формы (n_samples, n_components)

Возвращает сам экземпляр.