AdditiveChi2Sampler#

класс sklearn.kernel_approximation.AdditiveChi2Sampler(*, sample_steps=2, sample_interval=None)[источник]#

Приближенное отображение признаков для аддитивного хи-квадрат ядра.

Использует выборку преобразования Фурье характеристик ядра через регулярные интервалы.

Поскольку аппроксимируемое ядро является аддитивным, компоненты входных векторов можно обрабатывать отдельно. Каждый элемент в исходном пространстве преобразуется в 2*sample_steps-1 признаков, где sample_steps — это параметр метода. Типичные значения sample_steps включают 1, 2 и 3.

Оптимальные значения для интервала выборки для определенных диапазонов данных могут быть вычислены (см. ссылку). Значения по умолчанию должны быть разумными.

Подробнее в Руководство пользователя.

Параметры:
sample_stepsint, по умолчанию=2

Задает количество (комплексных) точек выборки.

sample_intervalfloat, по умолчанию=None

Интервал выборки. Должен быть указан, когда sample_steps не в {1,2,3}.

Атрибуты:
n_features_in_int

Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.

feature_names_in_ndarray формы (n_features_in_,)

Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

SkewedChi2Sampler

Фурье-аппроксимация неаддитивного варианта ядра хи-квадрат.

sklearn.metrics.pairwise.chi2_kernel

Точное ядро хи-квадрат.

sklearn.metrics.pairwise.additive_chi2_kernel

Точное аддитивное ядро хи-квадрат.

Примечания

Этот оценщик аппроксимирует слегка отличающуюся версию аддитивного ядра хи-квадрат, чем metric.additive_chi2 вычисляет.

Этот оценщик не имеет состояния и не требует обучения. Однако мы рекомендуем вызывать fit_transform вместо transform, так как проверка параметров выполняется только в fit.

Ссылки

См. «Эффективные аддитивные ядра через явные отображения признаков» A. Vedaldi and A. Zisserman, Pattern Analysis and Machine Intelligence, 2011

Примеры

>>> from sklearn.datasets import load_digits
>>> from sklearn.linear_model import SGDClassifier
>>> from sklearn.kernel_approximation import AdditiveChi2Sampler
>>> X, y = load_digits(return_X_y=True)
>>> chi2sampler = AdditiveChi2Sampler(sample_steps=2)
>>> X_transformed = chi2sampler.fit_transform(X, y)
>>> clf = SGDClassifier(max_iter=5, random_state=0, tol=1e-3)
>>> clf.fit(X_transformed, y)
SGDClassifier(max_iter=5, random_state=0)
>>> clf.score(X_transformed, y)
0.9499...
fit(X, y=None)[источник]#

Проверяет только параметры оценщика.

Этот метод позволяет: (i) проверить параметры оценщика и (ii) быть совместимым с API трансформеров scikit-learn.

Параметры:
Xarray-like, shape (n_samples, n_features)

Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.

yarray-like, shape (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

Возвращает:
selfobject

Возвращает преобразователь.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:
Xarray-like формы (n_samples, n_features)

Входные выборки.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

**fit_paramsdict

Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:
X_newndarray массив формы (n_samples, n_features_new)

Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Параметры:
input_featuresarray-like из str или None, по умолчанию=None

Используется только для проверки имен признаков с именами, встреченными в fit.

Возвращает:
feature_names_outndarray из str объектов

Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(X)[источник]#

Применить приближённое отображение признаков к X.

Параметры:
X{array-like, sparse matrix}, форма (n_samples, n_features)

Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.

Возвращает:
X_new{ndarray, sparse matrix}, shape = (n_samples, n_features * (2*sample_steps - 1))

Является ли возвращаемое значение массивом или разреженной матрицей, зависит от типа входных данных X.