AdditiveChi2Sampler#

класс sklearn.kernel_approximation.AdditiveChi2Sampler(*, sample_steps=2, sample_interval=None)[источник]#

Приближенное отображение признаков для аддитивного хи-квадрат ядра.

Использует выборку преобразования Фурье характеристик ядра через регулярные интервалы.

Поскольку аппроксимируемое ядро является аддитивным, компоненты входных векторов можно обрабатывать отдельно. Каждый элемент в исходном пространстве преобразуется в 2*sample_steps-1 признаков, где sample_steps — это параметр метода. Типичные значения sample_steps включают 1, 2 и 3.

Оптимальные значения для интервала выборки для определенных диапазонов данных могут быть вычислены (см. ссылку). Значения по умолчанию должны быть разумными.

Подробнее в Руководство пользователя.

Параметры:

sample_stepsint, по умолчанию=2: Задает количество (комплексных) точек выборки.
sample_intervalfloat, по умолчанию=None: Интервал выборки. Должен быть указан, когда sample_steps не в {1,2,3}.

Атрибуты:

n_features_in_int: Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.
feature_names_in_ndarray формы (n_features_in_,): Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

SkewedChi2Sampler: Фурье-аппроксимация неаддитивного варианта ядра хи-квадрат.
sklearn.metrics.pairwise.chi2_kernel: Точное ядро хи-квадрат.
sklearn.metrics.pairwise.additive_chi2_kernel: Точное аддитивное ядро хи-квадрат.

Примечания

Этот оценщик аппроксимирует слегка отличающуюся версию аддитивного ядра хи-квадрат, чем metric.additive_chi2 вычисляет.

Этот оценщик не имеет состояния и не требует обучения. Однако мы рекомендуем вызывать fit_transform вместо transform, так как проверка параметров выполняется только в fit.

Ссылки

См. «Эффективные аддитивные ядра через явные отображения признаков» A. Vedaldi and A. Zisserman, Pattern Analysis and Machine Intelligence, 2011

Примеры

>>> from sklearn.datasets import load_digits
>>> from sklearn.linear_model import SGDClassifier
>>> from sklearn.kernel_approximation import AdditiveChi2Sampler
>>> X, y = load_digits(return_X_y=True)
>>> chi2sampler = AdditiveChi2Sampler(sample_steps=2)
>>> X_transformed = chi2sampler.fit_transform(X, y)
>>> clf = SGDClassifier(max_iter=5, random_state=0, tol=1e-3)
>>> clf.fit(X_transformed, y)
SGDClassifier(max_iter=5, random_state=0)
>>> clf.score(X_transformed, y)
0.9499...

fit(X, y=None)[источник]#

Проверяет только параметры оценщика.

Этот метод позволяет: (i) проверить параметры оценщика и (ii) быть совместимым с API трансформеров scikit-learn.

Параметры:

Xarray-like, shape (n_samples, n_features): Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.
yarray-like, shape (n_samples,) или (n_samples, n_outputs), default=None: Целевые значения (None для неконтролируемых преобразований).

Возвращает:

selfobject: Возвращает преобразователь.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:

Xarray-like формы (n_samples, n_features): Входные выборки.
yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None: Целевые значения (None для неконтролируемых преобразований).
**fit_paramsdict: Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:

X_newndarray массив формы (n_samples, n_features_new): Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Параметры:

input_featuresarray-like из str или None, по умолчанию=None: Используется только для проверки имен признаков с именами, встреченными в fit.

Возвращает:

feature_names_outndarray из str объектов: Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:

маршрутизацияMetadataRequest: A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:

глубокийbool, по умолчанию=True: Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:

paramsdict: Имена параметров, сопоставленные с их значениями.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:

преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

"default": Формат вывода трансформера по умолчанию
"pandas": DataFrame вывод
"polars": Вывод Polars
None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:

**paramsdict: Параметры оценщика.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

преобразовать(X)[источник]#

Применить приближённое отображение признаков к X.

Параметры:

X{array-like, sparse matrix}, форма (n_samples, n_features): Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.

Возвращает:

X_new{ndarray, sparse matrix}, shape = (n_samples, n_features * (2*sample_steps - 1)): Является ли возвращаемое значение массивом или разреженной матрицей, зависит от типа входных данных X.

AdditiveChi2Sampler#

Эта страница