PolynomialCountSketch#

класс sklearn.kernel_approximation.PolynomialCountSketch(*, gamma=1.0, степень=2, coef0=0, n_components=100, random_state=None)[источник]#

Аппроксимация полиномиального ядра с помощью Tensor Sketch.

Реализует Tensor Sketch, который аппроксимирует карту признаков полиномиального ядра:

K(X, Y) = (gamma * <X, Y> + coef0)^degree

путем эффективного вычисления Count Sketch внешнего произведения вектора с самим собой с использованием быстрых преобразований Фурье (FFT). Подробнее в Руководство пользователя.

Добавлено в версии 0.24.

Параметры:
gammafloat, по умолчанию=1.0

Параметр полиномиального ядра, чье отображение признаков будет аппроксимировано.

степеньint, по умолчанию=2

Степень полиномиального ядра, чье отображение признаков будет аппроксимировано.

coef0int, по умолчанию=0

Постоянный член полиномиального ядра, чье отображение признаков будет аппроксимировано.

n_componentsint, по умолчанию=100

Размерность выходного пространства признаков. Обычно n_components должно быть больше количества признаков во входных выборках для достижения хорошей производительности. Оптимальный баланс между оценкой и временем выполнения обычно достигается около n_components = 10 * n_features, но это зависит от конкретного используемого набора данных.

random_stateint, экземпляр RandomState, по умолчанию=None

Определяет генерацию случайных чисел для инициализации indexHash и bitHash. Передайте int для воспроизводимых результатов при множественных вызовах функции. См. Глоссарий.

Атрибуты:
indexHash_ndarray формы (степень, n_features), dtype=int64

Массив индексов в диапазоне [0, n_components), используемый для представления 2-независимых хэш-функций для вычисления Count Sketch.

bitHash_ndarray формы (degree, n_features), dtype=float32

Массив со случайными значениями в {+1, -1}, используемый для представления 2-независимых хеш-функций для вычисления Count Sketch.

n_features_in_int

Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.

feature_names_in_ndarray формы (n_features_in_,)

Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

AdditiveChi2Sampler

Приближенное отображение признаков для аддитивного хи-квадрат ядра.

Nystroem

Приближение карты ядра с использованием подмножества обучающих данных.

RBFSampler

Аппроксимируйте карту признаков ядра RBF с использованием случайных признаков Фурье.

SkewedChi2Sampler

Приближенное отображение признаков для "скошенного хи-квадрат" ядра.

sklearn.metrics.pairwise.kernel_metrics

Список встроенных ядер.

Примеры

>>> from sklearn.kernel_approximation import PolynomialCountSketch
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> ps = PolynomialCountSketch(degree=3, random_state=1)
>>> X_features = ps.fit_transform(X)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0

Для более подробного примера использования см. Масштабируемое обучение с полиномиальной аппроксимацией ядра

fit(X, y=None)[источник]#

Обучите модель с X.

Инициализирует внутренние переменные. Методу не требуется информация о распределении данных, поэтому нас интересует только n_features в X.

Параметры:
X{array-like, sparse matrix} формы (n_samples, n_features)

Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

Возвращает:
selfobject

Возвращает сам экземпляр.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:
Xarray-like формы (n_samples, n_features)

Входные выборки.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

**fit_paramsdict

Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:
X_newndarray массив формы (n_samples, n_features_new)

Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Получить имена выходных признаков для преобразования.

Имена признаков на выходе будут иметь префикс в виде имени класса в нижнем регистре. Например, если преобразователь выводит 3 признака, то имена признаков на выходе: ["class_name0", "class_name1", "class_name2"].

Параметры:
input_featuresarray-like из str или None, по умолчанию=None

Используется только для проверки имен признаков с именами, встреченными в fit.

Возвращает:
feature_names_outndarray из str объектов

Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(X)[источник]#

Сгенерировать приближение карты признаков для X.

Параметры:
X{array-like}, форма (n_samples, n_features)

Новые данные, где n_samples это количество образцов и n_features это количество признаков.

Возвращает:
X_newarray-like, формы (n_samples, n_components)

Возвращает сам экземпляр.