PolynomialCountSketch#
- класс sklearn.kernel_approximation.PolynomialCountSketch(*, gamma=1.0, степень=2, coef0=0, n_components=100, random_state=None)[источник]#
Аппроксимация полиномиального ядра с помощью Tensor Sketch.
Реализует Tensor Sketch, который аппроксимирует карту признаков полиномиального ядра:
K(X, Y) = (gamma * <X, Y> + coef0)^degree
путем эффективного вычисления Count Sketch внешнего произведения вектора с самим собой с использованием быстрых преобразований Фурье (FFT). Подробнее в Руководство пользователя.
Добавлено в версии 0.24.
- Параметры:
- gammafloat, по умолчанию=1.0
Параметр полиномиального ядра, чье отображение признаков будет аппроксимировано.
- степеньint, по умолчанию=2
Степень полиномиального ядра, чье отображение признаков будет аппроксимировано.
- coef0int, по умолчанию=0
Постоянный член полиномиального ядра, чье отображение признаков будет аппроксимировано.
- n_componentsint, по умолчанию=100
Размерность выходного пространства признаков. Обычно
n_componentsдолжно быть больше количества признаков во входных выборках для достижения хорошей производительности. Оптимальный баланс между оценкой и временем выполнения обычно достигается околоn_components= 10 *n_features, но это зависит от конкретного используемого набора данных.- random_stateint, экземпляр RandomState, по умолчанию=None
Определяет генерацию случайных чисел для инициализации indexHash и bitHash. Передайте int для воспроизводимых результатов при множественных вызовах функции. См. Глоссарий.
- Атрибуты:
- indexHash_ndarray формы (степень, n_features), dtype=int64
Массив индексов в диапазоне [0, n_components), используемый для представления 2-независимых хэш-функций для вычисления Count Sketch.
- bitHash_ndarray формы (degree, n_features), dtype=float32
Массив со случайными значениями в {+1, -1}, используемый для представления 2-независимых хеш-функций для вычисления Count Sketch.
- n_features_in_int
Количество признаков, замеченных во время fit.
Добавлено в версии 0.24.
- feature_names_in_ndarray формы (
n_features_in_,) Имена признаков, наблюдаемых во время fit. Определено только когда
Xимеет имена признаков, которые все являются строками.Добавлено в версии 1.0.
Смотрите также
AdditiveChi2SamplerПриближенное отображение признаков для аддитивного хи-квадрат ядра.
NystroemПриближение карты ядра с использованием подмножества обучающих данных.
RBFSamplerАппроксимируйте карту признаков ядра RBF с использованием случайных признаков Фурье.
SkewedChi2SamplerПриближенное отображение признаков для "скошенного хи-квадрат" ядра.
sklearn.metrics.pairwise.kernel_metricsСписок встроенных ядер.
Примеры
>>> from sklearn.kernel_approximation import PolynomialCountSketch >>> from sklearn.linear_model import SGDClassifier >>> X = [[0, 0], [1, 1], [1, 0], [0, 1]] >>> y = [0, 0, 1, 1] >>> ps = PolynomialCountSketch(degree=3, random_state=1) >>> X_features = ps.fit_transform(X) >>> clf = SGDClassifier(max_iter=10, tol=1e-3) >>> clf.fit(X_features, y) SGDClassifier(max_iter=10) >>> clf.score(X_features, y) 1.0
Для более подробного примера использования см. Масштабируемое обучение с полиномиальной аппроксимацией ядра
- fit(X, y=None)[источник]#
Обучите модель с X.
Инициализирует внутренние переменные. Методу не требуется информация о распределении данных, поэтому нас интересует только n_features в X.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Обучающие данные, где
n_samplesэто количество образцов иn_featuresэто количество признаков.- yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None
Целевые значения (None для неконтролируемых преобразований).
- Возвращает:
- selfobject
Возвращает сам экземпляр.
- fit_transform(X, y=None, **fit_params)[источник]#
Обучение на данных с последующим преобразованием.
Обучает преобразователь на
Xиyс необязательными параметрамиfit_paramsи возвращает преобразованную версиюX.- Параметры:
- Xarray-like формы (n_samples, n_features)
Входные выборки.
- yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None
Целевые значения (None для неконтролируемых преобразований).
- **fit_paramsdict
Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем
fitметод.
- Возвращает:
- X_newndarray массив формы (n_samples, n_features_new)
Преобразованный массив.
- get_feature_names_out(input_features=None)[источник]#
Получить имена выходных признаков для преобразования.
Имена признаков на выходе будут иметь префикс в виде имени класса в нижнем регистре. Например, если преобразователь выводит 3 признака, то имена признаков на выходе:
["class_name0", "class_name1", "class_name2"].- Параметры:
- input_featuresarray-like из str или None, по умолчанию=None
Используется только для проверки имен признаков с именами, встреченными в
fit.
- Возвращает:
- feature_names_outndarray из str объектов
Преобразованные имена признаков.
- 6332()[источник]#
Получить маршрутизацию метаданных этого объекта.
Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.
- Возвращает:
- маршрутизацияMetadataRequest
A
MetadataRequestИнкапсуляция информации о маршрутизации.
- get_params(глубокий=True)[источник]#
Получить параметры для этого оценщика.
- Параметры:
- глубокийbool, по умолчанию=True
Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.
- Возвращает:
- paramsdict
Имена параметров, сопоставленные с их значениями.
- set_output(*, преобразовать=None)[источник]#
Установить контейнер вывода.
См. Введение API set_output для примера использования API.
- Параметры:
- преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None
Настройка вывода
transformиfit_transform."default": Формат вывода трансформера по умолчанию"pandas": DataFrame вывод"polars": Вывод PolarsNone: Конфигурация преобразования не изменена
Добавлено в версии 1.4:
"polars"опция была добавлена.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- set_params(**params)[источник]#
Установить параметры этого оценщика.
Метод работает как на простых оценщиках, так и на вложенных объектах (таких как
Pipeline). Последние имеют параметры видачтобы можно было обновить каждый компонент вложенного объекта.__ - Параметры:
- **paramsdict
Параметры оценщика.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- преобразовать(X)[источник]#
Сгенерировать приближение карты признаков для X.
- Параметры:
- X{array-like}, форма (n_samples, n_features)
Новые данные, где
n_samplesэто количество образцов иn_featuresэто количество признаков.
- Возвращает:
- X_newarray-like, формы (n_samples, n_components)
Возвращает сам экземпляр.
Примеры галереи#
Масштабируемое обучение с полиномиальной аппроксимацией ядра