KernelDensity#
- класс sklearn.neighbors.KernelDensity(*, bandwidth=1.0, алгоритм='auto', ядро='gaussian', метрика='euclidean', atol=0, rtol=0, breadth_first=True, leaf_size=40, metric_params=None)[источник]#
Оценка плотности ядра.
Подробнее в Руководство пользователя.
- Параметры:
- bandwidthfloat или {"scott", "silverman"}, по умолчанию=1.0
Ширина полосы ядра. Если bandwidth — это float, он определяет ширину полосы ядра. Если bandwidth — это строка, реализован один из методов оценки.
- алгоритм{‘kd_tree’, ‘ball_tree’, ‘auto’}, default=’auto’
Алгоритм дерева для использования.
- ядро{‘gaussian’, ‘tophat’, ‘epanechnikov’, ‘exponential’, ‘linear’, ‘cosine’}, по умолчанию=’gaussian’
Ядро для использования.
- метрикаstr, по умолчанию='euclidean'
Метрика для вычисления расстояния. См. документацию scipy.spatial.distance и метрики, перечисленные в
distance_metricsдля допустимых значений метрик.Не все метрики действительны для всех алгоритмов: обратитесь к документации
BallTreeиKDTree. Обратите внимание, что нормализация вывода плотности корректна только для метрики евклидова расстояния.- atolfloat, по умолчанию=0
Желаемая абсолютная погрешность результата. Большая погрешность обычно приводит к более быстрому выполнению.
- rtolfloat, по умолчанию=0
Желаемая относительная погрешность результата. Большая погрешность обычно приводит к более быстрому выполнению.
- breadth_firstbool, по умолчанию=True
Если true (по умолчанию), используйте подход в ширину к проблеме. В противном случае используйте подход в глубину.
- leaf_sizeint, по умолчанию=40
Укажите размер листа базового дерева. См.
BallTreeилиKDTreeподробности.- metric_paramsdict, по умолчанию=None
Дополнительные параметры для передачи дереву для использования с метрикой. Для получения дополнительной информации см. документацию
BallTreeилиKDTree.
- Атрибуты:
- n_features_in_int
Количество признаков, замеченных во время fit.
Добавлено в версии 0.24.
- tree_
BinaryTreeэкземпляр Алгоритм дерева для быстрых обобщенных N-точечных задач.
- feature_names_in_ndarray формы (
n_features_in_,) Имена признаков, наблюдаемых во время fit. Определено только когда
Xимеет имена признаков, которые все являются строками.- bandwidth_float
Значение ширины окна, заданное непосредственно параметром bandwidth или оцененное с использованием метода 'scott' или 'silverman'.
Добавлено в версии 1.0.
Смотрите также
sklearn.neighbors.KDTreeK-мерное дерево для быстрых обобщенных N-точечных задач.
sklearn.neighbors.BallTreeBall tree для быстрых обобщенных N-точечных задач.
Примеры
Вычислить оценку плотности гауссовского ядра с фиксированной шириной полосы.
>>> from sklearn.neighbors import KernelDensity >>> import numpy as np >>> rng = np.random.RandomState(42) >>> X = rng.random_sample((100, 3)) >>> kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X) >>> log_density = kde.score_samples(X[:3]) >>> log_density array([-1.52955942, -1.51462041, -1.60244657])
- fit(X, y=None, sample_weight=None)[источник]#
Обучить модель Kernel Density на данных.
- Параметры:
- Xarray-like формы (n_samples, n_features)
Список n_features-мерных точек данных. Каждая строка соответствует одной точке данных.
- yNone
Игнорируется. Этот параметр существует только для совместимости с
Pipeline.- sample_weightarray-like формы (n_samples,), по умолчанию=None
Список весов выборок, прикреплённых к данным X.
Добавлено в версии 0.20.
- Возвращает:
- selfobject
Возвращает сам экземпляр.
- 6332()[источник]#
Получить маршрутизацию метаданных этого объекта.
Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.
- Возвращает:
- маршрутизацияMetadataRequest
A
MetadataRequestИнкапсуляция информации о маршрутизации.
- get_params(глубокий=True)[источник]#
Получить параметры для этого оценщика.
- Параметры:
- глубокийbool, по умолчанию=True
Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.
- Возвращает:
- paramsdict
Имена параметров, сопоставленные с их значениями.
- sample(n_samples=1, random_state=None)[источник]#
Генерировать случайные выборки из модели.
В настоящее время это реализовано только для гауссова и топатового ядер.
- Параметры:
- n_samplesint, по умолчанию=1
Количество образцов для генерации.
- random_stateint, экземпляр RandomState или None, по умолчанию=None
Определяет генерацию случайных чисел, используемую для создания случайных образцов. Передайте целое число для воспроизводимых результатов при множественных вызовах функции. См. Глоссарий.
- Возвращает:
- Xarray-like формы (n_samples, n_features)
Список образцов.
- score(X, y=None)[источник]#
Вычислить общее логарифмическое правдоподобие в рамках модели.
- Параметры:
- Xarray-like формы (n_samples, n_features)
Список n_features-мерных точек данных. Каждая строка соответствует одной точке данных.
- yNone
Игнорируется. Этот параметр существует только для совместимости с
Pipeline.
- Возвращает:
- logprobfloat
Общее логарифмическое правдоподобие данных в X. Это нормализовано как плотность вероятности, поэтому значение будет низким для многомерных данных.
- score_samples(X)[источник]#
Вычислить логарифмическое правдоподобие каждого образца в модели.
- Параметры:
- Xarray-like формы (n_samples, n_features)
Массив точек для запроса. Последнее измерение должно соответствовать размерности обучающих данных (n_features).
- Возвращает:
- плотностьndarray формы (n_samples,)
Логарифм правдоподобия каждого образца в
X. Они нормализованы как плотности вероятности, поэтому значения будут низкими для многомерных данных.
- set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') KernelDensity[источник]#
Настроить, следует ли запрашивать передачу метаданных в
fitметод.Обратите внимание, что этот метод актуален только тогда, когда этот оценщик используется как под-оценщик внутри мета-оценщик и маршрутизация метаданных включена с помощью
enable_metadata_routing=True(см.sklearn.set_config). Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.Варианты для каждого параметра:
True: запрашиваются метаданные и передаютсяfitесли предоставлено. Запрос игнорируется, если метаданные не предоставлены.False: метаданные не запрашиваются, и мета-оценщик не передаст их вfit.None: метаданные не запрашиваются, и мета-оценщик выдаст ошибку, если пользователь предоставит их.str: метаданные должны передаваться мета-оценщику с этим заданным псевдонимом вместо исходного имени.
По умолчанию (
sklearn.utils.metadata_routing.UNCHANGED) сохраняет существующий запрос. Это позволяет изменять запрос для некоторых параметров, но не для других.Добавлено в версии 1.3.
- Параметры:
- sample_weightstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED
Маршрутизация метаданных для
sample_weightпараметр вfit.
- Возвращает:
- selfobject
Обновленный объект.
- set_params(**params)[источник]#
Установить параметры этого оценщика.
Метод работает как на простых оценщиках, так и на вложенных объектах (таких как
Pipeline). Последние имеют параметры видачтобы можно было обновить каждый компонент вложенного объекта.__ - Параметры:
- **paramsdict
Параметры оценщика.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.