KernelDensity#

класс sklearn.neighbors.KernelDensity(*, bandwidth=1.0, алгоритм='auto', ядро='gaussian', метрика='euclidean', atol=0, rtol=0, breadth_first=True, leaf_size=40, metric_params=None)[источник]#

Оценка плотности ядра.

Подробнее в Руководство пользователя.

Параметры:

bandwidthfloat или {"scott", "silverman"}, по умолчанию=1.0

Ширина полосы ядра. Если bandwidth — это float, он определяет ширину полосы ядра. Если bandwidth — это строка, реализован один из методов оценки.

алгоритм{‘kd_tree’, ‘ball_tree’, ‘auto’}, default=’auto’

Алгоритм дерева для использования.

ядро{‘gaussian’, ‘tophat’, ‘epanechnikov’, ‘exponential’, ‘linear’, ‘cosine’}, по умолчанию=’gaussian’

Ядро для использования.

метрикаstr, по умолчанию='euclidean'

Метрика для вычисления расстояния. См. документацию scipy.spatial.distance и метрики, перечисленные в distance_metrics для допустимых значений метрик.

Не все метрики действительны для всех алгоритмов: обратитесь к документации BallTree и KDTree. Обратите внимание, что нормализация вывода плотности корректна только для метрики евклидова расстояния.

atolfloat, по умолчанию=0

Желаемая абсолютная погрешность результата. Большая погрешность обычно приводит к более быстрому выполнению.

rtolfloat, по умолчанию=0

Желаемая относительная погрешность результата. Большая погрешность обычно приводит к более быстрому выполнению.

breadth_firstbool, по умолчанию=True

Если true (по умолчанию), используйте подход в ширину к проблеме. В противном случае используйте подход в глубину.

leaf_sizeint, по умолчанию=40

Укажите размер листа базового дерева. См. BallTree или KDTree подробности.

metric_paramsdict, по умолчанию=None

Дополнительные параметры для передачи дереву для использования с метрикой. Для получения дополнительной информации см. документацию BallTree или KDTree.

Атрибуты:

n_features_in_int: Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.
tree_BinaryTree экземпляр: Алгоритм дерева для быстрых обобщенных N-точечных задач.
feature_names_in_ndarray формы (n_features_in_,): Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.
bandwidth_float: Значение ширины окна, заданное непосредственно параметром bandwidth или оцененное с использованием метода 'scott' или 'silverman'.

Добавлено в версии 1.0.

Смотрите также

sklearn.neighbors.KDTree: K-мерное дерево для быстрых обобщенных N-точечных задач.
sklearn.neighbors.BallTree: Ball tree для быстрых обобщенных N-точечных задач.

Примеры

Вычислить оценку плотности гауссовского ядра с фиксированной шириной полосы.

>>> from sklearn.neighbors import KernelDensity
>>> import numpy as np
>>> rng = np.random.RandomState(42)
>>> X = rng.random_sample((100, 3))
>>> kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X)
>>> log_density = kde.score_samples(X[:3])
>>> log_density
array([-1.52955942, -1.51462041, -1.60244657])

fit(X, y=None, sample_weight=None)[источник]#

Обучить модель Kernel Density на данных.

Параметры:

Xarray-like формы (n_samples, n_features): Список n_features-мерных точек данных. Каждая строка соответствует одной точке данных.
yNone: Игнорируется. Этот параметр существует только для совместимости с Pipeline.
sample_weightarray-like формы (n_samples,), по умолчанию=None: Список весов выборок, прикреплённых к данным X.

Добавлено в версии 0.20.

Возвращает:

selfobject: Возвращает сам экземпляр.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:

маршрутизацияMetadataRequest: A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:

глубокийbool, по умолчанию=True: Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:

paramsdict: Имена параметров, сопоставленные с их значениями.

sample(n_samples=1, random_state=None)[источник]#

Генерировать случайные выборки из модели.

В настоящее время это реализовано только для гауссова и топатового ядер.

Параметры:

n_samplesint, по умолчанию=1: Количество образцов для генерации.
random_stateint, экземпляр RandomState или None, по умолчанию=None: Определяет генерацию случайных чисел, используемую для создания случайных образцов. Передайте целое число для воспроизводимых результатов при множественных вызовах функции. См. Глоссарий.

Возвращает:

Xarray-like формы (n_samples, n_features): Список образцов.

score(X, y=None)[источник]#

Вычислить общее логарифмическое правдоподобие в рамках модели.

Параметры:

Xarray-like формы (n_samples, n_features): Список n_features-мерных точек данных. Каждая строка соответствует одной точке данных.
yNone: Игнорируется. Этот параметр существует только для совместимости с Pipeline.

Возвращает:

logprobfloat: Общее логарифмическое правдоподобие данных в X. Это нормализовано как плотность вероятности, поэтому значение будет низким для многомерных данных.

score_samples(X)[источник]#

Вычислить логарифмическое правдоподобие каждого образца в модели.

Параметры:

Xarray-like формы (n_samples, n_features): Массив точек для запроса. Последнее измерение должно соответствовать размерности обучающих данных (n_features).

Возвращает:

плотностьndarray формы (n_samples,): Логарифм правдоподобия каждого образца в X. Они нормализованы как плотности вероятности, поэтому значения будут низкими для многомерных данных.

set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → KernelDensity[источник]#

Настроить, следует ли запрашивать передачу метаданных в fit метод.

Обратите внимание, что этот метод актуален только тогда, когда этот оценщик используется как под-оценщик внутри мета-оценщик и маршрутизация метаданных включена с помощью enable_metadata_routing=True (см. sklearn.set_config). Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Варианты для каждого параметра:

True: запрашиваются метаданные и передаются fit если предоставлено. Запрос игнорируется, если метаданные не предоставлены.
False: метаданные не запрашиваются, и мета-оценщик не передаст их в fit.
None: метаданные не запрашиваются, и мета-оценщик выдаст ошибку, если пользователь предоставит их.
str: метаданные должны передаваться мета-оценщику с этим заданным псевдонимом вместо исходного имени.

По умолчанию (sklearn.utils.metadata_routing.UNCHANGED) сохраняет существующий запрос. Это позволяет изменять запрос для некоторых параметров, но не для других.

Добавлено в версии 1.3.

Параметры:

sample_weightstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED: Маршрутизация метаданных для sample_weight параметр в fit.

Возвращает:

selfobject: Обновленный объект.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:

**paramsdict: Параметры оценщика.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

Примеры галереи#

Оценка плотности ядра

Простое одномерное ядерное сглаживание плотности

Оценка плотности ядра распределения видов

KernelDensity#

Примеры галереи#

Эта страница