pandas.Series.plot.kde#

Series.plot.kde(bw_method=None, ind=None, **kwargs)[источник]#

Построение оценки плотности ядра с использованием гауссовских ядер.

В статистике, оценка плотности ядра (KDE) — непараметрический способ оценки функции плотности вероятности (PDF) случайной величины. Эта функция использует гауссовы ядра и включает автоматическое определение ширины полосы.

Параметры:
bw_methodstr, scalar or callable, optional

Метод, используемый для вычисления ширины полосы оценщика. Это может быть ‘scott’, ‘silverman’, скалярная константа или вызываемый объект. Если None (по умолчанию), используется ‘scott’. См. scipy.stats.gaussian_kde для получения дополнительной информации.

indМассив NumPy или int, опционально

Точки оценки для оценочной PDF. Если None (по умолчанию), используются 1000 равноотстоящих точек. Если ind является массивом NumPy, то KDE вычисляется в переданных точках. Если ind является целым числом, ind используется равное количество равноотстоящих точек.

**kwargs

Дополнительные аргументы ключевых слов задокументированы в DataFrame.plot().

Возвращает:
matplotlib.axes.Axes или numpy.ndarray из них

Смотрите также

scipy.stats.gaussian_kde

Представление оценки плотности ядра с использованием гауссовских ядер. Это функция, используемая внутри для оценки PDF.

Примеры

Для Series точек, случайно выбранных из неизвестного распределения, оценить его PDF с использованием KDE с автоматическим определением ширины полосы и построить результаты, вычисляя их в 1000 равноотстоящих точках (по умолчанию):

>>> s = pd.Series([1, 2, 2.5, 3, 3.5, 4, 5])
>>> ax = s.plot.kde()
../../_images/pandas-Series-plot-kde-1.png

Можно указать скалярную ширину полосы. Использование малого значения ширины полосы может привести к переобучению, в то время как использование большого значения ширины полосы может привести к недообучению:

>>> ax = s.plot.kde(bw_method=0.3)
../../_images/pandas-Series-plot-kde-2.png
>>> ax = s.plot.kde(bw_method=3)
../../_images/pandas-Series-plot-kde-3.png

Наконец, ind параметр определяет точки оценки для графика оцененной PDF:

>>> ax = s.plot.kde(ind=[1, 2, 3, 4, 5])
../../_images/pandas-Series-plot-kde-4.png

Для DataFrame работает аналогичным образом:

>>> df = pd.DataFrame({
...     'x': [1, 2, 2.5, 3, 3.5, 4, 5],
...     'y': [4, 4, 4.5, 5, 5.5, 6, 6],
... })
>>> ax = df.plot.kde()
../../_images/pandas-Series-plot-kde-5.png

Можно указать скалярную ширину полосы. Использование малого значения ширины полосы может привести к переобучению, в то время как использование большого значения ширины полосы может привести к недообучению:

>>> ax = df.plot.kde(bw_method=0.3)
../../_images/pandas-Series-plot-kde-6.png
>>> ax = df.plot.kde(bw_method=3)
../../_images/pandas-Series-plot-kde-7.png

Наконец, ind параметр определяет точки оценки для графика оцененной PDF:

>>> ax = df.plot.kde(ind=[1, 2, 3, 4, 5, 6])
../../_images/pandas-Series-plot-kde-8.png