pandas.Series.plot.kde#
- Series.plot.kde(bw_method=None, ind=None, **kwargs)[источник]#
Построение оценки плотности ядра с использованием гауссовских ядер.
В статистике, оценка плотности ядра (KDE) — непараметрический способ оценки функции плотности вероятности (PDF) случайной величины. Эта функция использует гауссовы ядра и включает автоматическое определение ширины полосы.
- Параметры:
- bw_methodstr, scalar or callable, optional
Метод, используемый для вычисления ширины полосы оценщика. Это может быть ‘scott’, ‘silverman’, скалярная константа или вызываемый объект. Если None (по умолчанию), используется ‘scott’. См.
scipy.stats.gaussian_kdeдля получения дополнительной информации.- indМассив NumPy или int, опционально
Точки оценки для оценочной PDF. Если None (по умолчанию), используются 1000 равноотстоящих точек. Если ind является массивом NumPy, то KDE вычисляется в переданных точках. Если ind является целым числом, ind используется равное количество равноотстоящих точек.
- **kwargs
Дополнительные аргументы ключевых слов задокументированы в
DataFrame.plot().
- Возвращает:
- matplotlib.axes.Axes или numpy.ndarray из них
Смотрите также
scipy.stats.gaussian_kdeПредставление оценки плотности ядра с использованием гауссовских ядер. Это функция, используемая внутри для оценки PDF.
Примеры
Для Series точек, случайно выбранных из неизвестного распределения, оценить его PDF с использованием KDE с автоматическим определением ширины полосы и построить результаты, вычисляя их в 1000 равноотстоящих точках (по умолчанию):
>>> s = pd.Series([1, 2, 2.5, 3, 3.5, 4, 5]) >>> ax = s.plot.kde()
Можно указать скалярную ширину полосы. Использование малого значения ширины полосы может привести к переобучению, в то время как использование большого значения ширины полосы может привести к недообучению:
>>> ax = s.plot.kde(bw_method=0.3)
>>> ax = s.plot.kde(bw_method=3)
Наконец, ind параметр определяет точки оценки для графика оцененной PDF:
>>> ax = s.plot.kde(ind=[1, 2, 3, 4, 5])
Для DataFrame работает аналогичным образом:
>>> df = pd.DataFrame({ ... 'x': [1, 2, 2.5, 3, 3.5, 4, 5], ... 'y': [4, 4, 4.5, 5, 5.5, 6, 6], ... }) >>> ax = df.plot.kde()
Можно указать скалярную ширину полосы. Использование малого значения ширины полосы может привести к переобучению, в то время как использование большого значения ширины полосы может привести к недообучению:
>>> ax = df.plot.kde(bw_method=0.3)
>>> ax = df.plot.kde(bw_method=3)
Наконец, ind параметр определяет точки оценки для графика оцененной PDF:
>>> ax = df.plot.kde(ind=[1, 2, 3, 4, 5, 6])