pandas.DataFrame.plot.hexbin#

DataFrame.plot.hexbin(x, y, C=None, reduce_C_function=None, gridsize=None, **kwargs)[источник]#

Создать график гексагонального бинирования.

Создать гексагональную диаграмму рассеяния для x против y. Если C является None (по умолчанию), это гистограмма количества вхождений наблюдений в (x[i], y[i]).

Если C если указано, определяет значения в заданных координатах (x[i], y[i]). Эти значения накапливаются для каждого шестиугольного бина и затем сокращаются в соответствии с reduce_C_function, имея в качестве значения по умолчанию функцию mean из NumPy (numpy.mean()). (Если C если указан, он также должен быть одномерной последовательностью той же длины, что и x и y, или метка столбца.)

Параметры:
xint или str

Метка столбца или позиция для точек x.

yint или str

Метка столбца или позиция для точек y.

Cint или str, необязательно

Метка столбца или позиция для значения (x, y) точка.

reduce_C_functioncallable, по умолчанию np.mean

Функция одного аргумента, которая сводит все значения в бине к одному числу (например, np.mean, np.max, np.sum, np.std).

gridsizeint или кортеж (int, int), по умолчанию 100

Количество шестиугольников по оси x. Соответствующее количество шестиугольников по оси y выбирается так, чтобы шестиугольники были приблизительно правильными. Альтернативно, gridsize может быть кортежем из двух элементов, задающим количество шестиугольников по оси x и оси y.

**kwargs

Дополнительные аргументы ключевых слов задокументированы в DataFrame.plot().

Возвращает:
matplotlib.AxesSubplot

Модуль matplotlib Axes на котором строится hexbin.

Смотрите также

DataFrame.plot

Создание графиков DataFrame.

matplotlib.pyplot.hexbin

Шестиугольная бининговая диаграмма с использованием matplotlib, функция matplotlib, которая используется внутри.

Примеры

Следующие примеры сгенерированы со случайными данными из нормального распределения.

>>> n = 10000
>>> df = pd.DataFrame({'x': np.random.randn(n),
...                    'y': np.random.randn(n)})
>>> ax = df.plot.hexbin(x='x', y='y', gridsize=20)
../../_images/pandas-DataFrame-plot-hexbin-1.png

Следующий пример использует C и np.sum как reduce_C_function. Обратите внимание, что ‘наблюдения’ значения варьируются от 1 до 5, но результирующий график показывает значения более 25. Это происходит из-за reduce_C_function.

>>> n = 500
>>> df = pd.DataFrame({
...     'coord_x': np.random.uniform(-3, 3, size=n),
...     'coord_y': np.random.uniform(30, 50, size=n),
...     'observations': np.random.randint(1,5, size=n)
...     })
>>> ax = df.plot.hexbin(x='coord_x',
...                     y='coord_y',
...                     C='observations',
...                     reduce_C_function=np.sum,
...                     gridsize=10,
...                     cmap="viridis")
../../_images/pandas-DataFrame-plot-hexbin-2.png