pandas.DataFrame.plot.hexbin#
- DataFrame.plot.hexbin(x, y, C=None, reduce_C_function=None, gridsize=None, **kwargs)[источник]#
Создать график гексагонального бинирования.
Создать гексагональную диаграмму рассеяния для x против y. Если C является None (по умолчанию), это гистограмма количества вхождений наблюдений в
(x[i], y[i]).Если C если указано, определяет значения в заданных координатах
(x[i], y[i]). Эти значения накапливаются для каждого шестиугольного бина и затем сокращаются в соответствии с reduce_C_function, имея в качестве значения по умолчанию функцию mean из NumPy (numpy.mean()). (Если C если указан, он также должен быть одномерной последовательностью той же длины, что и x и y, или метка столбца.)- Параметры:
- xint или str
Метка столбца или позиция для точек x.
- yint или str
Метка столбца или позиция для точек y.
- Cint или str, необязательно
Метка столбца или позиция для значения (x, y) точка.
- reduce_C_functioncallable, по умолчанию np.mean
Функция одного аргумента, которая сводит все значения в бине к одному числу (например, np.mean, np.max, np.sum, np.std).
- gridsizeint или кортеж (int, int), по умолчанию 100
Количество шестиугольников по оси x. Соответствующее количество шестиугольников по оси y выбирается так, чтобы шестиугольники были приблизительно правильными. Альтернативно, gridsize может быть кортежем из двух элементов, задающим количество шестиугольников по оси x и оси y.
- **kwargs
Дополнительные аргументы ключевых слов задокументированы в
DataFrame.plot().
- Возвращает:
- matplotlib.AxesSubplot
Модуль matplotlib
Axesна котором строится hexbin.
Смотрите также
DataFrame.plotСоздание графиков DataFrame.
matplotlib.pyplot.hexbinШестиугольная бининговая диаграмма с использованием matplotlib, функция matplotlib, которая используется внутри.
Примеры
Следующие примеры сгенерированы со случайными данными из нормального распределения.
>>> n = 10000 >>> df = pd.DataFrame({'x': np.random.randn(n), ... 'y': np.random.randn(n)}) >>> ax = df.plot.hexbin(x='x', y='y', gridsize=20)
Следующий пример использует C и np.sum как reduce_C_function. Обратите внимание, что ‘наблюдения’ значения варьируются от 1 до 5, но результирующий график показывает значения более 25. Это происходит из-за reduce_C_function.
>>> n = 500 >>> df = pd.DataFrame({ ... 'coord_x': np.random.uniform(-3, 3, size=n), ... 'coord_y': np.random.uniform(30, 50, size=n), ... 'observations': np.random.randint(1,5, size=n) ... }) >>> ax = df.plot.hexbin(x='coord_x', ... y='coord_y', ... C='observations', ... reduce_C_function=np.sum, ... gridsize=10, ... cmap="viridis")