pandas.DataFrame.plot.scatter#

DataFrame.plot.диаграмма рассеяния(x, y, s=None, c=None, **kwargs)[источник]#

Создать точечную диаграмму с изменяющимся размером и цветом точек маркера.

Координаты каждой точки определяются двумя столбцами датафрейма, и заполненные круги используются для представления каждой точки. Такой тип графика полезен для визуализации сложных корреляций между двумя переменными. Точки могут быть, например, естественными 2D-координатами, такими как долгота и широта на карте, или, в общем случае, любой парой метрик, которые можно построить друг против друга.

Параметры:
xint или str

Имя столбца или позиция столбца, используемые в качестве горизонтальных координат для каждой точки.

yint или str

Имя столбца или позиция столбца, используемая в качестве вертикальных координат для каждой точки.

sstr, скаляр или array-like, опционально

Размер каждой точки. Возможные значения:

  • Строка с именем столбца, который будет использоваться для размера маркера.

  • Единичный скаляр, поэтому все точки имеют одинаковый размер.

  • Последовательность скаляров, которая будет использоваться для размера каждой точки рекурсивно. Например, при передаче [2,14] размер всех точек будет либо 2, либо 14, поочередно.

cstr, int или array-like, необязательный

Цвет каждой точки. Возможные значения:

  • Одиночная строка цвета, указанная по имени, коду RGB или RGBA, например 'red' или '#a98d19'.

  • Последовательность строк цветов, указанных по имени, коду RGB или RGBA, которая будет использоваться рекурсивно для цвета каждой точки. Например, ['green','yellow'] все точки будут заполнены зеленым или желтым, поочередно.

  • Имя или позиция столбца, значения которого будут использоваться для окраски точек маркера в соответствии с цветовой картой.

**kwargs

Аргументы ключевых слов для передачи в DataFrame.plot().

Возвращает:
matplotlib.axes.Axes или numpy.ndarray из них

Смотрите также

matplotlib.pyplot.scatter

Точечная диаграмма с использованием нескольких форматов входных данных.

Примеры

Давайте посмотрим, как нарисовать точечную диаграмму, используя координаты из значений в столбцах DataFrame.

>>> df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> ax1 = df.plot.scatter(x='length',
...                       y='width',
...                       c='DarkBlue')
../../_images/pandas-DataFrame-plot-scatter-1.png

А теперь с цветом, определяемым также столбцом.

>>> ax2 = df.plot.scatter(x='length',
...                       y='width',
...                       c='species',
...                       colormap='viridis')
../../_images/pandas-DataFrame-plot-scatter-2.png