GroupBy#

pandas.api.typing.DataFrameGroupBy и pandas.api.typing.SeriesGroupBy экземпляры возвращаются вызовами groupby pandas.DataFrame.groupby() и pandas.Series.groupby() соответственно.

Индексирование, итерация#

`DataFrameGroupBy.__iter__`()	Итератор Groupby.
`SeriesGroupBy.__iter__`()	Итератор Groupby.
`DataFrameGroupBy.groups`	Словарь {имя группы -> метки группы}.
`SeriesGroupBy.groups`	Словарь {имя группы -> метки группы}.
`DataFrameGroupBy.indices`	Словарь {имя группы -> индексы группы}.
`SeriesGroupBy.indices`	Словарь {имя группы -> индексы группы}.
`DataFrameGroupBy.get_group`(name[, obj])	Создать DataFrame из группы с предоставленным именем.
`SeriesGroupBy.get_group`(name[, obj])	Создать DataFrame из группы с предоставленным именем.

Grouper(*args, **kwargs)

Grouper позволяет пользователю указать инструкцию группировки для объекта.

Помощник применения функции#

NamedAgg(столбец, aggfunc)

Вспомогательная функция для агрегации по столбцам с контролем над именами выходных столбцов.

Применение функций#

`SeriesGroupBy.apply`(func, args, *kwargs)	Применить функцию `func` по группам и объединить результаты вместе.
`DataFrameGroupBy.apply`(func, *args[, ...])	Применить функцию `func` по группам и объединить результаты вместе.
`SeriesGroupBy.agg`([func, engine, engine_kwargs])	Агрегировать с использованием одной или нескольких операций по указанной оси.
`DataFrameGroupBy.agg`([func, engine, ...])	Агрегировать с использованием одной или нескольких операций по указанной оси.
`SeriesGroupBy.aggregate`([func, engine, ...])	Агрегировать с использованием одной или нескольких операций по указанной оси.
`DataFrameGroupBy.aggregate`([func, engine, ...])	Агрегировать с использованием одной или нескольких операций по указанной оси.
`SeriesGroupBy.transform`(func, *args[, ...])	Вызовите функцию, создающую Series с тем же индексом для каждой группы.
`DataFrameGroupBy.transform`(func, *args[, ...])	Вызвать функцию, создающую DataFrame с тем же индексом, для каждой группы.
`SeriesGroupBy.pipe`(func, args, *kwargs)	Применить `func` с аргументами для этого объекта GroupBy и возвращает его результат.
`DataFrameGroupBy.pipe`(func, args, *kwargs)	Применить `func` с аргументами для этого объекта GroupBy и возвращает его результат.
`DataFrameGroupBy.filter`(func[, dropna])	Фильтровать элементы из групп, которые не удовлетворяют критерию.
`SeriesGroupBy.filter`(func[, dropna])	Фильтровать элементы из групп, которые не удовлетворяют критерию.

`DataFrameGroupBy` вычисления / описательная статистика#

`DataFrameGroupBy.all`([skipna])	Возвращает True, если все значения в группе истинны, иначе False.
`DataFrameGroupBy.any`([skipna])	Возвращает True, если любое значение в группе истинно, иначе False.
`DataFrameGroupBy.bfill`([limit])	Обратное заполнение значений.
`DataFrameGroupBy.corr`([method, min_periods, ...])	Вычисляет попарную корреляцию столбцов, исключая значения NA/null.
`DataFrameGroupBy.corrwith`(other[, axis, ...])	Вычислить попарную корреляцию.
`DataFrameGroupBy.count`()	Вычисление количества групп, исключая пропущенные значения.
`DataFrameGroupBy.cov`([min_periods, ddof, ...])	Вычислить попарную ковариацию столбцов, исключая значения NA/null.
`DataFrameGroupBy.cumcount`([ascending])	Нумеровать каждый элемент в каждой группе от 0 до длины этой группы - 1.
`DataFrameGroupBy.cummax`([axis, numeric_only])	Накопленный максимум для каждой группы.
`DataFrameGroupBy.cummin`([axis, numeric_only])	Кумулятивный минимум для каждой группы.
`DataFrameGroupBy.cumprod`([axis])	Кумулятивное произведение для каждой группы.
`DataFrameGroupBy.cumsum`([axis])	Накопленная сумма для каждой группы.
`DataFrameGroupBy.describe`([процентили, ...])	Генерация описательной статистики.
`DataFrameGroupBy.diff`([periods, axis])	Первая дискретная разность элемента.
`DataFrameGroupBy.ffill`([limit])	Заполнить значения вперед.
`DataFrameGroupBy.fillna`([value, method, ...])	(УСТАРЕЛО) Заполнение значений NA/NaN с использованием указанного метода внутри групп.
`DataFrameGroupBy.first`([numeric_only, ...])	Вычислить первую запись каждого столбца в каждой группе.
`DataFrameGroupBy.head`([n])	Возвращает первые n строк каждой группы.
`DataFrameGroupBy.idxmax`([axis, skipna, ...])	Возвращает индекс первого вхождения максимума по запрошенной оси.
`DataFrameGroupBy.idxmin`([axis, skipna, ...])	Возвращает индекс первого вхождения минимума по запрошенной оси.
`DataFrameGroupBy.last`([numeric_only, ...])	Вычислить последнюю запись каждого столбца в каждой группе.
`DataFrameGroupBy.max`([numeric_only, ...])	Вычисление максимума групповых значений.
`DataFrameGroupBy.mean`([numeric_only, ...])	Вычислить среднее групп, исключая пропущенные значения.
`DataFrameGroupBy.median`([numeric_only])	Вычислить медиану групп, исключая пропущенные значения.
`DataFrameGroupBy.min`([numeric_only, ...])	Вычислить минимум значений группы.
`DataFrameGroupBy.ngroup`([ascending])	Нумерует каждую группу от 0 до количества групп - 1.
`DataFrameGroupBy.nth`	Взять n-ю строку из каждой группы, если n - целое число, иначе подмножество строк.
`DataFrameGroupBy.nunique`([dropna])	Возвращает DataFrame с количеством уникальных элементов в каждой позиции.
`DataFrameGroupBy.ohlc`()	Вычислить значения open, high, low и close для группы, исключая пропущенные значения.
`DataFrameGroupBy.pct_change`([periods, ...])	Вычисление процентного изменения каждого значения относительно предыдущей записи в группе.
`DataFrameGroupBy.prod`([numeric_only, min_count])	Вычислить произведение значений группы.
`DataFrameGroupBy.quantile`([q, ...])	Возвращает значения группы по заданному квантилю, аналогично numpy.percentile.
`DataFrameGroupBy.rank`([method, ascending, ...])	Предоставить ранг значений внутри каждой группы.
`DataFrameGroupBy.resample`(rule, *args[, ...])	Обеспечить передискретизацию при использовании TimeGrouper.
`DataFrameGroupBy.rolling`(args, *kwargs)	Возвращает скользящий группировщик, предоставляющий функциональность скользящего окна для каждой группы.
`DataFrameGroupBy.sample`([n, frac, replace, ...])	Возвращает случайную выборку элементов из каждой группы.
`DataFrameGroupBy.sem`([ddof, numeric_only])	Вычисляет стандартную ошибку среднего групп, исключая пропущенные значения.
`DataFrameGroupBy.shift`([periods, freq, ...])	Сдвинуть каждую группу на periods наблюдений.
`DataFrameGroupBy.size`()	Вычисление размеров групп.
`DataFrameGroupBy.skew`([axis, skipna, ...])	Возвращает несмещенную асимметрию внутри групп.
`DataFrameGroupBy.std`([ddof, engine, ...])	Вычисление стандартного отклонения групп, исключая пропущенные значения.
`DataFrameGroupBy.sum`([numeric_only, ...])	Вычислить сумму значений группы.
`DataFrameGroupBy.var`([ddof, engine, ...])	Вычислить дисперсию групп, исключая пропущенные значения.
`DataFrameGroupBy.tail`([n])	Возвращает последние n строк каждой группы.
`DataFrameGroupBy.take`(indices[, axis])	Возвращает элементы в заданном позиционный индексы в каждой группе.
`DataFrameGroupBy.value_counts`([subset, ...])	Возвращает Series или DataFrame, содержащие количество уникальных строк.

`SeriesGroupBy` вычисления / описательная статистика#

`SeriesGroupBy.all`([skipna])	Возвращает True, если все значения в группе истинны, иначе False.
`SeriesGroupBy.any`([skipna])	Возвращает True, если любое значение в группе истинно, иначе False.
`SeriesGroupBy.bfill`([limit])	Обратное заполнение значений.
`SeriesGroupBy.corr`(other[, method, min_periods])	Вычисление корреляции с other Series, исключая пропущенные значения.
`SeriesGroupBy.count`()	Вычисление количества групп, исключая пропущенные значения.
`SeriesGroupBy.cov`(other[, min_periods, ddof])	Вычисление ковариации с Series, исключая пропущенные значения.
`SeriesGroupBy.cumcount`([ascending])	Нумеровать каждый элемент в каждой группе от 0 до длины этой группы - 1.
`SeriesGroupBy.cummax`([axis, numeric_only])	Накопленный максимум для каждой группы.
`SeriesGroupBy.cummin`([axis, numeric_only])	Кумулятивный минимум для каждой группы.
`SeriesGroupBy.cumprod`([axis])	Кумулятивное произведение для каждой группы.
`SeriesGroupBy.cumsum`([axis])	Накопленная сумма для каждой группы.
`SeriesGroupBy.describe`([процентили, ...])	Генерация описательной статистики.
`SeriesGroupBy.diff`([periods, axis])	Первая дискретная разность элемента.
`SeriesGroupBy.ffill`([limit])	Заполнить значения вперед.
`SeriesGroupBy.fillna`([value, method, axis, ...])	(УСТАРЕЛО) Заполнение значений NA/NaN с использованием указанного метода внутри групп.
`SeriesGroupBy.first`([numeric_only, ...])	Вычислить первую запись каждого столбца в каждой группе.
`SeriesGroupBy.head`([n])	Возвращает первые n строк каждой группы.
`SeriesGroupBy.last`([numeric_only, ...])	Вычислить последнюю запись каждого столбца в каждой группе.
`SeriesGroupBy.idxmax`([axis, skipna])	Возвращает метку строки с максимальным значением.
`SeriesGroupBy.idxmin`([axis, skipna])	Возвращает метку строки минимального значения.
`SeriesGroupBy.is_monotonic_increasing`	Возвращает, являются ли значения каждой группы монотонно возрастающими.
`SeriesGroupBy.is_monotonic_decreasing`	Возвращает, являются ли значения каждой группы монотонно убывающими.
`SeriesGroupBy.max`([numeric_only, min_count, ...])	Вычисление максимума групповых значений.
`SeriesGroupBy.mean`([numeric_only, engine, ...])	Вычислить среднее групп, исключая пропущенные значения.
`SeriesGroupBy.median`([numeric_only])	Вычислить медиану групп, исключая пропущенные значения.
`SeriesGroupBy.min`([numeric_only, min_count, ...])	Вычислить минимум значений группы.
`SeriesGroupBy.ngroup`([ascending])	Нумерует каждую группу от 0 до количества групп - 1.
`SeriesGroupBy.nlargest`([n, keep])	Возвращает наибольший n элементы.
`SeriesGroupBy.nsmallest`([n, keep])	Вернуть наименьший n элементы.
`SeriesGroupBy.nth`	Взять n-ю строку из каждой группы, если n - целое число, иначе подмножество строк.
`SeriesGroupBy.nunique`([dropna])	Возвращает количество уникальных элементов в группе.
`SeriesGroupBy.unique`()	Возвращает уникальные значения для каждой группы.
`SeriesGroupBy.ohlc`()	Вычислить значения open, high, low и close для группы, исключая пропущенные значения.
`SeriesGroupBy.pct_change`([periods, ...])	Вычисление процентного изменения каждого значения относительно предыдущей записи в группе.
`SeriesGroupBy.prod`([numeric_only, min_count])	Вычислить произведение значений группы.
`SeriesGroupBy.quantile`([q, интерполяция, ...])	Возвращает значения группы по заданному квантилю, аналогично numpy.percentile.
`SeriesGroupBy.rank`([method, ascending, ...])	Предоставить ранг значений внутри каждой группы.
`SeriesGroupBy.resample`(rule, *args[, ...])	Обеспечить передискретизацию при использовании TimeGrouper.
`SeriesGroupBy.rolling`(args, *kwargs)	Возвращает скользящий группировщик, предоставляющий функциональность скользящего окна для каждой группы.
`SeriesGroupBy.sample`([n, frac, replace, ...])	Возвращает случайную выборку элементов из каждой группы.
`SeriesGroupBy.sem`([ddof, numeric_only])	Вычисляет стандартную ошибку среднего групп, исключая пропущенные значения.
`SeriesGroupBy.shift`([periods, freq, axis, ...])	Сдвинуть каждую группу на periods наблюдений.
`SeriesGroupBy.size`()	Вычисление размеров групп.
`SeriesGroupBy.skew`([axis, skipna, numeric_only])	Возвращает несмещенную асимметрию внутри групп.
`SeriesGroupBy.std`([ddof, engine, ...])	Вычисление стандартного отклонения групп, исключая пропущенные значения.
`SeriesGroupBy.sum`([numeric_only, min_count, ...])	Вычислить сумму значений группы.
`SeriesGroupBy.var`([ddof, engine, ...])	Вычислить дисперсию групп, исключая пропущенные значения.
`SeriesGroupBy.tail`([n])	Возвращает последние n строк каждой группы.
`SeriesGroupBy.take`(indices[, axis])	Возвращает элементы в заданном позиционный индексы в каждой группе.
`SeriesGroupBy.value_counts`([normalize, ...])

Построение графиков и визуализация#

`DataFrameGroupBy.boxplot`([subplots, column, ...])	Создать диаграммы размаха из данных DataFrameGroupBy.
`DataFrameGroupBy.hist`([column, by, grid, ...])	Построить гистограмму столбцов DataFrame.
`SeriesGroupBy.hist`([by, ax, grid, ...])	Строит гистограмму входного ряда с использованием matplotlib.
`DataFrameGroupBy.plot`	Создать графики Series или DataFrame.
`SeriesGroupBy.plot`	Создать графики Series или DataFrame.