GroupBy#

pandas.api.typing.DataFrameGroupBy и pandas.api.typing.SeriesGroupBy экземпляры возвращаются вызовами groupby pandas.DataFrame.groupby() и pandas.Series.groupby() соответственно.

Индексирование, итерация#

DataFrameGroupBy.__iter__()

Итератор Groupby.

SeriesGroupBy.__iter__()

Итератор Groupby.

DataFrameGroupBy.groups

Словарь {имя группы -> метки группы}.

SeriesGroupBy.groups

Словарь {имя группы -> метки группы}.

DataFrameGroupBy.indices

Словарь {имя группы -> индексы группы}.

SeriesGroupBy.indices

Словарь {имя группы -> индексы группы}.

DataFrameGroupBy.get_group(name[, obj])

Создать DataFrame из группы с предоставленным именем.

SeriesGroupBy.get_group(name[, obj])

Создать DataFrame из группы с предоставленным именем.

Grouper(*args, **kwargs)

Grouper позволяет пользователю указать инструкцию группировки для объекта.

Помощник применения функции#

NamedAgg(столбец, aggfunc)

Вспомогательная функция для агрегации по столбцам с контролем над именами выходных столбцов.

Применение функций#

SeriesGroupBy.apply(func, *args, **kwargs)

Применить функцию func по группам и объединить результаты вместе.

DataFrameGroupBy.apply(func, *args[, ...])

Применить функцию func по группам и объединить результаты вместе.

SeriesGroupBy.agg([func, engine, engine_kwargs])

Агрегировать с использованием одной или нескольких операций по указанной оси.

DataFrameGroupBy.agg([func, engine, ...])

Агрегировать с использованием одной или нескольких операций по указанной оси.

SeriesGroupBy.aggregate([func, engine, ...])

Агрегировать с использованием одной или нескольких операций по указанной оси.

DataFrameGroupBy.aggregate([func, engine, ...])

Агрегировать с использованием одной или нескольких операций по указанной оси.

SeriesGroupBy.transform(func, *args[, ...])

Вызовите функцию, создающую Series с тем же индексом для каждой группы.

DataFrameGroupBy.transform(func, *args[, ...])

Вызвать функцию, создающую DataFrame с тем же индексом, для каждой группы.

SeriesGroupBy.pipe(func, *args, **kwargs)

Применить func с аргументами для этого объекта GroupBy и возвращает его результат.

DataFrameGroupBy.pipe(func, *args, **kwargs)

Применить func с аргументами для этого объекта GroupBy и возвращает его результат.

DataFrameGroupBy.filter(func[, dropna])

Фильтровать элементы из групп, которые не удовлетворяют критерию.

SeriesGroupBy.filter(func[, dropna])

Фильтровать элементы из групп, которые не удовлетворяют критерию.

DataFrameGroupBy вычисления / описательная статистика#

DataFrameGroupBy.all([skipna])

Возвращает True, если все значения в группе истинны, иначе False.

DataFrameGroupBy.any([skipna])

Возвращает True, если любое значение в группе истинно, иначе False.

DataFrameGroupBy.bfill([limit])

Обратное заполнение значений.

DataFrameGroupBy.corr([method, min_periods, ...])

Вычисляет попарную корреляцию столбцов, исключая значения NA/null.

DataFrameGroupBy.corrwith(other[, axis, ...])

Вычислить попарную корреляцию.

DataFrameGroupBy.count()

Вычисление количества групп, исключая пропущенные значения.

DataFrameGroupBy.cov([min_periods, ddof, ...])

Вычислить попарную ковариацию столбцов, исключая значения NA/null.

DataFrameGroupBy.cumcount([ascending])

Нумеровать каждый элемент в каждой группе от 0 до длины этой группы - 1.

DataFrameGroupBy.cummax([axis, numeric_only])

Накопленный максимум для каждой группы.

DataFrameGroupBy.cummin([axis, numeric_only])

Кумулятивный минимум для каждой группы.

DataFrameGroupBy.cumprod([axis])

Кумулятивное произведение для каждой группы.

DataFrameGroupBy.cumsum([axis])

Накопленная сумма для каждой группы.

DataFrameGroupBy.describe([процентили, ...])

Генерация описательной статистики.

DataFrameGroupBy.diff([periods, axis])

Первая дискретная разность элемента.

DataFrameGroupBy.ffill([limit])

Заполнить значения вперед.

DataFrameGroupBy.fillna([value, method, ...])

(УСТАРЕЛО) Заполнение значений NA/NaN с использованием указанного метода внутри групп.

DataFrameGroupBy.first([numeric_only, ...])

Вычислить первую запись каждого столбца в каждой группе.

DataFrameGroupBy.head([n])

Возвращает первые n строк каждой группы.

DataFrameGroupBy.idxmax([axis, skipna, ...])

Возвращает индекс первого вхождения максимума по запрошенной оси.

DataFrameGroupBy.idxmin([axis, skipna, ...])

Возвращает индекс первого вхождения минимума по запрошенной оси.

DataFrameGroupBy.last([numeric_only, ...])

Вычислить последнюю запись каждого столбца в каждой группе.

DataFrameGroupBy.max([numeric_only, ...])

Вычисление максимума групповых значений.

DataFrameGroupBy.mean([numeric_only, ...])

Вычислить среднее групп, исключая пропущенные значения.

DataFrameGroupBy.median([numeric_only])

Вычислить медиану групп, исключая пропущенные значения.

DataFrameGroupBy.min([numeric_only, ...])

Вычислить минимум значений группы.

DataFrameGroupBy.ngroup([ascending])

Нумерует каждую группу от 0 до количества групп - 1.

DataFrameGroupBy.nth

Взять n-ю строку из каждой группы, если n - целое число, иначе подмножество строк.

DataFrameGroupBy.nunique([dropna])

Возвращает DataFrame с количеством уникальных элементов в каждой позиции.

DataFrameGroupBy.ohlc()

Вычислить значения open, high, low и close для группы, исключая пропущенные значения.

DataFrameGroupBy.pct_change([periods, ...])

Вычисление процентного изменения каждого значения относительно предыдущей записи в группе.

DataFrameGroupBy.prod([numeric_only, min_count])

Вычислить произведение значений группы.

DataFrameGroupBy.quantile([q, ...])

Возвращает значения группы по заданному квантилю, аналогично numpy.percentile.

DataFrameGroupBy.rank([method, ascending, ...])

Предоставить ранг значений внутри каждой группы.

DataFrameGroupBy.resample(rule, *args[, ...])

Обеспечить передискретизацию при использовании TimeGrouper.

DataFrameGroupBy.rolling(*args, **kwargs)

Возвращает скользящий группировщик, предоставляющий функциональность скользящего окна для каждой группы.

DataFrameGroupBy.sample([n, frac, replace, ...])

Возвращает случайную выборку элементов из каждой группы.

DataFrameGroupBy.sem([ddof, numeric_only])

Вычисляет стандартную ошибку среднего групп, исключая пропущенные значения.

DataFrameGroupBy.shift([periods, freq, ...])

Сдвинуть каждую группу на periods наблюдений.

DataFrameGroupBy.size()

Вычисление размеров групп.

DataFrameGroupBy.skew([axis, skipna, ...])

Возвращает несмещенную асимметрию внутри групп.

DataFrameGroupBy.std([ddof, engine, ...])

Вычисление стандартного отклонения групп, исключая пропущенные значения.

DataFrameGroupBy.sum([numeric_only, ...])

Вычислить сумму значений группы.

DataFrameGroupBy.var([ddof, engine, ...])

Вычислить дисперсию групп, исключая пропущенные значения.

DataFrameGroupBy.tail([n])

Возвращает последние n строк каждой группы.

DataFrameGroupBy.take(indices[, axis])

Возвращает элементы в заданном позиционный индексы в каждой группе.

DataFrameGroupBy.value_counts([subset, ...])

Возвращает Series или DataFrame, содержащие количество уникальных строк.

SeriesGroupBy вычисления / описательная статистика#

SeriesGroupBy.all([skipna])

Возвращает True, если все значения в группе истинны, иначе False.

SeriesGroupBy.any([skipna])

Возвращает True, если любое значение в группе истинно, иначе False.

SeriesGroupBy.bfill([limit])

Обратное заполнение значений.

SeriesGroupBy.corr(other[, method, min_periods])

Вычисление корреляции с other Series, исключая пропущенные значения.

SeriesGroupBy.count()

Вычисление количества групп, исключая пропущенные значения.

SeriesGroupBy.cov(other[, min_periods, ddof])

Вычисление ковариации с Series, исключая пропущенные значения.

SeriesGroupBy.cumcount([ascending])

Нумеровать каждый элемент в каждой группе от 0 до длины этой группы - 1.

SeriesGroupBy.cummax([axis, numeric_only])

Накопленный максимум для каждой группы.

SeriesGroupBy.cummin([axis, numeric_only])

Кумулятивный минимум для каждой группы.

SeriesGroupBy.cumprod([axis])

Кумулятивное произведение для каждой группы.

SeriesGroupBy.cumsum([axis])

Накопленная сумма для каждой группы.

SeriesGroupBy.describe([процентили, ...])

Генерация описательной статистики.

SeriesGroupBy.diff([periods, axis])

Первая дискретная разность элемента.

SeriesGroupBy.ffill([limit])

Заполнить значения вперед.

SeriesGroupBy.fillna([value, method, axis, ...])

(УСТАРЕЛО) Заполнение значений NA/NaN с использованием указанного метода внутри групп.

SeriesGroupBy.first([numeric_only, ...])

Вычислить первую запись каждого столбца в каждой группе.

SeriesGroupBy.head([n])

Возвращает первые n строк каждой группы.

SeriesGroupBy.last([numeric_only, ...])

Вычислить последнюю запись каждого столбца в каждой группе.

SeriesGroupBy.idxmax([axis, skipna])

Возвращает метку строки с максимальным значением.

SeriesGroupBy.idxmin([axis, skipna])

Возвращает метку строки минимального значения.

SeriesGroupBy.is_monotonic_increasing

Возвращает, являются ли значения каждой группы монотонно возрастающими.

SeriesGroupBy.is_monotonic_decreasing

Возвращает, являются ли значения каждой группы монотонно убывающими.

SeriesGroupBy.max([numeric_only, min_count, ...])

Вычисление максимума групповых значений.

SeriesGroupBy.mean([numeric_only, engine, ...])

Вычислить среднее групп, исключая пропущенные значения.

SeriesGroupBy.median([numeric_only])

Вычислить медиану групп, исключая пропущенные значения.

SeriesGroupBy.min([numeric_only, min_count, ...])

Вычислить минимум значений группы.

SeriesGroupBy.ngroup([ascending])

Нумерует каждую группу от 0 до количества групп - 1.

SeriesGroupBy.nlargest([n, keep])

Возвращает наибольший n элементы.

SeriesGroupBy.nsmallest([n, keep])

Вернуть наименьший n элементы.

SeriesGroupBy.nth

Взять n-ю строку из каждой группы, если n - целое число, иначе подмножество строк.

SeriesGroupBy.nunique([dropna])

Возвращает количество уникальных элементов в группе.

SeriesGroupBy.unique()

Возвращает уникальные значения для каждой группы.

SeriesGroupBy.ohlc()

Вычислить значения open, high, low и close для группы, исключая пропущенные значения.

SeriesGroupBy.pct_change([periods, ...])

Вычисление процентного изменения каждого значения относительно предыдущей записи в группе.

SeriesGroupBy.prod([numeric_only, min_count])

Вычислить произведение значений группы.

SeriesGroupBy.quantile([q, интерполяция, ...])

Возвращает значения группы по заданному квантилю, аналогично numpy.percentile.

SeriesGroupBy.rank([method, ascending, ...])

Предоставить ранг значений внутри каждой группы.

SeriesGroupBy.resample(rule, *args[, ...])

Обеспечить передискретизацию при использовании TimeGrouper.

SeriesGroupBy.rolling(*args, **kwargs)

Возвращает скользящий группировщик, предоставляющий функциональность скользящего окна для каждой группы.

SeriesGroupBy.sample([n, frac, replace, ...])

Возвращает случайную выборку элементов из каждой группы.

SeriesGroupBy.sem([ddof, numeric_only])

Вычисляет стандартную ошибку среднего групп, исключая пропущенные значения.

SeriesGroupBy.shift([periods, freq, axis, ...])

Сдвинуть каждую группу на periods наблюдений.

SeriesGroupBy.size()

Вычисление размеров групп.

SeriesGroupBy.skew([axis, skipna, numeric_only])

Возвращает несмещенную асимметрию внутри групп.

SeriesGroupBy.std([ddof, engine, ...])

Вычисление стандартного отклонения групп, исключая пропущенные значения.

SeriesGroupBy.sum([numeric_only, min_count, ...])

Вычислить сумму значений группы.

SeriesGroupBy.var([ddof, engine, ...])

Вычислить дисперсию групп, исключая пропущенные значения.

SeriesGroupBy.tail([n])

Возвращает последние n строк каждой группы.

SeriesGroupBy.take(indices[, axis])

Возвращает элементы в заданном позиционный индексы в каждой группе.

SeriesGroupBy.value_counts([normalize, ...])

Построение графиков и визуализация#

DataFrameGroupBy.boxplot([subplots, column, ...])

Создать диаграммы размаха из данных DataFrameGroupBy.

DataFrameGroupBy.hist([column, by, grid, ...])

Построить гистограмму столбцов DataFrame.

SeriesGroupBy.hist([by, ax, grid, ...])

Строит гистограмму входного ряда с использованием matplotlib.

DataFrameGroupBy.plot

Создать графики Series или DataFrame.

SeriesGroupBy.plot

Создать графики Series или DataFrame.