pandas.core.groupby.SeriesGroupBy.agg#

SeriesGroupBy.agg(функция=None, *args, движок=None, engine_kwargs=None, **kwargs)[источник]#

Агрегировать с использованием одной или нескольких операций по указанной оси.

Параметры:
функцияфункция, строка, список, словарь или None

Функция для агрегирования данных. Если используется функция, она должна работать либо при передаче Series, либо при передаче в Series.apply.

Допустимые комбинации:

  • функция

  • имя строковой функции

  • список функций и/или имён функций, например [np.sum, 'mean']

  • None, в этом случае **kwargs используются с именованной агрегацией. Здесь выходные данные имеют один столбец для каждого элемента в **kwargs. Имя столбца — это ключевое слово, а значение определяет агрегацию, используемую для вычисления значений в столбце.

    Также может принимать функцию Numba JIT с engine='numba' указан. Только передача одной функции поддерживается этим движком.

    Если 'numba' выбран механизм, функция должна быть пользовательской функцией с values и index как первый и второй аргументы соответственно в сигнатуре функции. Индекс каждой группы будет передан пользовательской функции и при необходимости доступен для использования.

Устарело с версии 2.1.0: Передача словаря устарела и вызовет ошибку в будущей версии pandas. Вместо этого передавайте список агрегаций.

*args

Позиционные аргументы для передачи в func.

движокstr, по умолчанию None
  • 'cython' : Запускает функцию через C-расширения из cython.

  • 'numba' : Запускает функцию через JIT-скомпилированный код из numba.

  • None : По умолчанию 'cython' или глобальная установка compute.use_numba

engine_kwargsdict, по умолчанию None
  • Для 'cython' движок, нет принятых engine_kwargs

  • Для 'numba' движок, движок может принимать nopython, nogil и parallel ключи словаря. Значения должны быть либо True или False. По умолчанию engine_kwargs для 'numba' движок это {'nopython': True, 'nogil': False, 'parallel': False} и будет применена к функции

**kwargs
  • Если func равно None, **kwargs используются для определения выходных имён и агрегаций через Named Aggregation. См. func запись.

  • В противном случае, ключевые аргументы для передачи в func.

Возвращает:
Series

Смотрите также

Series.groupby.apply

Применить функцию func по группам и объединить результаты.

Series.groupby.transform

Преобразует Series в каждой группе на основе заданной функции.

Series.aggregate

Агрегировать с использованием одной или нескольких операций по указанной оси.

Примечания

При использовании engine='numba', не будет внутреннего поведения "отката". Данные группы и индекс группы будут переданы как массивы numpy в JIT-компилированную пользовательскую функцию, и не будет предпринято попыток альтернативного выполнения.

Функции, изменяющие переданный объект, могут вызывать неожиданное поведение или ошибки и не поддерживаются. См. Изменение с помощью методов пользовательских функций (UDF) для получения дополнительной информации.

Изменено в версии 1.3.0: Результирующий dtype будет отражать возвращаемое значение переданной func, см. примеры ниже.

Примеры

>>> s = pd.Series([1, 2, 3, 4])
>>> s
0    1
1    2
2    3
3    4
dtype: int64
>>> s.groupby([1, 1, 2, 2]).min()
1    1
2    3
dtype: int64
>>> s.groupby([1, 1, 2, 2]).agg('min')
1    1
2    3
dtype: int64
>>> s.groupby([1, 1, 2, 2]).agg(['min', 'max'])
   min  max
1    1    2
2    3    4

Имена выходных столбцов можно контролировать, передавая желаемые имена столбцов и агрегации в качестве аргументов ключевых слов.

>>> s.groupby([1, 1, 2, 2]).agg(
...     minimum='min',
...     maximum='max',
... )
   minimum  maximum
1        1        2
2        3        4

Изменено в версии 1.3.0: Результирующий dtype будет отражать возвращаемое значение агрегирующей функции.

>>> s.groupby([1, 1, 2, 2]).agg(lambda x: x.astype(float).min())
1    1.0
2    3.0
dtype: float64