pandas.core.groupby.SeriesGroupBy.aggregate#
- SeriesGroupBy.агрегировать(функция=None, *args, движок=None, engine_kwargs=None, **kwargs)[источник]#
Агрегировать с использованием одной или нескольких операций по указанной оси.
- Параметры:
- функцияфункция, строка, список, словарь или None
Функция для агрегирования данных. Если используется функция, она должна работать либо при передаче Series, либо при передаче в Series.apply.
Допустимые комбинации:
функция
имя строковой функции
список функций и/или имён функций, например
[np.sum, 'mean']None, в этом случае
**kwargsиспользуются с именованной агрегацией. Здесь выходные данные имеют один столбец для каждого элемента в**kwargs. Имя столбца — это ключевое слово, а значение определяет агрегацию, используемую для вычисления значений в столбце.Также может принимать функцию Numba JIT с
engine='numba'указан. Только передача одной функции поддерживается этим движком.Если
'numba'выбран механизм, функция должна быть пользовательской функцией сvaluesиindexкак первый и второй аргументы соответственно в сигнатуре функции. Индекс каждой группы будет передан пользовательской функции и при необходимости доступен для использования.
Устарело с версии 2.1.0: Передача словаря устарела и вызовет ошибку в будущей версии pandas. Вместо этого передавайте список агрегаций.
- *args
Позиционные аргументы для передачи в func.
- движокstr, по умолчанию None
'cython': Запускает функцию через C-расширения из cython.'numba': Запускает функцию через JIT-скомпилированный код из numba.None: По умолчанию'cython'или глобальная установкаcompute.use_numba
- engine_kwargsdict, по умолчанию None
Для
'cython'движок, нет принятыхengine_kwargsДля
'numba'движок, движок может приниматьnopython,nogilиparallelключи словаря. Значения должны быть либоTrueилиFalse. По умолчаниюengine_kwargsдля'numba'движок это{'nopython': True, 'nogil': False, 'parallel': False}и будет применена к функции
- **kwargs
Если
funcравно None,**kwargsиспользуются для определения выходных имён и агрегаций через Named Aggregation. См.funcзапись.В противном случае, ключевые аргументы для передачи в func.
- Возвращает:
- Series
Смотрите также
Series.groupby.applyПрименить функцию func по группам и объединить результаты.
Series.groupby.transformПреобразует Series в каждой группе на основе заданной функции.
Series.aggregateАгрегировать с использованием одной или нескольких операций по указанной оси.
Примечания
При использовании
engine='numba', не будет внутреннего поведения "отката". Данные группы и индекс группы будут переданы как массивы numpy в JIT-компилированную пользовательскую функцию, и не будет предпринято попыток альтернативного выполнения.Функции, изменяющие переданный объект, могут вызывать неожиданное поведение или ошибки и не поддерживаются. См. Изменение с помощью методов пользовательских функций (UDF) для получения дополнительной информации.
Изменено в версии 1.3.0: Результирующий dtype будет отражать возвращаемое значение переданной
func, см. примеры ниже.Примеры
>>> s = pd.Series([1, 2, 3, 4])
>>> s 0 1 1 2 2 3 3 4 dtype: int64
>>> s.groupby([1, 1, 2, 2]).min() 1 1 2 3 dtype: int64
>>> s.groupby([1, 1, 2, 2]).agg('min') 1 1 2 3 dtype: int64
>>> s.groupby([1, 1, 2, 2]).agg(['min', 'max']) min max 1 1 2 2 3 4
Имена выходных столбцов можно контролировать, передавая желаемые имена столбцов и агрегации в качестве аргументов ключевых слов.
>>> s.groupby([1, 1, 2, 2]).agg( ... minimum='min', ... maximum='max', ... ) minimum maximum 1 1 2 2 3 4
Изменено в версии 1.3.0: Результирующий dtype будет отражать возвращаемое значение агрегирующей функции.
>>> s.groupby([1, 1, 2, 2]).agg(lambda x: x.astype(float).min()) 1 1.0 2 3.0 dtype: float64