pandas.core.groupby.DataFrameGroupBy.pipe#

DataFrameGroupBy.pipe(функция, *args, **kwargs)[источник]#

Применить func с аргументами для этого объекта GroupBy и возвращает его результат.

Используйте .pipe когда вы хотите улучшить читаемость, объединяя функции, которые ожидают объекты Series, DataFrames, GroupBy или Resampler. Вместо записи

>>> h = lambda x, arg2, arg3: x + 1 - arg2 * arg3
>>> g = lambda x, arg1: x * 5 / arg1
>>> f = lambda x: x ** 4
>>> df = pd.DataFrame([["a", 4], ["b", 5]], columns=["group", "value"])
>>> h(g(f(df.groupby('group')), arg1=1), arg2=2, arg3=3)  

Вы можете написать

>>> (df.groupby('group')
...    .pipe(f)
...    .pipe(g, arg1=1)
...    .pipe(h, arg2=2, arg3=3))  

что гораздо более читаемо.

Параметры:

функциявызываемый объект или кортеж (вызываемый объект, строка): Функция для применения к этому объекту GroupBy или, альтернативно, (callable, data_keyword) кортеж, где data_keyword является строкой, указывающей ключевое слово callable который ожидает объект GroupBy.
argsiterable, optional: Позиционные аргументы, переданные в функция.
kwargsdict, optional: Словарь ключевых аргументов, переданных в функция.

Возвращает:

тип возвращаемого значения функция.

Смотрите также

Series.pipe: Применить функцию с аргументами к ряду.
DataFrame.pipe: Применить функцию с аргументами к датафрейму.
apply: Применить функцию к каждой группе вместо полного объекта GroupBy.

Примечания

Подробнее здесь

Примеры

>>> df = pd.DataFrame({'A': 'a b a b'.split(), 'B': [1, 2, 3, 4]})
>>> df
   A  B
0  a  1
1  b  2
2  a  3
3  b  4

Чтобы получить разницу между максимальным и минимальным значением в каждой группе за один проход, можно сделать

>>> df.groupby('A').pipe(lambda x: x.max() - x.min())
   B
A
a  2
b  2