pandas.core.groupby.DataFrameGroupBy.pipe#
- DataFrameGroupBy.pipe(функция, *args, **kwargs)[источник]#
Применить
funcс аргументами для этого объекта GroupBy и возвращает его результат.Используйте .pipe когда вы хотите улучшить читаемость, объединяя функции, которые ожидают объекты Series, DataFrames, GroupBy или Resampler. Вместо записи
>>> h = lambda x, arg2, arg3: x + 1 - arg2 * arg3 >>> g = lambda x, arg1: x * 5 / arg1 >>> f = lambda x: x ** 4 >>> df = pd.DataFrame([["a", 4], ["b", 5]], columns=["group", "value"]) >>> h(g(f(df.groupby('group')), arg1=1), arg2=2, arg3=3)
Вы можете написать
>>> (df.groupby('group') ... .pipe(f) ... .pipe(g, arg1=1) ... .pipe(h, arg2=2, arg3=3))
что гораздо более читаемо.
- Параметры:
- функциявызываемый объект или кортеж (вызываемый объект, строка)
Функция для применения к этому объекту GroupBy или, альтернативно, (callable, data_keyword) кортеж, где data_keyword является строкой, указывающей ключевое слово callable который ожидает объект GroupBy.
- argsiterable, optional
Позиционные аргументы, переданные в функция.
- kwargsdict, optional
Словарь ключевых аргументов, переданных в функция.
- Возвращает:
- тип возвращаемого значения функция.
Смотрите также
Series.pipeПрименить функцию с аргументами к ряду.
DataFrame.pipeПрименить функцию с аргументами к датафрейму.
applyПрименить функцию к каждой группе вместо полного объекта GroupBy.
Примечания
Подробнее здесь
Примеры
>>> df = pd.DataFrame({'A': 'a b a b'.split(), 'B': [1, 2, 3, 4]}) >>> df A B 0 a 1 1 b 2 2 a 3 3 b 4
Чтобы получить разницу между максимальным и минимальным значением в каждой группе за один проход, можно сделать
>>> df.groupby('A').pipe(lambda x: x.max() - x.min()) B A a 2 b 2