pandas.core.groupby.SeriesGroupBy.sem#

SeriesGroupBy.sem(ddof=1, numeric_only=False)[источник]#

Вычисляет стандартную ошибку среднего групп, исключая пропущенные значения.

Для нескольких группировок результирующий индекс будет MultiIndex.

Параметры:

ddofint, по умолчанию 1: Степени свободы.
numeric_onlybool, по умолчанию False: Включите только float, int или логический data.

Добавлено в версии 1.5.0.

Изменено в версии 2.0.0: numeric_only теперь по умолчанию False.

Возвращает:

Series или DataFrame: Стандартная ошибка среднего значений в каждой группе.

Примеры

Для SeriesGroupBy:

>>> lst = ['a', 'a', 'b', 'b']
>>> ser = pd.Series([5, 10, 8, 14], index=lst)
>>> ser
a     5
a    10
b     8
b    14
dtype: int64
>>> ser.groupby(level=0).sem()
a    2.5
b    3.0
dtype: float64

Для DataFrameGroupBy:

>>> data = [[1, 12, 11], [1, 15, 2], [2, 5, 8], [2, 6, 12]]
>>> df = pd.DataFrame(data, columns=["a", "b", "c"],
...                   index=["tuna", "salmon", "catfish", "goldfish"])
>>> df
           a   b   c
    tuna   1  12  11
  salmon   1  15   2
 catfish   2   5   8
goldfish   2   6  12
>>> df.groupby("a").sem()
      b  c
a
1    1.5  4.5
2    0.5  2.0

Для Resampler:

>>> ser = pd.Series([1, 3, 2, 4, 3, 8],
...                 index=pd.DatetimeIndex(['2023-01-01',
...                                         '2023-01-10',
...                                         '2023-01-15',
...                                         '2023-02-01',
...                                         '2023-02-10',
...                                         '2023-02-15']))
>>> ser.resample('MS').sem()
2023-01-01    0.577350
2023-02-01    1.527525
Freq: MS, dtype: float64