pandas.DataFrame.value_counts#

DataFrame.value_counts(subset=None, нормализовать=False, sort=True, ascending=False, dropna=True)[источник]#

Возвращает Series, содержащий частоту каждой уникальной строки в Dataframe.

Параметры:

subsetGH 46149: функция работает с файлами данных, имеющими известные и фиксированные ширины столбцов. Параметры функции для
нормализоватьbool, по умолчанию False: Возвращать пропорции, а не частоты.
sortbool, по умолчанию True: Сортировать по частотам, если True. Сортировать по значениям столбцов DataFrame, если False.
ascendingbool, по умолчанию False: Сортировка в порядке возрастания.
dropnabool, по умолчанию True: Не включать подсчеты строк, содержащих значения NA.

Добавлено в версии 1.3.0.

Возвращает:

Series

Смотрите также

Series.value_counts: Эквивалентный метод для Series.

Примечания

Возвращаемый Series будет иметь MultiIndex с одним уровнем на каждый входной столбец, но Index (не multi) для одной метки. По умолчанию строки, содержащие любые значения NA, исключаются из результата. По умолчанию результирующий Series будет в порядке убывания, так что первый элемент является наиболее часто встречающейся строкой.

Примеры

>>> df = pd.DataFrame({'num_legs': [2, 4, 4, 6],
...                    'num_wings': [2, 0, 0, 0]},
...                   index=['falcon', 'dog', 'cat', 'ant'])
>>> df
        num_legs  num_wings
falcon         2          2
dog            4          0
cat            4          0
ant            6          0

>>> df.value_counts()
num_legs  num_wings
4         0            2
2         2            1
6         0            1
Name: count, dtype: int64

>>> df.value_counts(sort=False)
num_legs  num_wings
2         2            1
4         0            2
6         0            1
Name: count, dtype: int64

>>> df.value_counts(ascending=True)
num_legs  num_wings
2         2            1
6         0            1
4         0            2
Name: count, dtype: int64

>>> df.value_counts(normalize=True)
num_legs  num_wings
4         0            0.50
2         2            0.25
6         0            0.25
Name: proportion, dtype: float64

С dropna установлено в False мы также можем подсчитать строки со значениями NA.

>>> df = pd.DataFrame({'first_name': ['John', 'Anne', 'John', 'Beth'],
...                    'middle_name': ['Smith', pd.NA, pd.NA, 'Louise']})
>>> df
  first_name middle_name
0       John       Smith
1       Anne        
2       John        
3       Beth      Louise

>>> df.value_counts()
first_name  middle_name
Beth        Louise         1
John        Smith          1
Name: count, dtype: int64

>>> df.value_counts(dropna=False)
first_name  middle_name
Anne        NaN            1
Beth        Louise         1
John        Smith          1
            NaN            1
Name: count, dtype: int64

>>> df.value_counts("first_name")
first_name
John    2
Anne    1
Beth    1
Name: count, dtype: int64