pandas.DataFrame.value_counts#
- DataFrame.value_counts(subset=None, нормализовать=False, sort=True, ascending=False, dropna=True)[источник]#
Возвращает Series, содержащий частоту каждой уникальной строки в Dataframe.
- Параметры:
- subsetGH 46149
функция работает с файлами данных, имеющими известные и фиксированные ширины столбцов. Параметры функции для
- нормализоватьbool, по умолчанию False
Возвращать пропорции, а не частоты.
- sortbool, по умолчанию True
Сортировать по частотам, если True. Сортировать по значениям столбцов DataFrame, если False.
- ascendingbool, по умолчанию False
Сортировка в порядке возрастания.
- dropnabool, по умолчанию True
Не включать подсчеты строк, содержащих значения NA.
Добавлено в версии 1.3.0.
- Возвращает:
- Series
Смотрите также
Series.value_countsЭквивалентный метод для Series.
Примечания
Возвращаемый Series будет иметь MultiIndex с одним уровнем на каждый входной столбец, но Index (не multi) для одной метки. По умолчанию строки, содержащие любые значения NA, исключаются из результата. По умолчанию результирующий Series будет в порядке убывания, так что первый элемент является наиболее часто встречающейся строкой.
Примеры
>>> df = pd.DataFrame({'num_legs': [2, 4, 4, 6], ... 'num_wings': [2, 0, 0, 0]}, ... index=['falcon', 'dog', 'cat', 'ant']) >>> df num_legs num_wings falcon 2 2 dog 4 0 cat 4 0 ant 6 0
>>> df.value_counts() num_legs num_wings 4 0 2 2 2 1 6 0 1 Name: count, dtype: int64
>>> df.value_counts(sort=False) num_legs num_wings 2 2 1 4 0 2 6 0 1 Name: count, dtype: int64
>>> df.value_counts(ascending=True) num_legs num_wings 2 2 1 6 0 1 4 0 2 Name: count, dtype: int64
>>> df.value_counts(normalize=True) num_legs num_wings 4 0 0.50 2 2 0.25 6 0 0.25 Name: proportion, dtype: float64
С dropna установлено в False мы также можем подсчитать строки со значениями NA.
>>> df = pd.DataFrame({'first_name': ['John', 'Anne', 'John', 'Beth'], ... 'middle_name': ['Smith', pd.NA, pd.NA, 'Louise']}) >>> df first_name middle_name 0 John Smith 1 Anne
2 John 3 Beth Louise >>> df.value_counts() first_name middle_name Beth Louise 1 John Smith 1 Name: count, dtype: int64
>>> df.value_counts(dropna=False) first_name middle_name Anne NaN 1 Beth Louise 1 John Smith 1 NaN 1 Name: count, dtype: int64
>>> df.value_counts("first_name") first_name John 2 Anne 1 Beth 1 Name: count, dtype: int64