pandas.Index.value_counts#
- Индекс.value_counts(нормализовать=False, sort=True, ascending=False, bins=None, dropna=True)[источник]#
Вернуть Series, содержащий количество уникальных значений.
Результирующий объект будет в порядке убывания, так что первый элемент является наиболее часто встречающимся элементом. Исключает значения NA по умолчанию.
- Параметры:
- нормализоватьbool, по умолчанию False
Если True, то возвращаемый объект будет содержать относительные частоты уникальных значений.
- sortbool, по умолчанию True
Сортировать по частотам, если True. Сохранять порядок данных, если False.
- ascendingbool, по умолчанию False
Сортировка в порядке возрастания.
- binsint, необязательный
Вместо подсчета значений, сгруппировать их в полуоткрытые интервалы, удобство для
pd.cut, работает только с числовыми данными.- dropnabool, по умолчанию True
Не включать подсчеты NaN.
- Возвращает:
- Series
Смотрите также
Series.countКоличество не-NA элементов в Series.
DataFrame.countКоличество не-NA элементов в DataFrame.
DataFrame.value_countsЭквивалентный метод для DataFrames.
Примеры
>>> index = pd.Index([3, 1, 2, 3, 4, np.nan]) >>> index.value_counts() 3.0 2 1.0 1 2.0 1 4.0 1 Name: count, dtype: int64
С нормализовать установлено в True, возвращает относительную частоту путём деления всех значений на сумму значений.
>>> s = pd.Series([3, 1, 2, 3, 4, np.nan]) >>> s.value_counts(normalize=True) 3.0 0.4 1.0 0.2 2.0 0.2 4.0 0.2 Name: proportion, dtype: float64
bins
Бины могут быть полезны для перехода от непрерывной переменной к категориальной переменной; вместо подсчёта уникальных появлений значений разделите индекс на указанное количество полуоткрытых бинов.
>>> s.value_counts(bins=3) (0.996, 2.0] 2 (2.0, 3.0] 2 (3.0, 4.0] 1 Name: count, dtype: int64
dropna
С dropna установлено в False мы также можем видеть значения индекса NaN.
>>> s.value_counts(dropna=False) 3.0 2 1.0 1 2.0 1 4.0 1 NaN 1 Name: count, dtype: int64