pandas.Series.duplicated#

Series.duplicated(keep='first')[источник]#

Указывает дублирующиеся значения Series.

Дублирующиеся значения обозначаются как True в результирующий Series. Можно указать либо все дубликаты, либо все, кроме первого, либо все, кроме последнего вхождения дубликатов.

Параметры:

keep{‘first’, ‘last’, False}, по умолчанию ‘first’

Метод обработки удаления дубликатов:

‘first’ : Пометить дубликаты как True кроме первого вхождения.
‘last’ : Пометить дубликаты как True за исключением последнего вхождения.
False : Пометить все дубликаты как True.

Возвращает:

Series[bool]: Series, указывающий, встречалось ли каждое значение в предыдущих значениях.

Смотрите также

Index.duplicated: Эквивалентный метод для pandas.Index.
DataFrame.duplicated: Эквивалентный метод на pandas.DataFrame.
Series.drop_duplicates: Удаление дублирующихся значений из Series.

Примеры

По умолчанию для каждого набора дублированных значений первое вхождение устанавливается в False, а все остальные в True:

>>> animals = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

что эквивалентно

>>> animals.duplicated(keep='first')
  False
  False
   True
  False
   True
dtype: bool

Используя 'last', последнее вхождение каждого набора дублирующихся значений устанавливается на False, а все остальные на True:

>>> animals.duplicated(keep='last')
   True
  False
   True
  False
  False
dtype: bool

Установив keep на False, все дубликаты имеют значение True:

>>> animals.duplicated(keep=False)
   True
  False
   True
  False
   True
dtype: bool