pandas.Series.duplicated#

Series.duplicated(keep='first')[источник]#

Указывает дублирующиеся значения Series.

Дублирующиеся значения обозначаются как True в результирующий Series. Можно указать либо все дубликаты, либо все, кроме первого, либо все, кроме последнего вхождения дубликатов.

Параметры:
keep{‘first’, ‘last’, False}, по умолчанию ‘first’

Метод обработки удаления дубликатов:

  • ‘first’ : Пометить дубликаты как True кроме первого вхождения.

  • ‘last’ : Пометить дубликаты как True за исключением последнего вхождения.

  • False : Пометить все дубликаты как True.

Возвращает:
Series[bool]

Series, указывающий, встречалось ли каждое значение в предыдущих значениях.

Смотрите также

Index.duplicated

Эквивалентный метод для pandas.Index.

DataFrame.duplicated

Эквивалентный метод на pandas.DataFrame.

Series.drop_duplicates

Удаление дублирующихся значений из Series.

Примеры

По умолчанию для каждого набора дублированных значений первое вхождение устанавливается в False, а все остальные в True:

>>> animals = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

что эквивалентно

>>> animals.duplicated(keep='first')
0    False
1    False
2     True
3    False
4     True
dtype: bool

Используя 'last', последнее вхождение каждого набора дублирующихся значений устанавливается на False, а все остальные на True:

>>> animals.duplicated(keep='last')
0     True
1    False
2     True
3    False
4    False
dtype: bool

Установив keep на False, все дубликаты имеют значение True:

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype: bool