pandas.Index.duplicated#

Индекс.duplicated(keep='first')[источник]#

Указывает дублирующиеся значения индекса.

Дублирующиеся значения обозначаются как True значения в результирующем массиве. Можно указать либо все дубликаты, либо все, кроме первого, либо все, кроме последнего вхождения дубликатов.

Параметры:
keep{‘first’, ‘last’, False}, по умолчанию ‘first’

Значение или значения в наборе дубликатов, которые следует пометить как отсутствующие.

  • ‘first’ : Пометить дубликаты как True кроме первого вхождения.

  • ‘last’ : Пометить дубликаты как True за исключением последнего вхождения.

  • False : Пометить все дубликаты как True.

Возвращает:
np.ndarray[bool]

Смотрите также

Series.duplicated

Эквивалентный метод для pandas.Series.

DataFrame.duplicated

Эквивалентный метод на pandas.DataFrame.

Index.drop_duplicates

Удалить повторяющиеся значения из Index.

Примеры

По умолчанию для каждого набора дублирующихся значений первое вхождение устанавливается в False, а все остальные в True:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

что эквивалентно

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

Используя 'last', последнее вхождение каждого набора дублирующихся значений устанавливается на False, а все остальные на True:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

Установив keep на False, все дубликаты имеют значение True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])