pandas.Index.drop_duplicates#

Индекс.drop_duplicates(*, keep='first')[источник]#

Вернуть Index с удаленными дублирующимися значениями.

Параметры:
keep{‘first’, ‘last’, False}, по умолчанию 'first'
  • 'first' : Удалить дубликаты, кроме первого вхождения.

  • ‘last’ : Удалить дубликаты, кроме последнего вхождения.

  • False : Удалить все дубликаты.

Возвращает:
Index

Смотрите также

Series.drop_duplicates

Эквивалентный метод для Series.

DataFrame.drop_duplicates

Эквивалентный метод на DataFrame.

Index.duplicated

Связанный метод на Index, указывающий дублирующиеся значения Index.

Примеры

Сгенерируйте pandas.Index с повторяющимися значениями.

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

The keep параметр controls определяет, какие повторяющиеся значения удаляются. Значение 'first' сохраняет первое вхождение для каждого набора дублирующихся записей. Значение по умолчанию для keep - 'first'.

>>> idx.drop_duplicates(keep='first')
Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')

Значение 'last' сохраняет последнее вхождение для каждого набора дублирующихся записей.

>>> idx.drop_duplicates(keep='last')
Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')

Значение False отбрасывает все наборы дублирующихся записей.

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')