pandas.Index.drop_duplicates#

Индекс.drop_duplicates(*, keep='first')[источник]#

Вернуть Index с удаленными дублирующимися значениями.

Параметры:

keep{‘first’, ‘last’, False}, по умолчанию 'first'

'first' : Удалить дубликаты, кроме первого вхождения.
‘last’ : Удалить дубликаты, кроме последнего вхождения.
False : Удалить все дубликаты.

Возвращает:

Index

Смотрите также

Series.drop_duplicates: Эквивалентный метод для Series.
DataFrame.drop_duplicates: Эквивалентный метод на DataFrame.
Index.duplicated: Связанный метод на Index, указывающий дублирующиеся значения Index.

Примеры

Сгенерируйте pandas.Index с повторяющимися значениями.

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

The keep параметр controls определяет, какие повторяющиеся значения удаляются. Значение 'first' сохраняет первое вхождение для каждого набора дублирующихся записей. Значение по умолчанию для keep - 'first'.

>>> idx.drop_duplicates(keep='first')
Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')

Значение 'last' сохраняет последнее вхождение для каждого набора дублирующихся записей.

>>> idx.drop_duplicates(keep='last')
Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')

Значение False отбрасывает все наборы дублирующихся записей.

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')