pandas.Index.drop_duplicates#
- Индекс.drop_duplicates(*, keep='first')[источник]#
Вернуть Index с удаленными дублирующимися значениями.
- Параметры:
- keep{‘first’, ‘last’,
False}, по умолчанию 'first' 'first' : Удалить дубликаты, кроме первого вхождения.
‘last’ : Удалить дубликаты, кроме последнего вхождения.
False: Удалить все дубликаты.
- keep{‘first’, ‘last’,
- Возвращает:
- Index
Смотрите также
Series.drop_duplicatesЭквивалентный метод для Series.
DataFrame.drop_duplicatesЭквивалентный метод на DataFrame.
Index.duplicatedСвязанный метод на Index, указывающий дублирующиеся значения Index.
Примеры
Сгенерируйте pandas.Index с повторяющимися значениями.
>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])
The keep параметр controls определяет, какие повторяющиеся значения удаляются. Значение 'first' сохраняет первое вхождение для каждого набора дублирующихся записей. Значение по умолчанию для keep - 'first'.
>>> idx.drop_duplicates(keep='first') Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')
Значение 'last' сохраняет последнее вхождение для каждого набора дублирующихся записей.
>>> idx.drop_duplicates(keep='last') Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')
Значение
Falseотбрасывает все наборы дублирующихся записей.>>> idx.drop_duplicates(keep=False) Index(['cow', 'beetle', 'hippo'], dtype='object')