pandas.Series.drop_duplicates#

Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[источник]#

Возвращает Series с удаленными дублирующимися значениями.

Параметры:

keep{‘first’, ‘last’, False}, по умолчанию 'first'

Метод обработки удаления дубликатов:

'first' : Удалить дубликаты, кроме первого вхождения.
‘last’ : Удалить дубликаты, кроме последнего вхождения.
False : Удалить все дубликаты.

inplacebool, по умолчанию False

Если True, выполняет операцию на месте и возвращает None.

ignore_indexbool, по умолчанию False

Если True, результирующая ось будет помечена как 0, 1, …, n - 1.

Добавлено в версии 2.0.0.

Возвращает:

Series или None: Series с удаленными дубликатами или None, если inplace=True.

Смотрите также

Index.drop_duplicates: Эквивалентный метод на Index.
DataFrame.drop_duplicates: Эквивалентный метод на DataFrame.
Series.duplicated: Связанный метод для Series, указывающий дублирующиеся значения Series.
Series.unique: Возвращает уникальные значения в виде массива.

Примеры

Создать Series с дублирующимися записями.

>>> s = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama', 'hippo'],
...               name='animal')
>>> s
0     llama
1       cow
2     llama
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

С параметром 'keep' можно изменить поведение выбора дублирующихся значений. Значение 'first' сохраняет первое вхождение для каждого набора дублирующихся записей. Значение по умолчанию для keep - 'first'.

>>> s.drop_duplicates()
0     llama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

Значение 'last' для параметра 'keep' сохраняет последнее вхождение для каждого набора дублирующихся записей.

>>> s.drop_duplicates(keep='last')
1       cow
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

Значение False для параметра ‘keep’ отбрасывает все наборы дублирующихся записей.

>>> s.drop_duplicates(keep=False)
1       cow
3    beetle
5     hippo
Name: animal, dtype: object