pandas.Series.drop_duplicates#
- Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[источник]#
Возвращает Series с удаленными дублирующимися значениями.
- Параметры:
- keep{‘first’, ‘last’,
False}, по умолчанию 'first' Метод обработки удаления дубликатов:
'first' : Удалить дубликаты, кроме первого вхождения.
‘last’ : Удалить дубликаты, кроме последнего вхождения.
False: Удалить все дубликаты.
- inplacebool, по умолчанию
False Если
True, выполняет операцию на месте и возвращает None.- ignore_indexbool, по умолчанию
False Если
True, результирующая ось будет помечена как 0, 1, …, n - 1.Добавлено в версии 2.0.0.
- keep{‘first’, ‘last’,
- Возвращает:
- Series или None
Series с удаленными дубликатами или None, если
inplace=True.
Смотрите также
Index.drop_duplicatesЭквивалентный метод на Index.
DataFrame.drop_duplicatesЭквивалентный метод на DataFrame.
Series.duplicatedСвязанный метод для Series, указывающий дублирующиеся значения Series.
Series.uniqueВозвращает уникальные значения в виде массива.
Примеры
Создать Series с дублирующимися записями.
>>> s = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama', 'hippo'], ... name='animal') >>> s 0 llama 1 cow 2 llama 3 beetle 4 llama 5 hippo Name: animal, dtype: object
С параметром 'keep' можно изменить поведение выбора дублирующихся значений. Значение 'first' сохраняет первое вхождение для каждого набора дублирующихся записей. Значение по умолчанию для keep - 'first'.
>>> s.drop_duplicates() 0 llama 1 cow 3 beetle 5 hippo Name: animal, dtype: object
Значение 'last' для параметра 'keep' сохраняет последнее вхождение для каждого набора дублирующихся записей.
>>> s.drop_duplicates(keep='last') 1 cow 3 beetle 4 llama 5 hippo Name: animal, dtype: object
Значение
Falseдля параметра ‘keep’ отбрасывает все наборы дублирующихся записей.>>> s.drop_duplicates(keep=False) 1 cow 3 beetle 5 hippo Name: animal, dtype: object