pandas.Series.duplicated#
- Series.duplicated(keep='first')[источник]#
Указывает дублирующиеся значения Series.
Дублирующиеся значения обозначаются как
Trueв результирующий Series. Можно указать либо все дубликаты, либо все, кроме первого, либо все, кроме последнего вхождения дубликатов.- Параметры:
- keep{‘first’, ‘last’, False}, по умолчанию ‘first’
Метод обработки удаления дубликатов:
‘first’ : Пометить дубликаты как
Trueкроме первого вхождения.‘last’ : Пометить дубликаты как
Trueза исключением последнего вхождения.False: Пометить все дубликаты какTrue.
- Возвращает:
- Series[bool]
Series, указывающий, встречалось ли каждое значение в предыдущих значениях.
Смотрите также
Index.duplicatedЭквивалентный метод для pandas.Index.
DataFrame.duplicatedЭквивалентный метод на pandas.DataFrame.
Series.drop_duplicatesУдаление дублирующихся значений из Series.
Примеры
По умолчанию для каждого набора дублированных значений первое вхождение устанавливается в False, а все остальные в True:
>>> animals = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama']) >>> animals.duplicated() 0 False 1 False 2 True 3 False 4 True dtype: bool
что эквивалентно
>>> animals.duplicated(keep='first') 0 False 1 False 2 True 3 False 4 True dtype: bool
Используя 'last', последнее вхождение каждого набора дублирующихся значений устанавливается на False, а все остальные на True:
>>> animals.duplicated(keep='last') 0 True 1 False 2 True 3 False 4 False dtype: bool
Установив keep на
False, все дубликаты имеют значение True:>>> animals.duplicated(keep=False) 0 True 1 False 2 True 3 False 4 True dtype: bool