pandas.Index.duplicated#
- Индекс.duplicated(keep='first')[источник]#
Указывает дублирующиеся значения индекса.
Дублирующиеся значения обозначаются как
Trueзначения в результирующем массиве. Можно указать либо все дубликаты, либо все, кроме первого, либо все, кроме последнего вхождения дубликатов.- Параметры:
- keep{‘first’, ‘last’, False}, по умолчанию ‘first’
Значение или значения в наборе дубликатов, которые следует пометить как отсутствующие.
‘first’ : Пометить дубликаты как
Trueкроме первого вхождения.‘last’ : Пометить дубликаты как
Trueза исключением последнего вхождения.False: Пометить все дубликаты какTrue.
- Возвращает:
- np.ndarray[bool]
Смотрите также
Series.duplicatedЭквивалентный метод для pandas.Series.
DataFrame.duplicatedЭквивалентный метод на pandas.DataFrame.
Index.drop_duplicatesУдалить повторяющиеся значения из Index.
Примеры
По умолчанию для каждого набора дублирующихся значений первое вхождение устанавливается в False, а все остальные в True:
>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama']) >>> idx.duplicated() array([False, False, True, False, True])
что эквивалентно
>>> idx.duplicated(keep='first') array([False, False, True, False, True])
Используя 'last', последнее вхождение каждого набора дублирующихся значений устанавливается на False, а все остальные на True:
>>> idx.duplicated(keep='last') array([ True, False, True, False, False])
Установив keep на
False, все дубликаты имеют значение True:>>> idx.duplicated(keep=False) array([ True, False, True, False, True])