pandas.DataFrame.dropna#
-
DataFrame.dropna(*, axis=0, how=
, thresh= , subset=None, inplace=False, ignore_index=False)[источник]# Удалить пропущенные значения.
См. Руководство пользователя для получения дополнительной информации о том, какие значения считаются пропущенными и как работать с пропущенными данными.
- Параметры:
- ось{0 или 'index', 1 или 'columns'}, по умолчанию 0
Определить, удаляются ли строки или столбцы, содержащие пропущенные значения.
0, или 'index' : Удалить строки, содержащие пропущенные значения.
1 или 'columns': Удалить столбцы, содержащие пропущенные значения.
Разрешена только одна ось.
- how{‘any’, ‘all’}, по умолчанию ‘any’
Определить, удаляется ли строка или столбец из DataFrame, когда у нас есть хотя бы одно NA или все NA.
‘any’: Если присутствуют любые значения NA, удалить эту строку или столбец.
‘all’ : Если все значения NA, удалить эту строку или столбец.
- порогint, необязательный
Требовать столько не-NA значений. Нельзя комбинировать с how.
- subsetметка столбца или последовательность меток, опционально
Метки вдоль другой оси для учёта, например, если вы удаляете строки, это будет список столбцов для включения.
- inplacebool, по умолчанию False
Следует ли изменять DataFrame вместо создания нового.
- ignore_indexbool, по умолчанию
False Если
True, результирующая ось будет помечена как 0, 1, …, n - 1.Добавлено в версии 2.0.0.
- Возвращает:
- DataFrame или None
DataFrame с удалёнными NA записями или None, если
inplace=True.
Смотрите также
DataFrame.isnaОбозначение пропущенных значений.
DataFrame.notnaУказывает существующие (не пропущенные) значения.
DataFrame.fillnaЗаменить пропущенные значения.
Series.dropnaУдалить пропущенные значения.
Index.dropnaУдалить отсутствующие индексы.
Примеры
>>> df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'], ... "toy": [np.nan, 'Batmobile', 'Bullwhip'], ... "born": [pd.NaT, pd.Timestamp("1940-04-25"), ... pd.NaT]}) >>> df name toy born 0 Alfred NaN NaT 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT
Удалить строки, где отсутствует хотя бы один элемент.
>>> df.dropna() name toy born 1 Batman Batmobile 1940-04-25
Удалить столбцы, в которых отсутствует хотя бы один элемент.
>>> df.dropna(axis='columns') name 0 Alfred 1 Batman 2 Catwoman
Удалить строки, где все элементы отсутствуют.
>>> df.dropna(how='all') name toy born 0 Alfred NaN NaT 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT
Оставить только строки с как минимум 2 не-NA значениями.
>>> df.dropna(thresh=2) name toy born 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT
Определить, в каких столбцах искать пропущенные значения.
>>> df.dropna(subset=['name', 'toy']) name toy born 1 Batman Batmobile 1940-04-25 2 Catwoman Bullwhip NaT