pandas.Series.fillna#
-
Series.fillna(value=None, *, method=None, axis=None, inplace=False, limit=None, downcast=
)[источник]# Заполнить значения NA/NaN с использованием указанного метода.
- Параметры:
- значениескаляр, словарь, Series или DataFrame
Значение для заполнения пропусков (например, 0), альтернативно dict/Series/DataFrame значений, указывающих, какое значение использовать для каждого индекса (для Series) или столбца (для DataFrame). Значения, отсутствующие в dict/Series/DataFrame, не будут заполнены. Это значение не может быть списком.
- метод{'backfill', 'bfill', 'ffill', None}, по умолчанию None
Метод для заполнения пропусков в переиндексированных Series:
ffill: распространение последнего допустимого наблюдения вперед до следующего допустимого.
backfill / bfill: использовать следующее допустимое наблюдение для заполнения пропуска.
Устарело с версии 2.1.0: Используйте ffill или bfill вместо этого.
- ось{0 или ‘index’} для Series, {0 или ‘index’, 1 или ‘columns’} для DataFrame
Ось, вдоль которой заполнять пропущенные значения. Для Series этот параметр не используется и по умолчанию равен 0.
- inplacebool, по умолчанию False
Если True, заполнять на месте. Примечание: это изменит любые другие представления этого объекта (например, срез без копирования для столбца в DataFrame).
- limitint, по умолчанию None
Если указан метод, это максимальное количество последовательных значений NaN для заполнения вперед/назад. Другими словами, если есть пробел с более чем этим количеством последовательных NaN, он будет заполнен только частично. Если метод не указан, это максимальное количество записей вдоль всей оси, где NaN будут заполнены. Должно быть больше 0, если не None.
- downcastdict, по умолчанию None
Словарь элемент->тип данных для понижения типа, если возможно, или строка 'infer', которая попытается понизить тип до соответствующего равного типа (например, float64 до int64, если возможно).
Устарело с версии 2.2.0.
- Возвращает:
- Series/DataFrame или None
Объект с заполненными пропущенными значениями или None, если
inplace=True.
Смотрите также
ffillЗаполнение значений путем распространения последнего допустимого наблюдения на следующее допустимое.
bfillЗаполнение значений с использованием следующего допустимого наблюдения для заполнения пробела.
interpolateЗаполните значения NaN с помощью интерполяции.
reindexПривести объект к новому индексу.
asfreqПреобразовать TimeSeries в указанную частоту.
Примеры
>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0], ... [3, 4, np.nan, 1], ... [np.nan, np.nan, np.nan, np.nan], ... [np.nan, 3, np.nan, 4]], ... columns=list("ABCD")) >>> df A B C D 0 NaN 2.0 NaN 0.0 1 3.0 4.0 NaN 1.0 2 NaN NaN NaN NaN 3 NaN 3.0 NaN 4.0
Заменить все элементы NaN на 0.
>>> df.fillna(0) A B C D 0 0.0 2.0 0.0 0.0 1 3.0 4.0 0.0 1.0 2 0.0 0.0 0.0 0.0 3 0.0 3.0 0.0 4.0
Заменить все элементы NaN в столбцах 'A', 'B', 'C' и 'D' на 0, 1, 2 и 3 соответственно.
>>> values = {"A": 0, "B": 1, "C": 2, "D": 3} >>> df.fillna(value=values) A B C D 0 0.0 2.0 2.0 0.0 1 3.0 4.0 2.0 1.0 2 0.0 1.0 2.0 3.0 3 0.0 3.0 2.0 4.0
Заменять только первый элемент NaN.
>>> df.fillna(value=values, limit=1) A B C D 0 0.0 2.0 2.0 0.0 1 3.0 4.0 NaN 1.0 2 NaN 1.0 NaN 3.0 3 NaN 3.0 NaN 4.0
При заполнении с использованием DataFrame замена происходит по тем же именам столбцов и тем же индексам
>>> df2 = pd.DataFrame(np.zeros((4, 4)), columns=list("ABCE")) >>> df.fillna(df2) A B C D 0 0.0 2.0 0.0 0.0 1 3.0 4.0 0.0 1.0 2 0.0 0.0 0.0 NaN 3 0.0 3.0 0.0 4.0
Обратите внимание, что столбец D не затрагивается, так как он отсутствует в df2.