pandas.DataFrame.update#
- DataFrame.update(other, join='left', перезаписать=True, filter_func=None, ошибки='ignore')[источник]#
Изменение на месте с использованием не-NA значений из другого DataFrame.
Выравнивает по индексам. Возвращаемого значения нет.
- Параметры:
- otherDataFrame или объект, приводимый к DataFrame
Должен иметь хотя бы одну совпадающую метку индекса/столбца с исходным DataFrame. Если передается Series, его атрибут name должен быть установлен, и он будет использоваться как имя столбца для выравнивания с исходным DataFrame.
- join{‘left’}, по умолчанию ‘left’
Реализовано только левое соединение, сохраняющее индекс и столбцы исходного объекта.
- перезаписатьbool, по умолчанию True
Как обрабатывать не-NA значения для перекрывающихся ключей:
True: перезаписать исходные значения DataFrame значениями из other.
False: обновлять только значения, которые являются NA в исходном DataFrame.
- filter_funccallable(1d-array) -> bool 1d-array, опционально
Можно выбрать замену значений, отличных от NA. Возвращает True для значений, которые должны быть обновлены.
- ошибки{‘raise’, ‘ignore’}, по умолчанию ‘ignore’
Если 'raise', будет вызвано ValueError, если DataFrame и other оба содержат не-NA данные в одинаковых позициях.
- Возвращает:
- None
Этот метод напрямую изменяет вызывающий объект.
- Вызывает:
- ValueError
Когда errors=’raise’ и есть перекрывающиеся не-NA данные.
Когда ошибки не является ни ‘ignore’ или 'raise'
- NotImplementedError
Если join != ‘left’
Смотрите также
dict.updateАналогичный метод для словарей.
DataFrame.mergeДля операций столбец(ы)-на-столбец(ы).
Примеры
>>> df = pd.DataFrame({'A': [1, 2, 3], ... 'B': [400, 500, 600]}) >>> new_df = pd.DataFrame({'B': [4, 5, 6], ... 'C': [7, 8, 9]}) >>> df.update(new_df) >>> df A B 0 1 4 1 2 5 2 3 6
Длина DataFrame не увеличивается в результате обновления, обновляются только значения по соответствующим меткам индекса/столбца.
>>> df = pd.DataFrame({'A': ['a', 'b', 'c'], ... 'B': ['x', 'y', 'z']}) >>> new_df = pd.DataFrame({'B': ['d', 'e', 'f', 'g', 'h', 'i']}) >>> df.update(new_df) >>> df A B 0 a d 1 b e 2 c f
>>> df = pd.DataFrame({'A': ['a', 'b', 'c'], ... 'B': ['x', 'y', 'z']}) >>> new_df = pd.DataFrame({'B': ['d', 'f']}, index=[0, 2]) >>> df.update(new_df) >>> df A B 0 a d 1 b y 2 c f
Для Series должен быть установлен атрибут name.
>>> df = pd.DataFrame({'A': ['a', 'b', 'c'], ... 'B': ['x', 'y', 'z']}) >>> new_column = pd.Series(['d', 'e', 'f'], name='B') >>> df.update(new_column) >>> df A B 0 a d 1 b e 2 c f
Если other содержит NaN, соответствующие значения не обновляются в исходном dataframe.
>>> df = pd.DataFrame({'A': [1, 2, 3], ... 'B': [400., 500., 600.]}) >>> new_df = pd.DataFrame({'B': [4, np.nan, 6]}) >>> df.update(new_df) >>> df A B 0 1 4.0 1 2 500.0 2 3 6.0