pandas.DataFrame.update#

DataFrame.update(other, join='left', перезаписать=True, filter_func=None, ошибки='ignore')[источник]#

Изменение на месте с использованием не-NA значений из другого DataFrame.

Выравнивает по индексам. Возвращаемого значения нет.

Параметры:

otherDataFrame или объект, приводимый к DataFrame

Должен иметь хотя бы одну совпадающую метку индекса/столбца с исходным DataFrame. Если передается Series, его атрибут name должен быть установлен, и он будет использоваться как имя столбца для выравнивания с исходным DataFrame.

join{‘left’}, по умолчанию ‘left’

Реализовано только левое соединение, сохраняющее индекс и столбцы исходного объекта.

перезаписатьbool, по умолчанию True

Как обрабатывать не-NA значения для перекрывающихся ключей:

True: перезаписать исходные значения DataFrame значениями из other.
False: обновлять только значения, которые являются NA в исходном DataFrame.

filter_funccallable(1d-array) -> bool 1d-array, опционально

Можно выбрать замену значений, отличных от NA. Возвращает True для значений, которые должны быть обновлены.

ошибки{‘raise’, ‘ignore’}, по умолчанию ‘ignore’

Если 'raise', будет вызвано ValueError, если DataFrame и other оба содержат не-NA данные в одинаковых позициях.

Возвращает:

None: Этот метод напрямую изменяет вызывающий объект.

Вызывает:

ValueError

Когда errors=’raise’ и есть перекрывающиеся не-NA данные.
Когда ошибки не является ни ‘ignore’ или 'raise'

NotImplementedError

Если join != ‘left’

Смотрите также

dict.update: Аналогичный метод для словарей.
DataFrame.merge: Для операций столбец(ы)-на-столбец(ы).

Примеры

>>> df = pd.DataFrame({'A': [1, 2, 3],
...                    'B': [400, 500, 600]})
>>> new_df = pd.DataFrame({'B': [4, 5, 6],
...                        'C': [7, 8, 9]})
>>> df.update(new_df)
>>> df
   A  B
0  1  4
1  2  5
2  3  6

Длина DataFrame не увеличивается в результате обновления, обновляются только значения по соответствующим меткам индекса/столбца.

>>> df = pd.DataFrame({'A': ['a', 'b', 'c'],
...                    'B': ['x', 'y', 'z']})
>>> new_df = pd.DataFrame({'B': ['d', 'e', 'f', 'g', 'h', 'i']})
>>> df.update(new_df)
>>> df
   A  B
0  a  d
1  b  e
2  c  f

>>> df = pd.DataFrame({'A': ['a', 'b', 'c'],
...                    'B': ['x', 'y', 'z']})
>>> new_df = pd.DataFrame({'B': ['d', 'f']}, index=[0, 2])
>>> df.update(new_df)
>>> df
   A  B
0  a  d
1  b  y
2  c  f

Для Series должен быть установлен атрибут name.

>>> df = pd.DataFrame({'A': ['a', 'b', 'c'],
...                    'B': ['x', 'y', 'z']})
>>> new_column = pd.Series(['d', 'e', 'f'], name='B')
>>> df.update(new_column)
>>> df
   A  B
0  a  d
1  b  e
2  c  f

Если other содержит NaN, соответствующие значения не обновляются в исходном dataframe.

>>> df = pd.DataFrame({'A': [1, 2, 3],
...                    'B': [400., 500., 600.]})
>>> new_df = pd.DataFrame({'B': [4, np.nan, 6]})
>>> df.update(new_df)
>>> df
   A      B
0  1    4.0
1  2  500.0
2  3    6.0