pandas.DataFrame.compare#

DataFrame.сравнить(other, align_axis=1, keep_shape=False, keep_equal=False, result_names=('self', 'other'))[источник]#

Сравнить с другим DataFrame и показать различия.

Параметры:
otherDataFrame

Объект для сравнения.

align_axis{0 или ‘index’, 1 или ‘columns’}, по умолчанию 1

Определить, по какой оси выравнивать сравнение.

  • 0, или 'index'Полученные различия складываются вертикально

    со строками, поочередно взятыми из self и other.

  • 1, или 'columns'Полученные различия выровнены горизонтально

    со столбцами, поочередно взятыми из self и other.

keep_shapebool, по умолчанию False

Если true, сохраняются все строки и столбцы. В противном случае сохраняются только те, которые имеют разные значения.

keep_equalbool, по умолчанию False

Если true, результат сохраняет равные значения. В противном случае равные значения отображаются как NaN.

result_namesкортеж, по умолчанию ('self', 'other')

Установите имена фреймов данных в сравнении.

Добавлено в версии 1.5.0.

Возвращает:
DataFrame

DataFrame, показывающий различия, расположенные рядом.

Результирующий индекс будет MultiIndex с 'self' и 'other', чередующимися на внутреннем уровне.

Вызывает:
ValueError

Когда два DataFrame не имеют идентичных меток или формы.

Смотрите также

Series.compare

Сравнить с другой Series и показать различия.

DataFrame.equals

Проверить, содержат ли два объекта одинаковые элементы.

Примечания

Совпадающие NaN не будут отображаться как различие.

Можно сравнивать только идентично помеченные (т.е. одинаковой формы, с идентичными метками строк и столбцов) DataFrame

Примеры

>>> df = pd.DataFrame(
...     {
...         "col1": ["a", "a", "b", "b", "a"],
...         "col2": [1.0, 2.0, 3.0, np.nan, 5.0],
...         "col3": [1.0, 2.0, 3.0, 4.0, 5.0]
...     },
...     columns=["col1", "col2", "col3"],
... )
>>> df
  col1  col2  col3
0    a   1.0   1.0
1    a   2.0   2.0
2    b   3.0   3.0
3    b   NaN   4.0
4    a   5.0   5.0
>>> df2 = df.copy()
>>> df2.loc[0, 'col1'] = 'c'
>>> df2.loc[2, 'col3'] = 4.0
>>> df2
  col1  col2  col3
0    c   1.0   1.0
1    a   2.0   2.0
2    b   3.0   4.0
3    b   NaN   4.0
4    a   5.0   5.0

Выровнять различия по столбцам

>>> df.compare(df2)
  col1       col3
  self other self other
0    a     c  NaN   NaN
2  NaN   NaN  3.0   4.0

Назначить result_names

>>> df.compare(df2, result_names=("left", "right"))
  col1       col3
  left right left right
0    a     c  NaN   NaN
2  NaN   NaN  3.0   4.0

Сложить разности по строкам

>>> df.compare(df2, align_axis=0)
        col1  col3
0 self     a   NaN
  other    c   NaN
2 self   NaN   3.0
  other  NaN   4.0

Сохранить равные значения

>>> df.compare(df2, keep_equal=True)
  col1       col3
  self other self other
0    a     c  1.0   1.0
2    b     b  3.0   4.0

Сохранить все исходные строки и столбцы

>>> df.compare(df2, keep_shape=True)
  col1       col2       col3
  self other self other self other
0    a     c  NaN   NaN  NaN   NaN
1  NaN   NaN  NaN   NaN  NaN   NaN
2  NaN   NaN  NaN   NaN  3.0   4.0
3  NaN   NaN  NaN   NaN  NaN   NaN
4  NaN   NaN  NaN   NaN  NaN   NaN

Сохранить все исходные строки и столбцы, а также все исходные значения

>>> df.compare(df2, keep_shape=True, keep_equal=True)
  col1       col2       col3
  self other self other self other
0    a     c  1.0   1.0  1.0   1.0
1    a     a  2.0   2.0  2.0   2.0
2    b     b  3.0   3.0  3.0   4.0
3    b     b  NaN   NaN  4.0   4.0
4    a     a  5.0   5.0  5.0   5.0