pandas.DataFrame.compare#
- DataFrame.сравнить(other, align_axis=1, keep_shape=False, keep_equal=False, result_names=('self', 'other'))[источник]#
Сравнить с другим DataFrame и показать различия.
- Параметры:
- otherDataFrame
Объект для сравнения.
- align_axis{0 или ‘index’, 1 или ‘columns’}, по умолчанию 1
Определить, по какой оси выравнивать сравнение.
- 0, или 'index'Полученные различия складываются вертикально
со строками, поочередно взятыми из self и other.
- 1, или 'columns'Полученные различия выровнены горизонтально
со столбцами, поочередно взятыми из self и other.
- keep_shapebool, по умолчанию False
Если true, сохраняются все строки и столбцы. В противном случае сохраняются только те, которые имеют разные значения.
- keep_equalbool, по умолчанию False
Если true, результат сохраняет равные значения. В противном случае равные значения отображаются как NaN.
- result_namesкортеж, по умолчанию ('self', 'other')
Установите имена фреймов данных в сравнении.
Добавлено в версии 1.5.0.
- Возвращает:
- DataFrame
DataFrame, показывающий различия, расположенные рядом.
Результирующий индекс будет MultiIndex с 'self' и 'other', чередующимися на внутреннем уровне.
- Вызывает:
- ValueError
Когда два DataFrame не имеют идентичных меток или формы.
Смотрите также
Series.compareСравнить с другой Series и показать различия.
DataFrame.equalsПроверить, содержат ли два объекта одинаковые элементы.
Примечания
Совпадающие NaN не будут отображаться как различие.
Можно сравнивать только идентично помеченные (т.е. одинаковой формы, с идентичными метками строк и столбцов) DataFrame
Примеры
>>> df = pd.DataFrame( ... { ... "col1": ["a", "a", "b", "b", "a"], ... "col2": [1.0, 2.0, 3.0, np.nan, 5.0], ... "col3": [1.0, 2.0, 3.0, 4.0, 5.0] ... }, ... columns=["col1", "col2", "col3"], ... ) >>> df col1 col2 col3 0 a 1.0 1.0 1 a 2.0 2.0 2 b 3.0 3.0 3 b NaN 4.0 4 a 5.0 5.0
>>> df2 = df.copy() >>> df2.loc[0, 'col1'] = 'c' >>> df2.loc[2, 'col3'] = 4.0 >>> df2 col1 col2 col3 0 c 1.0 1.0 1 a 2.0 2.0 2 b 3.0 4.0 3 b NaN 4.0 4 a 5.0 5.0
Выровнять различия по столбцам
>>> df.compare(df2) col1 col3 self other self other 0 a c NaN NaN 2 NaN NaN 3.0 4.0
Назначить result_names
>>> df.compare(df2, result_names=("left", "right")) col1 col3 left right left right 0 a c NaN NaN 2 NaN NaN 3.0 4.0
Сложить разности по строкам
>>> df.compare(df2, align_axis=0) col1 col3 0 self a NaN other c NaN 2 self NaN 3.0 other NaN 4.0
Сохранить равные значения
>>> df.compare(df2, keep_equal=True) col1 col3 self other self other 0 a c 1.0 1.0 2 b b 3.0 4.0
Сохранить все исходные строки и столбцы
>>> df.compare(df2, keep_shape=True) col1 col2 col3 self other self other self other 0 a c NaN NaN NaN NaN 1 NaN NaN NaN NaN NaN NaN 2 NaN NaN NaN NaN 3.0 4.0 3 NaN NaN NaN NaN NaN NaN 4 NaN NaN NaN NaN NaN NaN
Сохранить все исходные строки и столбцы, а также все исходные значения
>>> df.compare(df2, keep_shape=True, keep_equal=True) col1 col2 col3 self other self other self other 0 a c 1.0 1.0 1.0 1.0 1 a a 2.0 2.0 2.0 2.0 2 b b 3.0 3.0 3.0 4.0 3 b b NaN NaN 4.0 4.0 4 a a 5.0 5.0 5.0 5.0