DataFrame#

Конструктор#

DataFrame([data, index, columns, dtype, copy])

Двумерные, изменяемые по размеру, потенциально гетерогенные табличные данные.

Атрибуты и базовые данные#

Оси

DataFrame.index

Индекс (метки строк) DataFrame.

DataFrame.columns

Метки столбцов DataFrame.

DataFrame.dtypes

Возвращает типы данных в DataFrame.

DataFrame.info([verbose, buf, max_cols, ...])

Вывести краткую сводку DataFrame.

DataFrame.select_dtypes([include, exclude])

Возвращает подмножество столбцов DataFrame на основе типов данных столбцов.

DataFrame.values

Возвращает представление DataFrame в виде массива Numpy.

DataFrame.axes

Возвращает список, представляющий оси DataFrame.

DataFrame.ndim

Возвращает целое число, представляющее количество осей / размерностей массива.

DataFrame.size

Вернуть целое число, представляющее количество элементов в этом объекте.

DataFrame.shape

Возвращает кортеж, представляющий размерность DataFrame.

DataFrame.memory_usage([index, deep])

Возвращает использование памяти каждого столбца в байтах.

DataFrame.empty

Индикатор, пуст ли Series/DataFrame.

DataFrame.set_flags(*[, copy, ...])

Возвращает новый объект с обновленными флагами.

Преобразование#

DataFrame.astype(dtype[, copy, errors])

Привести объект pandas к указанному типу данных dtype.

DataFrame.convert_dtypes([infer_objects, ...])

Преобразование столбцов к наилучшим возможным типам данных с использованием типов, поддерживающих pd.NA.

DataFrame.infer_objects([copy])

Попытка вывести лучшие типы данных для столбцов object.

DataFrame.copy([deep])

Создать копию индексов и данных этого объекта.

DataFrame.bool()

(УСТАРЕЛО) Возвращает логическое значение для одного элемента Series или DataFrame.

DataFrame.to_numpy([dtype, copy, na_value])

Преобразовать DataFrame в массив NumPy.

Индексирование, итерация#

DataFrame.head([n])

Вернуть первый n строк.

DataFrame.at

Получите одно значение для пары меток строки/столбца.

DataFrame.iat

Доступ к одиночному значению для пары строка/столбец по целочисленной позиции.

DataFrame.loc

Доступ к группе строк и столбцов по метке(ам) или булевому массиву.

DataFrame.iloc

(УСТАРЕЛО) Индексирование, основанное исключительно на целочисленных позициях для выбора по положению.

DataFrame.insert(loc, column, value[, ...])

Вставить столбец в DataFrame в указанное место.

DataFrame.__iter__()

Итерация по информационной оси.

DataFrame.items()

Итерация по парам (имя столбца, Series).

DataFrame.keys()

Получить 'информационную ось' (см. Индексирование для подробностей).

DataFrame.iterrows()

Итерация по строкам DataFrame как парам (индекс, Series).

DataFrame.itertuples([index, name])

Итерация по строкам DataFrame как по namedtuples.

DataFrame.pop(элемент)

Вернуть элемент и удалить из фрейма.

DataFrame.tail([n])

Возвращает последний n строк.

DataFrame.xs(key[, axis, level, drop_level])

Возвращает поперечное сечение из Series/DataFrame.

DataFrame.get(key[, default])

Получить элемент из объекта по заданному ключу (например, столбец DataFrame).

DataFrame.isin(values)

Содержится ли каждый элемент в DataFrame в значениях.

DataFrame.where(cond[, other, inplace, ...])

Заменить значения, где условие ложно.

DataFrame.mask(cond[, other, inplace, axis, ...])

Заменить значения, где условие истинно.

DataFrame.query(expr, *[, inplace])

в руководстве пользователя по пропущенным данным.

Для получения дополнительной информации о .at, .iat, .loc, и .iloc, см. документация по индексированию.

Функции бинарных операторов#

DataFrame.__add__(other)

Получить сложение DataFrame и другого объекта, по столбцам.

DataFrame.add(other[, axis, level, fill_value])

Получить сложение dataframe и other, поэлементно (бинарный оператор добавить).

DataFrame.sub(other[, axis, level, fill_value])

Получить вычитание dataframe и other, поэлементно (бинарный оператор sub).

DataFrame.mul(other[, axis, level, fill_value])

Получение умножения dataframe и другого объекта поэлементно (бинарный оператор mul).

DataFrame.div(other[, axis, level, fill_value])

Получить деление с плавающей точкой dataframe и другого объекта, поэлементно (бинарный оператор truediv).

DataFrame.truediv(other[, axis, level, ...])

Получить деление с плавающей точкой dataframe и другого объекта, поэлементно (бинарный оператор truediv).

DataFrame.floordiv(other[, axis, level, ...])

Получить целочисленное деление dataframe и другого объекта, поэлементно (бинарный оператор floordiv).

DataFrame.mod(other[, axis, level, fill_value])

Получить остаток от деления dataframe и other поэлементно (бинарный оператор mod).

DataFrame.pow(other[, axis, level, fill_value])

Получить экспоненциальную степень dataframe и другого, поэлементно (бинарный оператор pow).

DataFrame.dot(other)

Вычислить матричное умножение между DataFrame и другим объектом.

DataFrame.radd(other[, axis, level, fill_value])

Получить сложение dataframe и other, поэлементно (бинарный оператор radd).

DataFrame.rsub(other[, axis, level, fill_value])

Получить вычитание dataframe и other, поэлементно (бинарный оператор rsub).

DataFrame.rmul(other[, axis, level, fill_value])

Получение умножения dataframe и другого объекта поэлементно (бинарный оператор rmul).

DataFrame.rdiv(other[, axis, level, fill_value])

Получить деление с плавающей точкой dataframe и другого объекта, поэлементно (бинарный оператор rtruediv).

DataFrame.rtruediv(other[, axis, level, ...])

Получить деление с плавающей точкой dataframe и другого объекта, поэлементно (бинарный оператор rtruediv).

DataFrame.rfloordiv(other[, axis, level, ...])

Получить целочисленное деление dataframe и другого объекта, поэлементно (бинарный оператор rfloordiv).

DataFrame.rmod(other[, axis, level, fill_value])

Получить остаток от деления dataframe и other поэлементно (бинарный оператор rmod).

DataFrame.rpow(other[, axis, level, fill_value])

Получить экспоненциальную степень dataframe и другого, поэлементно (бинарный оператор rpow).

DataFrame.lt(other[, axis, level])

Получить меньше, чем dataframe и other, поэлементно (бинарный оператор lt).

DataFrame.gt(other[, axis, level])

Получить "Больше чем" для dataframe и другого, поэлементно (бинарный оператор gt).

DataFrame.le(other[, axis, level])

Получить меньше или равно dataframe и другого, поэлементно (бинарный оператор le).

DataFrame.ge(other[, axis, level])

Получить больше или равно для DataFrame и другого объекта, поэлементно (бинарный оператор ge).

DataFrame.ne(other[, axis, level])

Получить "не равно" для dataframe и другого объекта, поэлементно (бинарный оператор ne).

DataFrame.eq(other[, axis, level])

Получить равенство dataframe и other, поэлементно (бинарный оператор eq).

DataFrame.combineигнорируется при использовании выходного формата

Выполнить объединение по столбцам с другим DataFrame.

DataFrame.combine_first(other)

Обновить нулевые элементы значением в том же месте в other.

Применение функций, GroupBy и окна#

DataFrame.apply(func[, axis, raw, ...])

Применить функцию вдоль оси DataFrame.

DataFrame.map(func[, na_action])

Применить функцию к элементам Dataframe поэлементно.

DataFrame.applymap(func[, na_action])

(УСТАРЕЛО) Применяет функцию к элементам DataFrame поэлементно.

DataFrame.pipe(func, *args, **kwargs)

Применение цепочечных функций, которые ожидают Series или DataFrames.

DataFrame.agg([func, axis])

Агрегировать с использованием одной или нескольких операций по указанной оси.

DataFrame.aggregate([func, axis])

Агрегировать с использованием одной или нескольких операций по указанной оси.

DataFrame.transform(func[, axis])

Вызов func на self, создавая DataFrame с той же формой оси, что и self.

DataFrame.groupby([by, axis, level, ...])

Группировка DataFrame с использованием маппера или по Series столбцов.

DataFrame.rolling(window[, min_periods, ...])

Предоставляет скользящие оконные вычисления.

DataFrame.expanding([min_periods, axis, method])

Предоставить вычисления с расширяющимся окном.

DataFrame.ewm([com, span, halflife, alpha, ...])

Предоставить экспоненциально взвешенные (EW) вычисления.

Вычисления / описательная статистика#

DataFrame.abs()

Возвращает Series/DataFrame с абсолютным числовым значением каждого элемента.

DataFrame.all([axis, bool_only, skipna])

Возвращает, являются ли все элементы True, возможно по оси.

DataFrame.any(*[, axis, bool_only, skipna])

Возвращает, является ли какой-либо элемент True, возможно, по оси.

DataFrame.clip([lower, upper, axis, inplace])

Обрежьте значения по заданному порогу(ам).

DataFrame.corr([method, min_periods, ...])

Вычисляет попарную корреляцию столбцов, исключая значения NA/null.

DataFrame.corrwith(other[, axis, drop, ...])

Вычислить попарную корреляцию.

DataFrame.count([axis, numeric_only])

Подсчёт непустых ячеек для каждого столбца или строки.

DataFrame.cov([min_periods, ddof, numeric_only])

Вычислить попарную ковариацию столбцов, исключая значения NA/null.

DataFrame.cummax([axis, skipna])

Возвращает кумулятивный максимум по оси DataFrame или Series.

DataFrame.cummin([axis, skipna])

Возвращает кумулятивный минимум по оси DataFrame или Series.

DataFrame.cumprod([axis, skipna])

Возвращает кумулятивное произведение по оси DataFrame или Series.

DataFrame.cumsum([axis, skipna])

Возвращает кумулятивную сумму по оси DataFrame или Series.

DataFrame.describe([percentiles, include, ...])

Генерация описательной статистики.

DataFrame.diff([periods, axis])

Первая дискретная разность элемента.

DataFrame.eval(expr, *[, inplace])

Вычислить строку, описывающую операции над столбцами DataFrame.

DataFrame.kurt([axis, skipna, numeric_only])

Возвращает несмещённый эксцесс по запрошенной оси.

DataFrame.kurtosis([axis, skipna, numeric_only])

Возвращает несмещённый эксцесс по запрошенной оси.

DataFrame.max([axis, skipna, numeric_only])

Возвращает максимальное значение по запрошенной оси.

DataFrame.mean([axis, skipna, numeric_only])

Возвращает среднее значение по запрошенной оси.

DataFrame.median([axis, skipna, numeric_only])

Возвращает медиану значений по запрошенной оси.

DataFrame.min([axis, skipna, numeric_only])

Возвращает минимальное значение по указанной оси.

DataFrame.mode([axis, numeric_only, dropna])

Получить моду(ы) каждого элемента вдоль выбранной оси.

DataFrame.pct_change([periods, fill_method, ...])

Дробное изменение между текущим и предыдущим элементом.

DataFrame.prod([axis, skipna, numeric_only, ...])

Возвращает произведение значений по запрошенной оси.

DataFrame.product([axis, skipna, ...])

Возвращает произведение значений по запрошенной оси.

DataFrame.quantile([q, axis, numeric_only, ...])

Возвращает значения на заданном квантиле по запрошенной оси.

DataFrame.rank([axis, method, numeric_only, ...])

Вычисление числовых рангов данных (от 1 до n) вдоль оси.

DataFrame.round([decimals])

Округление DataFrame до переменного числа десятичных знаков.

DataFrame.sem([axis, skipna, ddof, numeric_only])

Возвращает несмещённую стандартную ошибку среднего по запрошенной оси.

DataFrame.skew([axis, skipna, numeric_only])

Возвращает несмещенное асимметричное распределение по запрошенной оси.

DataFrame.sum([axis, skipna, numeric_only, ...])

Возвращает сумму значений по запрошенной оси.

DataFrame.std([axis, skipna, ddof, numeric_only])

Возвращает выборочное стандартное отклонение по указанной оси.

DataFrame.var([axis, skipna, ddof, numeric_only])

Возвращает несмещенную дисперсию по запрошенной оси.

DataFrame.nunique([axis, dropna])

Подсчет количества уникальных элементов по указанной оси.

DataFrame.value_counts([subset, normalize, …])

Возвращает Series, содержащий частоту каждой уникальной строки в Dataframe.

Переиндексация / выборка / манипуляция метками#

DataFrame.add_prefix(prefix[, axis])

Добавить префикс к меткам строкой префикс.

DataFrame.add_suffix(suffix[, axis])

Добавление строковых суффиксов к меткам суффикс.

DataFrame.align(other[, join, axis, level, ...])

Выровнять два объекта по их осям с указанным методом соединения.

DataFrame.at_time(time[, asof, axis])

Выбор значений в определенное время суток (например, 9:30 утра).

DataFrame.between_time(start_time, end_time)

Выбрать значения между определенными временами дня (например, 9:00-9:30 утра).

DataFrame.drop([labels, axis, index, ...])

Удаляет указанные метки из строк или столбцов.

DataFrame.drop_duplicates([subset, keep, ...])

Возвращает DataFrame с удаленными дублирующимися строками.

DataFrame.duplicated([subset, keep])

Возвращает булеву Series, обозначающую дублирующиеся строки.

DataFrame.equals(other)

Проверить, содержат ли два объекта одинаковые элементы.

DataFrame.filter([items, like, regex, axis])

Выберите подмножество строк или столбцов фрейма данных в соответствии с указанными метками индекса.

DataFrame.first(смещение)

(УСТАРЕЛО) Выбор начальных периодов временных рядов на основе смещения даты.

DataFrame.head([n])

Вернуть первый n строк.

DataFrame.idxmax([axis, skipna, numeric_only])

Возвращает индекс первого вхождения максимума по запрошенной оси.

DataFrame.idxmin([axis, skipna, numeric_only])

Возвращает индекс первого вхождения минимума по запрошенной оси.

DataFrame.last(смещение)

(УСТАРЕЛО) Выбирать последние периоды временных рядов на основе смещения даты.

DataFrame.reindex([labels, index, columns, ...])

Привести DataFrame к новому индексу с опциональной логикой заполнения.

DataFrame.reindex_like(other[, method, ...])

Возвращает объект с совпадающими индексами, как другой объект.

DataFrame.rename([mapper, index, columns, ...])

Переименовать столбцы или метки индекса.

DataFrame.rename_axis([mapper, index, ...])

Установите имя оси для индекса или столбцов.

DataFrame.reset_index([level, drop, ...])

Сбросить индекс или его уровень.

DataFrame.sample([n, frac, replace, ...])

Вернуть случайную выборку элементов из оси объекта.

DataFrame.set_axis(labels, *[, axis, copy])

Назначить желаемый индекс для заданной оси.

DataFrame.set_index(keys, *[, drop, append, ...])

Установите индекс DataFrame, используя существующие столбцы.

DataFrame.tail([n])

Возвращает последний n строк.

DataFrame.take(indices[, axis])

Возвращает элементы в заданном позиционный индексы вдоль оси.

DataFrame.truncate([before, after, axis, copy])

Обрезать Series или DataFrame до и после некоторого значения индекса.

Обработка пропущенных данных#

DataFrame.backfill(*[, axis, inplace, ...])

(УСТАРЕЛО) Заполнение значений NA/NaN с использованием следующего допустимого наблюдения для заполнения пропуска.

DataFrame.bfill(*[, axis, inplace, limit, ...])

Заполните значения NA/NaN, используя следующее допустимое наблюдение для заполнения пробела.

DataFrame.dropna(*[, axis, how, thresh, ...])

Удалить пропущенные значения.

DataFrame.ffill(*[, axis, inplace, limit, ...])

Заполнение NA/NaN значений путем распространения последнего валидного наблюдения до следующего валидного.

DataFrame.fillna([value, method, axis, ...])

Заполнить значения NA/NaN с использованием указанного метода.

DataFrame.interpolate([method, axis, limit, ...])

Заполнить значения NaN с помощью метода интерполяции.

DataFrame.isna()

Обнаружить пропущенные значения.

DataFrame.isnull()

DataFrame.isnull является псевдонимом для DataFrame.isna.

DataFrame.notna()

Обнаружить существующие (не пропущенные) значения.

DataFrame.notnull()

DataFrame.notnull является псевдонимом для DataFrame.notna.

DataFrame.pad(*[, axis, inplace, limit, ...])

(УСТАРЕЛО) Заполнение значений NA/NaN путем распространения последнего допустимого наблюдения на следующее допустимое.

DataFrame.replace([to_replace, value, ...])

Заменить значения, указанные в to_replace с значение.

Изменение формы, сортировка, транспонирование#

DataFrame.droplevel(level[, axis])

Возвращает Series/DataFrame с удаленным запрошенным уровнем индекса/столбца.

DataFrame.pivot(*, columns[, index, values])

Возвращает преобразованный DataFrame, организованный по заданным значениям индекса/столбца.

DataFrame.pivot_table([values, index, ...])

Создает сводную таблицу в стиле электронных таблиц как DataFrame.

DataFrame.reorder_levels(order[, axis])

Переупорядочить уровни индекса, используя порядок ввода.

DataFrame.sort_values(by, *[, axis, ...])

Сортировка по значениям вдоль любой оси.

DataFrame.sort_index(*[, axis, level, ...])

Сортировать объект по меткам (вдоль оси).

DataFrame.nlargest(n, columns[, keep])

Вернуть первый n строки, упорядоченные по столбцы в порядке убывания.

DataFrame.nsmallest(n, columns[, keep])

Вернуть первый n строки, упорядоченные по столбцы в порядке возрастания.

DataFrame.swaplevel([i, j, axis])

Поменять местами уровни i и j в MultiIndex.

DataFrame.stack([level, dropna, sort, ...])

Переместить указанные уровни из столбцов в индекс.

DataFrame.unstack([level, fill_value, sort])

Свод уровня (обязательно иерархических) меток индекса.

DataFrame.swapaxes(axis1, axis2[, copy])

(УСТАРЕЛО) Поменять местами оси и соответствующим образом поменять значения осей.

DataFrame.melt([id_vars, value_vars, ...])

Преобразовать DataFrame из широкого в длинный формат, опционально оставляя идентификаторы установленными.

DataFrame.explode(column[, ignore_index])

Преобразование каждого элемента списко-подобного объекта в строку с репликацией значений индекса.

DataFrame.squeeze([axis])

Сжать одномерные объекты осей в скаляры.

DataFrame.to_xarray()

Вернуть объект xarray из объекта pandas.

DataFrame.T

Транспонирование DataFrame.

DataFrame.transpose(*args[, copy])

Транспонировать индексы и столбцы.

Объединение / сравнение / соединение / слияние#

DataFrame.assign(**kwargs)

Назначить новые столбцы для DataFrame.

DataFrame.compare(other[, align_axis, ...])

Сравнить с другим DataFrame и показать различия.

DataFrame.join(other[, on, how, lsuffix, ...])

Объединить столбцы другого DataFrame.

DataFrame.merge(right[, how, on, left_on, ...])

Объедините объекты DataFrame или именованные Series с соединением в стиле базы данных.

DataFrame.update(other[, join, overwrite, ...])

Изменение на месте с использованием не-NA значений из другого DataFrame.

Флаги#

Флаги относятся к атрибутам объекта pandas. Свойства набора данных (например, дата записи, URL, с которого он был получен, и т.д.) должны храниться в DataFrame.attrs.

Flags(obj, *, allows_duplicate_labels)

Флаги, применяемые к объектам pandas.

Метаданные#

DataFrame.attrs это словарь для хранения глобальных метаданных для этого DataFrame.

Предупреждение

DataFrame.attrs считается экспериментальным и может измениться без предупреждения.

DataFrame.attrs

Словарь глобальных атрибутов этого набора данных.

Построение графиков#

DataFrame.plot является одновременно вызываемым методом и атрибутом пространства имен для конкретных методов построения графиков вида DataFrame.plot..

DataFrame.plot([x, y, kind, ax, ....])

аксессор и метод построения графиков DataFrame

DataFrame.plot.area([x, y, stacked])

Построить stacked area plot.

DataFrame.plot.bar([x, y])

Вертикальная столбчатая диаграмма.

DataFrame.plot.barh([x, y])

Создать горизонтальную столбчатую диаграмму.

DataFrame.plot.box([by])

Построить диаграмму размаха (ящик с усами) для столбцов DataFrame.

DataFrame.plot.density([bw_method, ind])

Построение оценки плотности ядра с использованием гауссовских ядер.

DataFrame.plot.hexbin(x, y[, C, ...])

Создать график гексагонального бинирования.

DataFrame.plot.hist([by, bins])

Построить одну гистограмму столбцов DataFrame.

DataFrame.plot.kde([bw_method, ind])

Построение оценки плотности ядра с использованием гауссовских ядер.

DataFrame.plot.line([x, y])

Построение Series или DataFrame в виде линий.

DataFrame.plot.pie(**kwargs)

Создать круговую диаграмму.

DataFrame.plot.scatter(x, y[, s, c])

Создать точечную диаграмму с изменяющимся размером и цветом точек маркера.

DataFrame.boxplot([column, by, ax, ...])

Создать диаграмму размаха из столбцов DataFrame.

DataFrame.hist([column, by, grid, ...])

Построить гистограмму столбцов DataFrame.

Sparse аксессор#

Для разреженных типов данных предоставляются специфические методы и атрибуты под DataFrame.sparse аксессор.

DataFrame.sparse.density

Отношение неразреженных точек к общему количеству (плотных) точек данных.

DataFrame.sparse.from_spmatrix(data[, ...])

Создать новый DataFrame из разреженной матрицы scipy.

DataFrame.sparse.to_coo()

Возвращает содержимое фрейма в виде разреженной матрицы SciPy COO.

DataFrame.sparse.to_dense()

Преобразовать DataFrame с разреженными значениями в плотные.

Сериализация / Ввод-вывод / преобразование#

DataFrame.from_dict(data[, orient, dtype, ...])

Создание DataFrame из словаря массивоподобных объектов или словарей.

DataFrame.from_records(data[, index, ...])

Преобразование структурированного или записного ndarray в DataFrame.

DataFrame.to_orc([path, engine, index, ...])

Запись DataFrame в формат ORC.

DataFrame.to_parquet([path, engine, ...])

Запись DataFrame в бинарный формат parquet.

DataFrame.to_pickle(path, *[, compression, ...])

Pickle (сериализация) объекта в файл.

DataFrame.to_csv([path_or_buf, sep, na_rep, ...])

Запись объекта в файл значений, разделенных запятыми (csv).

DataFrame.to_hdf(path_or_buf, *, key[, ...])

Записать содержащиеся данные в файл HDF5 с использованием HDFStore.

DataFrame.to_sql(name, con, *[, schema, ...])

Записать записи, хранящиеся в DataFrame, в базу данных SQL.

DataFrame.to_dict([orient, into, index])

Преобразуйте DataFrame в словарь.

DataFrame.to_excel(excel_writer, *[, ...])

Запись объекта на лист Excel.

DataFrame.to_json([path_or_buf, orient, ...])

Преобразовать объект в строку JSON.

DataFrame.to_html([buf, columns, col_space, ...])

Отобразить DataFrame как HTML-таблицу.

DataFrame.to_feather(путь, **kwargs)

Запись DataFrame в двоичный формат Feather.

DataFrame.to_latex([buf, columns, header, ...])

Отобразить объект в виде таблицы LaTeX, longtable или вложенной таблицы.

DataFrame.to_stata(path, *[, convert_dates, ...])

Экспортировать объект DataFrame в формат Stata dta.

DataFrame.to_gbq(destination_table, *[, ...])

(УСТАРЕЛО) Запись DataFrame в таблицу Google BigQuery.

DataFrame.to_records([index, column_dtypes, ...])

Преобразовать DataFrame в массив записей NumPy.

DataFrame.to_stringЭнди Ли +

Отобразить DataFrame в табличном формате, удобном для консоли.

DataFrame.to_clipboard(*[, excel, sep])

Копировать объект в буфер обмена системы.

DataFrame.to_markdown([buf, mode, index, ...])

Вывод DataFrame в формате, удобном для Markdown.

DataFrame.style

Возвращает объект Styler.

DataFrame.__dataframe__([nan_as_null, ...])

Возвращает объект обмена dataframe, реализующий протокол обмена.