Общие функции#

Манипуляции с данными#

melt(frame[, id_vars, value_vars, var_name, ...])

Преобразовать DataFrame из широкого в длинный формат, опционально оставляя идентификаторы установленными.

pivot(data, *, columns[, index, values])

Возвращает преобразованный DataFrame, организованный по заданным значениям индекса/столбца.

pivot_table(data[, values, index, columns, ...])

Создает сводную таблицу в стиле электронных таблиц как DataFrame.

crosstab(index, columns[, values, rownames, ...])

Вычислить простую перекрёстную таблицу двух (или более) факторов.

cut(x, bins[, right, labels, retbins, ...])

Разбить значения на дискретные интервалы.

qcut(x, q[, labels, retbins, precision, ...])

Функция дискретизации на основе квантилей.

merge(left, right[, how, on, left_on, ...])

Объедините объекты DataFrame или именованные Series с соединением в стиле базы данных.

merge_ordered(left, right[, on, left_on, ...])

Выполнить слияние для упорядоченных данных с опциональным заполнением/интерполяцией.

merge_asof(left, right[, on, left_on, ...])

shteken +

concat(objs, *[, axis, join, ignore_index, ...])

Объединить объекты pandas вдоль определенной оси.

get_dummies(data[, prefix, prefix_sep, ...])

Преобразовать категориальную переменную в фиктивные/индикаторные переменные.

from_dummies(data[, sep, default_category])

Создать категориальный DataFrame из DataFrame фиктивных переменных.

factorize(values[, sort, use_na_sentinel, ...])

Кодировать объект как перечисленный тип или категориальную переменную.

unique(values)

Возвращает уникальные значения на основе хэш-таблицы.

lreshape(data, groups[, dropna])

Преобразование данных из широкого формата в длинный.

wide_to_long(df, stubnames, i, j[, sep, suffix])

Преобразование DataFrame из широкого формата в длинный.

Отсутствующие данные верхнего уровня#

isna(obj)

Обнаружить пропущенные значения для объекта, подобного массиву.

isnull(obj)

Обнаружить пропущенные значения для объекта, подобного массиву.

notna(obj)

Обнаружение не-пропущенных значений для объекта, подобного массиву.

notnull(obj)

Обнаружение не-пропущенных значений для объекта, подобного массиву.

Верхнеуровневая работа с числовыми данными#

to_numeric(arg[, errors, downcast, ...])

Преобразовать аргумент в числовой тип.

Верхнеуровневая работа с данными типа даты/времени#

to_datetime(arg[, errors, dayfirst, ...])

Преобразовать аргумент в datetime.

to_timedelta(arg[, unit, errors])

Преобразовать аргумент в timedelta.

date_range([start, end, periods, freq, tz, ...])

Возвращает DatetimeIndex с фиксированной частотой.

bdate_range([start, end, periods, freq, tz, ...])

Возвращает DatetimeIndex с фиксированной частотой, где по умолчанию используется рабочий день.

period_range([start, end, periods, freq, name])

Вернуть PeriodIndex с фиксированной частотой.

timedelta_range([start, end, periods, freq, ...])

Возвращает TimedeltaIndex с фиксированной частотой, где день используется по умолчанию.

infer_freq(индекс)

Определяет наиболее вероятную частоту по заданному индексу.

Работа с интервальными данными на верхнем уровне#

interval_range([start, end, periods, freq, ...])

Возвращает IntervalIndex с фиксированной частотой.

Высокоуровневая оценка#

eval(expr[, parser, engine, local_dict, ...])

Вычислить выражение Python в виде строки с использованием различных бэкендов.

Форматы даты и времени#

tseries.api.guess_datetime_format(dt_str[, ...])

Определить формат даты и времени для заданной строки даты и времени.

Хеширование#

util.hash_array(vals[, encoding, hash_key, ...])

Для одномерного массива возвращает массив детерминированных целых чисел.

util.hash_pandas_object(obj[, index, ...])

Возвращает хэш данных Index/Series/DataFrame.

Импорт из других библиотек DataFrame#

api.interchange.from_dataframe(df[, allow_copy])

Построить pd.DataFrame из любого DataFrame, поддерживающего протокол обмена.