pandas.DataFrame.to_hdf#
- DataFrame.to_hdf(path_or_buf, *, ключ, mode='a', complevel=None, complib=None, append=False, формат=None, index=True, min_itemsize=None, nan_rep=None, dropna=None, data_columns=None, ошибки='strict', кодировка='UTF-8')[источник]#
Записать содержащиеся данные в файл HDF5 с использованием HDFStore.
Иерархический формат данных (HDF) является самодокументируемым, позволяя приложению интерпретировать структуру и содержимое файла без внешней информации. Один HDF-файл может содержать смесь связанных объектов, которые могут быть доступны как группа или как отдельные объекты.
Чтобы добавить другой DataFrame или Series в существующий HDF файл, используйте режим добавления и другой ключ.
Предупреждение
Скользящее применение к нескольким столбцам, где функция возвращает скаляр (средневзвешенная цена по объёму)
DataFrameилиSeriesв HDF5, но тип подкласса теряется при сохранении.Для получения дополнительной информации см. руководство пользователя.
- Параметры:
- path_or_bufstr или pandas.HDFStore
Путь к файлу или объект HDFStore.
- ключstr
Идентификатор для группы в хранилище.
- mode{'a', 'w', 'r+'}, по умолчанию 'a'
Режим открытия файла:
‘w’: запись, создается новый файл (существующий файл с тем же именем будет удален).
‘a’: append, существующий файл открывается для чтения и записи, и если файл не существует, он создается.
‘r+’: аналогично ‘a’, но файл должен уже существовать.
- complevel{0-9}, по умолчанию None
Задаёт уровень сжатия для данных. Значение 0 или None отключает сжатие.
- complib{‘zlib’, ‘lzo’, ‘bzip2’, ‘blosc’}, по умолчанию ‘zlib’
Указывает библиотеку сжатия для использования. Поддерживаются следующие дополнительные компрессоры для Blosc (по умолчанию, если компрессор не указан: ‘blosc:blosclz’): {‘blosc:blosclz’, ‘blosc:lz4’, ‘blosc:lz4hc’, ‘blosc:snappy’, ‘blosc:zlib’, ‘blosc:zstd’}. Указание библиотеки сжатия, которая недоступна, вызывает ValueError.
- appendbool, по умолчанию False
Для табличных форматов, добавьте входные данные к существующим.
- формат{‘fixed’, ‘table’, None}, по умолчанию ‘fixed’
Возможные значения:
‘fixed’: Фиксированный формат. Быстрая запись/чтение. Не поддерживает добавление и поиск.
'table': Формат таблицы. Запись как структура PyTables Table, которая может работать хуже, но позволяет более гибкие операции, такие как поиск / выбор подмножеств данных.
Если None, проверяется pd.get_option(‘io.hdf.default_format’), затем используется резервный вариант “fixed”.
- indexbool, по умолчанию True
Записать индекс DataFrame как столбец.
- min_itemsizeсловарь или целое число, необязательно
Сопоставление имен столбцов с минимальными размерами строк для столбцов.
- nan_repAny, опционально
Как представлять нулевые значения в виде строки. Не допускается с append=True.
- dropnabool, по умолчанию False, необязательный
Удалить пропущенные значения.
- data_columnsсписок столбцов или True, опционально
Список столбцов для создания как индексированных столбцов данных для запросов на диске, или True для использования всех столбцов. По умолчанию индексируются только оси объекта. См. Запрос через столбцы данных. для дополнительной информации. Применимо только к format=’table’.
- ошибкиstr, по умолчанию 'strict'
Определяет, как обрабатывать ошибки кодирования и декодирования. См. аргумент errors для
open()для полного списка опций.- кодировкаstr, по умолчанию “UTF-8”
Смотрите также
read_hdfЧтение из файла HDF.
DataFrame.to_orcЗапись DataFrame в двоичный формат orc.
DataFrame.to_parquetЗапись DataFrame в бинарный формат parquet.
DataFrame.to_sqlЗапись в таблицу SQL.
DataFrame.to_featherЗапись feather-формата для DataFrames.
DataFrame.to_csvЗапись в CSV-файл.
Примеры
>>> df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, ... index=['a', 'b', 'c']) >>> df.to_hdf('data.h5', key='df', mode='w')
Мы можем добавить другой объект в тот же файл:
>>> s = pd.Series([1, 2, 3, 4]) >>> s.to_hdf('data.h5', key='s')
Чтение из файла HDF:
>>> pd.read_hdf('data.h5', 'df') A B a 1 4 b 2 5 c 3 6 >>> pd.read_hdf('data.h5', 's') 0 1 1 2 2 3 3 4 dtype: int64