pandas.DataFrame.to_hdf#

DataFrame.to_hdf(path_or_buf, *, ключ, mode='a', complevel=None, complib=None, append=False, формат=None, index=True, min_itemsize=None, nan_rep=None, dropna=None, data_columns=None, ошибки='strict', кодировка='UTF-8')[источник]#

Записать содержащиеся данные в файл HDF5 с использованием HDFStore.

Иерархический формат данных (HDF) является самодокументируемым, позволяя приложению интерпретировать структуру и содержимое файла без внешней информации. Один HDF-файл может содержать смесь связанных объектов, которые могут быть доступны как группа или как отдельные объекты.

Чтобы добавить другой DataFrame или Series в существующий HDF файл, используйте режим добавления и другой ключ.

Предупреждение

Скользящее применение к нескольким столбцам, где функция возвращает скаляр (средневзвешенная цена по объёму) DataFrame или Series в HDF5, но тип подкласса теряется при сохранении.

Для получения дополнительной информации см. руководство пользователя.

Параметры:

path_or_bufstr или pandas.HDFStore

Путь к файлу или объект HDFStore.

ключstr

Идентификатор для группы в хранилище.

mode{'a', 'w', 'r+'}, по умолчанию 'a'

Режим открытия файла:

‘w’: запись, создается новый файл (существующий файл с тем же именем будет удален).
‘a’: append, существующий файл открывается для чтения и записи, и если файл не существует, он создается.
‘r+’: аналогично ‘a’, но файл должен уже существовать.

complevel{0-9}, по умолчанию None

Задаёт уровень сжатия для данных. Значение 0 или None отключает сжатие.

complib{‘zlib’, ‘lzo’, ‘bzip2’, ‘blosc’}, по умолчанию ‘zlib’

Указывает библиотеку сжатия для использования. Поддерживаются следующие дополнительные компрессоры для Blosc (по умолчанию, если компрессор не указан: ‘blosc:blosclz’): {‘blosc:blosclz’, ‘blosc:lz4’, ‘blosc:lz4hc’, ‘blosc:snappy’, ‘blosc:zlib’, ‘blosc:zstd’}. Указание библиотеки сжатия, которая недоступна, вызывает ValueError.

appendbool, по умолчанию False

Для табличных форматов, добавьте входные данные к существующим.

формат{‘fixed’, ‘table’, None}, по умолчанию ‘fixed’

Возможные значения:

‘fixed’: Фиксированный формат. Быстрая запись/чтение. Не поддерживает добавление и поиск.
'table': Формат таблицы. Запись как структура PyTables Table, которая может работать хуже, но позволяет более гибкие операции, такие как поиск / выбор подмножеств данных.
Если None, проверяется pd.get_option(‘io.hdf.default_format’), затем используется резервный вариант “fixed”.

indexbool, по умолчанию True

Записать индекс DataFrame как столбец.

min_itemsizeсловарь или целое число, необязательно

Сопоставление имен столбцов с минимальными размерами строк для столбцов.

nan_repAny, опционально

Как представлять нулевые значения в виде строки. Не допускается с append=True.

dropnabool, по умолчанию False, необязательный

Удалить пропущенные значения.

data_columnsсписок столбцов или True, опционально

Список столбцов для создания как индексированных столбцов данных для запросов на диске, или True для использования всех столбцов. По умолчанию индексируются только оси объекта. См. Запрос через столбцы данных. для дополнительной информации. Применимо только к format=’table’.

ошибкиstr, по умолчанию 'strict'

Определяет, как обрабатывать ошибки кодирования и декодирования. См. аргумент errors для open() для полного списка опций.

кодировкаstr, по умолчанию “UTF-8”

Смотрите также

read_hdf: Чтение из файла HDF.
DataFrame.to_orc: Запись DataFrame в двоичный формат orc.
DataFrame.to_parquet: Запись DataFrame в бинарный формат parquet.
DataFrame.to_sql: Запись в таблицу SQL.
DataFrame.to_feather: Запись feather-формата для DataFrames.
DataFrame.to_csv: Запись в CSV-файл.

Примеры

>>> df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]},
...                   index=['a', 'b', 'c'])  
>>> df.to_hdf('data.h5', key='df', mode='w')  

Мы можем добавить другой объект в тот же файл:

>>> s = pd.Series([1, 2, 3, 4])  
>>> s.to_hdf('data.h5', key='s')  

Чтение из файла HDF:

>>> pd.read_hdf('data.h5', 'df')  
A  B
a  1  4
b  2  5
c  3  6
>>> pd.read_hdf('data.h5', 's')  
0    1
1    2
2    3
3    4
dtype: int64