pandas.DataFrame.to_orc#

DataFrame.to_orc(путь=None, *, движок='pyarrow', index=None, engine_kwargs=None)[источник]#

Запись DataFrame в формат ORC.

Добавлено в версии 1.5.0.

Параметры:
путьstr, файлоподобный объект или None, по умолчанию None

Если строка, она будет использоваться как путь к корневому каталогу при записи секционированного набора данных. Под файлоподобным объектом мы подразумеваем объекты с методом write(), такие как файловый дескриптор (например, через встроенную функцию open). Если path равен None, возвращается объект bytes.

движок{‘pyarrow’}, по умолчанию ‘pyarrow’

Библиотека ORC для использования.

indexbool, необязательно

Если True, включить индексы датафрейма в вывод файла. Если False, они не будут записаны в файл. Если None, аналогично infer индекс(ы) датафрейма будут сохранены. Однако вместо сохранения в виде значений RangeIndex будет храниться как диапазон в метаданных, поэтому он не занимает много места и работает быстрее. Другие индексы будут включены как столбцы в выходном файле.

engine_kwargsdict[str, Any] или None, по умолчанию None

Дополнительные ключевые аргументы, передаваемые в pyarrow.orc.write_table().

Возвращает:
байты, если аргумент пути не предоставлен, иначе None
Вызывает:
NotImplementedError

Тип данных одного или нескольких столбцов — категория, беззнаковые целые числа, интервал, период или разреженный.

ValueError

движок не pyarrow.

Смотрите также

read_orc

Прочитать файл ORC.

DataFrame.to_parquet

Записать файл в формате parquet.

DataFrame.to_csv

Записать csv файл.

DataFrame.to_sql

Запись в таблицу SQL.

DataFrame.to_hdf

Запись в hdf.

Примечания

Примеры

>>> df = pd.DataFrame(data={'col1': [1, 2], 'col2': [4, 3]})
>>> df.to_orc('df.orc')  
>>> pd.read_orc('df.orc')  
   col1  col2
0     1     4
1     2     3

Если вы хотите получить буфер для содержимого orc, вы можете записать его в io.BytesIO

>>> import io
>>> b = io.BytesIO(df.to_orc())  
>>> b.seek(0)  
0
>>> content = b.read()