pandas.read_orc#

pandas.read_orc(путь, columns=None, dtype_backend=, filesystem=None, **kwargs)[источник]#

Загрузите объект ORC из пути к файлу, возвращая DataFrame.

Параметры:
путьstr, объект пути или файлоподобный объект

Строка, объект пути (реализующий os.PathLike[str]), или файлоподобный объект, реализующий двоичный read() функция. Строка может быть URL-адресом. Допустимые схемы URL включают http, ftp, s3 и file. Для URL-адресов файлов ожидается хост. Локальный файл может быть: file://localhost/path/to/table.orc.

столбцысписок, по умолчанию None

Если не None, только эти столбцы будут прочитаны из файла. Вывод всегда следует порядку файла, а не списку столбцов. Это отражает исходное поведение pyarrow.orc.ORCFile.read().

dtype_backend{'numpy_nullable', 'pyarrow'}, по умолчанию 'numpy_nullable'

Тип данных бэкенда, примененный к результирующему DataFrame (все еще экспериментальная). Поведение следующее:

  • "numpy_nullable": возвращает поддерживаемый нуллифицируемым типом данных DataFrame (по умолчанию).

  • "pyarrow": возвращает nullable на основе pyarrow ArrowDtype DataFrame.

Добавлено в версии 2.0.

файловая системафайловая система fsspec или pyarrow, по умолчанию None

Объект файловой системы для использования при чтении файла parquet.

Добавлено в версии 2.1.0.

**kwargs

Любые дополнительные kwargs передаются в pyarrow.

Возвращает:
DataFrame

Примечания

Перед использованием этой функции вам следует прочитать руководство пользователя о ORC и установить дополнительные зависимости.

Если path является схемой URI, указывающей на локальный или удалённый файл (например, "s3://"), pyarrow.fs файловая система попытается прочитать файл. Вы также можете передать объект файловой системы pyarrow или fsspec в ключевое слово filesystem, чтобы переопределить это поведение.

Примеры

>>> result = pd.read_orc("example_pa.orc")