pandas.read_orc#
-
pandas.read_orc(путь, columns=None, dtype_backend=
, filesystem=None, **kwargs)[источник]# Загрузите объект ORC из пути к файлу, возвращая DataFrame.
- Параметры:
- путьstr, объект пути или файлоподобный объект
Строка, объект пути (реализующий
os.PathLike[str]), или файлоподобный объект, реализующий двоичныйread()функция. Строка может быть URL-адресом. Допустимые схемы URL включают http, ftp, s3 и file. Для URL-адресов файлов ожидается хост. Локальный файл может быть:file://localhost/path/to/table.orc.- столбцысписок, по умолчанию None
Если не None, только эти столбцы будут прочитаны из файла. Вывод всегда следует порядку файла, а не списку столбцов. Это отражает исходное поведение
pyarrow.orc.ORCFile.read().- dtype_backend{'numpy_nullable', 'pyarrow'}, по умолчанию 'numpy_nullable'
Тип данных бэкенда, примененный к результирующему
DataFrame(все еще экспериментальная). Поведение следующее:"numpy_nullable": возвращает поддерживаемый нуллифицируемым типом данныхDataFrame(по умолчанию)."pyarrow": возвращает nullable на основе pyarrowArrowDtypeDataFrame.
Добавлено в версии 2.0.
- файловая системафайловая система fsspec или pyarrow, по умолчанию None
Объект файловой системы для использования при чтении файла parquet.
Добавлено в версии 2.1.0.
- **kwargs
Любые дополнительные kwargs передаются в pyarrow.
- Возвращает:
- DataFrame
Примечания
Перед использованием этой функции вам следует прочитать руководство пользователя о ORC и установить дополнительные зависимости.
Если
pathявляется схемой URI, указывающей на локальный или удалённый файл (например, "s3://"),pyarrow.fsфайловая система попытается прочитать файл. Вы также можете передать объект файловой системы pyarrow или fsspec в ключевое слово filesystem, чтобы переопределить это поведение.Примеры
>>> result = pd.read_orc("example_pa.orc")