pandas.read_sas#

pandas.read_sas(filepath_or_buffer, *, формат=None, index=None, кодировка=None, chunksize=None, итератор=False, compression='infer')[источник]#

Чтение файлов SAS, сохраненных в форматах XPORT или SAS7BDAT.

Параметры:
filepath_or_bufferstr, объект пути или файлоподобный объект

Строка, объект пути (реализующий os.PathLike[str]), или файлоподобный объект, реализующий двоичный read() функция. Строка может быть URL-адресом. Допустимые схемы URL включают http, ftp, s3 и file. Для URL-адресов файлов ожидается хост. Локальный файл может быть: file://localhost/path/to/table.sas7bdat.

форматstr {'xport', 'sas7bdat'} или None

Если None, формат файла определяется по расширению файла. Если 'xport' или 'sas7bdat', используется соответствующий формат.

indexидентификатор столбца индекса, по умолчанию None

Идентификатор столбца, который должен использоваться в качестве индекса DataFrame.

кодировкаstr, по умолчанию None

Кодировка для текстовых данных. Если None, текстовые данные хранятся как сырые байты.

chunksizeint

Прочитать файл chunksize строк за раз, возвращает итератор.

итераторbool, по умолчанию False

Если True, возвращает итератор для пошагового чтения файла.

compressionстрока или словарь, по умолчанию ‘infer’

Для динамической распаковки данных на диске. Если 'infer' и 'filepath_or_buffer' является путем, то определить сжатие по следующим расширениям: '.gz', '.bz2', '.zip', '.xz', '.zst', '.tar', '.tar.gz', '.tar.xz' или '.tar.bz2' (в противном случае без сжатия). Если используется 'zip' или 'tar', ZIP-файл должен содержать только один файл данных для чтения. Установить в None для отсутствия распаковки. Также может быть словарём с ключом 'method' установить в одно из {'zip', 'gzip', 'bz2', 'zstd', 'xz', 'tar'} и другие пары ключ-значение передаются в zipfile.ZipFile, gzip.GzipFile, bz2.BZ2File, zstandard.ZstdDecompressor, lzma.LZMAFile или tarfile.TarFile, соответственно. В качестве примера, следующее может быть передано для декомпрессии Zstandard с использованием пользовательского словаря сжатия: compression={'method': 'zstd', 'dict_data': my_compression_dict}.

Добавлено в версии 1.5.0: Добавлена поддержка для .tar файлы.

Возвращает:
DataFrame, если iterator=False и chunksize=None, иначе SAS7BDATReader
или XportReader

Примеры

>>> df = pd.read_sas("sas_data.sas7bdat")