pandas.read_sas#
- pandas.read_sas(filepath_or_buffer, *, формат=None, index=None, кодировка=None, chunksize=None, итератор=False, compression='infer')[источник]#
Чтение файлов SAS, сохраненных в форматах XPORT или SAS7BDAT.
- Параметры:
- filepath_or_bufferstr, объект пути или файлоподобный объект
Строка, объект пути (реализующий
os.PathLike[str]), или файлоподобный объект, реализующий двоичныйread()функция. Строка может быть URL-адресом. Допустимые схемы URL включают http, ftp, s3 и file. Для URL-адресов файлов ожидается хост. Локальный файл может быть:file://localhost/path/to/table.sas7bdat.- форматstr {'xport', 'sas7bdat'} или None
Если None, формат файла определяется по расширению файла. Если 'xport' или 'sas7bdat', используется соответствующий формат.
- indexидентификатор столбца индекса, по умолчанию None
Идентификатор столбца, который должен использоваться в качестве индекса DataFrame.
- кодировкаstr, по умолчанию None
Кодировка для текстовых данных. Если None, текстовые данные хранятся как сырые байты.
- chunksizeint
Прочитать файл chunksize строк за раз, возвращает итератор.
- итераторbool, по умолчанию False
Если True, возвращает итератор для пошагового чтения файла.
- compressionстрока или словарь, по умолчанию ‘infer’
Для динамической распаковки данных на диске. Если 'infer' и 'filepath_or_buffer' является путем, то определить сжатие по следующим расширениям: '.gz', '.bz2', '.zip', '.xz', '.zst', '.tar', '.tar.gz', '.tar.xz' или '.tar.bz2' (в противном случае без сжатия). Если используется 'zip' или 'tar', ZIP-файл должен содержать только один файл данных для чтения. Установить в
Noneдля отсутствия распаковки. Также может быть словарём с ключом'method'установить в одно из {'zip','gzip','bz2','zstd','xz','tar'} и другие пары ключ-значение передаются вzipfile.ZipFile,gzip.GzipFile,bz2.BZ2File,zstandard.ZstdDecompressor,lzma.LZMAFileилиtarfile.TarFile, соответственно. В качестве примера, следующее может быть передано для декомпрессии Zstandard с использованием пользовательского словаря сжатия:compression={'method': 'zstd', 'dict_data': my_compression_dict}.Добавлено в версии 1.5.0: Добавлена поддержка для .tar файлы.
- Возвращает:
- DataFrame, если iterator=False и chunksize=None, иначе SAS7BDATReader
- или XportReader
Примеры
>>> df = pd.read_sas("sas_data.sas7bdat")