pandas.ExcelFile#

класс pandas.ExcelFile(path_or_buffer, движок=None, storage_options=None, engine_kwargs=None)[источник]#

Класс для преобразования табличных листов Excel в объекты DataFrame.

См. read_excel для дополнительной документации.

Параметры:
path_or_bufferstr, bytes, объект пути (pathlib.Path или py._path.local.LocalPath),

Объект, подобный файлу, книга xlrd или книга openpyxl. Если строка или объект пути, ожидается путь к файлу .xls, .xlsx, .xlsb, .xlsm, .odf, .ods или .odt.

движокstr, по умолчанию None

Если io не является буфером или путем, это должно быть установлено для идентификации io. Поддерживаемые движки: xlrd, openpyxl, odf, pyxlsb, calamine Совместимость движков:

  • xlrd поддерживает старые файлы Excel (.xls).

  • openpyxl поддерживает более новые форматы файлов Excel.

  • odf поддерживает форматы файлов OpenDocument (.odf, .ods, .odt).

  • pyxlsb поддерживает двоичные файлы Excel.

  • calamine поддерживает форматы файлов Excel (.xls, .xlsx, .xlsm, .xlsb) и OpenDocument (.ods).

Изменено в версии 1.2.0: Движок xlrd теперь поддерживает только старый стиль .xls файлы. Когда engine=None, будет использована следующая логика для определения движка:

  • Если path_or_buffer является форматом OpenDocument (.odf, .ods, .odt), тогда odf будет использоваться.

  • В противном случае, если path_or_buffer является форматом xls, xlrd будет использоваться.

  • В противном случае, если path_or_buffer имеет формат xlsb, pyxlsb будет использоваться.

Добавлено в версии 1.3.0.

  • В противном случае, если openpyxl установлен, тогда openpyxl будет использоваться.

  • В противном случае, если xlrd >= 2.0 установлен, ValueError будет вызвано исключение.

Предупреждение

Пожалуйста, не сообщайте о проблемах при использовании xlrd для чтения .xlsx файлы. Это не поддерживается, переключитесь на использование openpyxl вместо этого.

engine_kwargsdict, optional

Произвольные ключевые аргументы, передаваемые движку Excel.

Примеры

>>> file = pd.ExcelFile('myfile.xlsx')  
>>> with pd.ExcelFile("myfile.xls") as xls:  
...     df1 = pd.read_excel(xls, "Sheet1")  

Атрибуты

book

sheet_names

Методы

close()

закрыть io при необходимости

parse([sheet_name, header, names, ...])

Преобразовать указанные листы в DataFrame.