pandas.DataFrame.info#
- DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, show_counts=None)[источник]#
Вывести краткую сводку DataFrame.
Этот метод выводит информацию о DataFrame, включая tип данных индекса и столбцов, ненулевые значения и использование памяти.
- Параметры:
- verbosebool, необязательно
Печатать ли полную сводку. По умолчанию используется настройка в
pandas.options.display.max_info_columnsследует.- bufзаписываемый буфер, по умолчанию sys.stdout
Куда отправлять вывод. По умолчанию вывод выводится в sys.stdout. Передайте записываемый буфер, если вам нужно дополнительно обработать вывод.
- max_colsint, необязательный
Когда переключаться с подробного на сокращённый вывод. Если DataFrame содержит более max_cols столбцы, используется усечённый вывод. По умолчанию настройка в
pandas.options.display.max_info_columnsиспользуется.- memory_usagebool, str, optional
Указывает, следует ли отображать общее использование памяти элементами DataFrame (включая индекс). По умолчанию это следует
pandas.options.display.memory_usageнастройка.True всегда показывает использование памяти. False никогда не показывает использование памяти. Значение 'deep' эквивалентно "True с глубокой интроспекцией". Использование памяти отображается в удобочитаемых единицах (представление с основанием 2). Без глубокой интроспекции оценка памяти выполняется на основе типа данных столбца и количества строк, предполагая, что значения потребляют одинаковый объем памяти для соответствующих типов данных. При глубокой интроспекции памяти выполняется реальный расчет использования памяти за счет вычислительных ресурсов. См. Часто задаваемые вопросы для получения дополнительной информации.
- show_countsbool, необязательно
Показывать ли количество ненулевых значений. По умолчанию это показывается только если DataFrame меньше, чем
pandas.options.display.max_info_rowsиpandas.options.display.max_info_columns. Значение True всегда показывает количество, а False никогда не показывает количество.
- Возвращает:
- None
Этот метод выводит сводку DataFrame и возвращает None.
Смотрите также
DataFrame.describeСгенерировать описательную статистику столбцов DataFrame.
DataFrame.memory_usageИспользование памяти столбцами DataFrame.
Примеры
>>> int_values = [1, 2, 3, 4, 5] >>> text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon'] >>> float_values = [0.0, 0.25, 0.5, 0.75, 1.0] >>> df = pd.DataFrame({"int_col": int_values, "text_col": text_values, ... "float_col": float_values}) >>> df int_col text_col float_col 0 1 alpha 0.00 1 2 beta 0.25 2 3 gamma 0.50 3 4 delta 0.75 4 5 epsilon 1.00
Выводит информацию обо всех столбцах:
>>> df.info(verbose=True)
RangeIndex: 5 entries, 0 to 4 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 int_col 5 non-null int64 1 text_col 5 non-null object 2 float_col 5 non-null float64 dtypes: float64(1), int64(1), object(1) memory usage: 248.0+ bytes Выводит сводку по количеству столбцов и их типам данных, но не информацию по каждому столбцу:
>>> df.info(verbose=False)
RangeIndex: 5 entries, 0 to 4 Columns: 3 entries, int_col to float_col dtypes: float64(1), int64(1), object(1) memory usage: 248.0+ bytes Перенаправление вывода DataFrame.info в буфер вместо sys.stdout, получение содержимого буфера и запись в текстовый файл:
>>> import io >>> buffer = io.StringIO() >>> df.info(buf=buffer) >>> s = buffer.getvalue() >>> with open("df_info.txt", "w", ... encoding="utf-8") as f: ... f.write(s) 260
The memory_usage параметр включает режим глубокой интроспекции, особенно полезный для больших DataFrame и тонкой настройки оптимизации памяти:
>>> random_strings_array = np.random.choice(['a', 'b', 'c'], 10 ** 6) >>> df = pd.DataFrame({ ... 'column_1': np.random.choice(['a', 'b', 'c'], 10 ** 6), ... 'column_2': np.random.choice(['a', 'b', 'c'], 10 ** 6), ... 'column_3': np.random.choice(['a', 'b', 'c'], 10 ** 6) ... }) >>> df.info()
RangeIndex: 1000000 entries, 0 to 999999 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 column_1 1000000 non-null object 1 column_2 1000000 non-null object 2 column_3 1000000 non-null object dtypes: object(3) memory usage: 22.9+ MB >>> df.info(memory_usage='deep')
RangeIndex: 1000000 entries, 0 to 999999 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 column_1 1000000 non-null object 1 column_2 1000000 non-null object 2 column_3 1000000 non-null object dtypes: object(3) memory usage: 165.9 MB