pandas.DataFrame.to_numpy#

DataFrame.to_numpy(dtype=None, copy=False, na_value=)[источник]#

Преобразовать DataFrame в массив NumPy.

По умолчанию dtype возвращаемого массива будет общим dtype NumPy всех типов в DataFrame. Например, если dtypes равны float16 и float32, тип данных результата будет float32. Это может потребовать копирования данных и приведения значений, что может быть затратным.

Параметры:
dtypestr или numpy.dtype, опционально

Тип данных для передачи в numpy.asarray().

copybool, по умолчанию False

Следует ли гарантировать, что возвращаемое значение не является представлением другого массива. Обратите внимание, что copy=False не обеспечить что to_numpy() не копирует. Скорее, copy=True гарантировать, что создается копия, даже если это не строго необходимо.

na_valueAny, опционально

Значение для использования в качестве пропущенных значений. Значение по умолчанию зависит от dtype и типы данных столбцов DataFrame.

Возвращает:
numpy.ndarray

Смотрите также

Series.to_numpy

Аналогичный метод для Series.

Примеры

>>> pd.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
array([[1, 3],
       [2, 4]])

С разнородными данными придется использовать наименьший общий тип.

>>> df = pd.DataFrame({"A": [1, 2], "B": [3.0, 4.5]})
>>> df.to_numpy()
array([[1. , 3. ],
       [2. , 4.5]])

Для смеси числовых и нечисловых типов выходной массив будет иметь тип данных object.

>>> df['C'] = pd.date_range('2000', periods=2)
>>> df.to_numpy()
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
       [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)