pandas.arrays.SparseArray#

класс pandas.arrays.SparseArray(данные, sparse_index=None, fill_value=None, kind='integer', dtype=None, copy=False)[источник]#

ExtensionArray для хранения разреженных данных.

Параметры:

данныемассивоподобный объект или скаляр

Плотный массив значений для хранения в SparseArray. Он может содержать fill_value.

sparse_indexSparseIndex, optional

fill_valueскаляр, опционально

Элементы в данных, которые fill_value не хранятся в SparseArray. Для экономии памяти это должно быть наиболее частое значение в данные. По умолчанию, fill_value зависит от типа данных (dtype) в данные:

data.dtype	na_value
float	`np.nan`
int	`0`
bool	False
datetime64	`pd.NaT`
timedelta64	`pd.NaT`

Значение заполнения может быть указано тремя способами. В порядке приоритета это

The fill_value аргумент
dtype.fill_value if fill_value равно None и dtype is a SparseDtype
data.dtype.fill_value if fill_value равно None и dtype не является SparseDtype и данные является SparseArray.

kindstr

Может быть 'integer' или 'block', по умолчанию 'integer'. Тип хранения для разреженных местоположений.

'block': Хранит блок и block_length для каждого непрерывного span разреженных значений. Это лучше всего, когда разреженные данные имеют тенденцию группироваться вместе, с большими областями fill-value значения между разреженными значениями.
'integer': использует целое число для хранения местоположения каждого разреженного значения.

dtypenp.dtype или SparseDtype, опционально

Тип данных для использования в SparseArray. Для numpy dtypes это определяет dtype self.sp_values. Для SparseDtype, это определяет self.sp_values и self.fill_value.

copybool, по умолчанию False

Следует ли явно копировать входящие данные массив.

Атрибуты

None

Методы

None

Примеры

>>> from pandas.arrays import SparseArray
>>> arr = SparseArray([0, 0, 1, 2])
>>> arr
[0, 0, 1, 2]
Fill: 0
IntIndex
Indices: array([2, 3], dtype=int32)