mean_variance_axis#

sklearn.utils.sparsefuncs.mean_variance_axis(X, ось, веса=None, return_sum_weights=False)[источник]#

Вычислить среднее и дисперсию вдоль оси на CSR или CSC матрице.

Параметры:
Xразреженная матрица формы (n_samples, n_features)

Входные данные. Могут быть в формате CSR или CSC.

ось{0, 1}

Ось, вдоль которой должна быть вычислена ось.

весаndarray of shape (n_samples,) or (n_features,), default=None

Если axis установлен в 0, форма (n_samples,) или если axis установлен в 1, форма (n_features,). Если установлено None, то выборки имеют равный вес.

Добавлено в версии 0.24.

return_sum_weightsbool, по умолчанию=False

Если True, возвращает сумму весов, наблюдаемых для каждого признака, если axis=0 или для каждого образца, если axis=1.

Добавлено в версии 0.24.

Возвращает:
средние значенияndarray формы (n_features,), dtype=floating

Средние значения по признакам.

дисперсииndarray формы (n_features,), dtype=floating

Дисперсии по признакам.

sum_weightsndarray формы (n_features,), dtype=floating

Возвращается, если return_sum_weights является True.

Примеры

>>> from sklearn.utils import sparsefuncs
>>> from scipy import sparse
>>> import numpy as np
>>> indptr = np.array([0, 3, 4, 4, 4])
>>> indices = np.array([0, 1, 2, 2])
>>> data = np.array([8, 1, 2, 5])
>>> scale = np.array([2, 3, 2])
>>> csr = sparse.csr_matrix((data, indices, indptr))
>>> csr.todense()
matrix([[8, 1, 2],
        [0, 0, 5],
        [0, 0, 0],
        [0, 0, 0]])
>>> sparsefuncs.mean_variance_axis(csr, axis=0)
(array([2.  , 0.25, 1.75]), array([12.    ,  0.1875,  4.1875]))