Разделение слепых источников с использованием FastICA#

Пример оценки источников из зашумленных данных.

Анализ независимых компонент (ICA) используется для оценки источников при наличии зашумленных измерений. Представьте 3 инструмента, играющих одновременно, и 3 микрофона, записывающих смешанные сигналы. ICA используется для восстановления источников, т.е. того, что играет каждый инструмент. Важно, что PCA не справляется с восстановлением наших instruments поскольку соответствующие сигналы отражают негауссовские процессы.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Сгенерировать тестовые данные#

import numpy as np
from scipy import signal

np.random.seed(0)
n_samples = 2000
time = np.linspace(0, 8, n_samples)

s1 = np.sin(2 * time)  # Signal 1 : sinusoidal signal
s2 = np.sign(np.sin(3 * time))  # Signal 2 : square signal
s3 = signal.sawtooth(2 * np.pi * time)  # Signal 3: saw tooth signal

S = np.c_[s1, s2, s3]
S += 0.2 * np.random.normal(size=S.shape)  # Add noise

S /= S.std(axis=0)  # Standardize data
# Mix data
A = np.array([[1, 1, 1], [0.5, 2, 1.0], [1.5, 1.0, 2.0]])  # Mixing matrix
X = np.dot(S, A.T)  # Generate observations

Подгонка моделей ICA и PCA#

from sklearn.decomposition import PCA, FastICA

# Compute ICA
ica = FastICA(n_components=3, whiten="arbitrary-variance")
S_ = ica.fit_transform(X)  # Reconstruct signals
A_ = ica.mixing_  # Get estimated mixing matrix

# We can `prove` that the ICA model applies by reverting the unmixing.
assert np.allclose(X, np.dot(S_, A_.T) + ica.mean_)

# For comparison, compute PCA
pca = PCA(n_components=3)
H = pca.fit_transform(X)  # Reconstruct signals based on orthogonal components

Построить результаты#

import matplotlib.pyplot as plt

plt.figure()

models = [X, S, S_, H]
names = [
    "Observations (mixed signal)",
    "True Sources",
    "ICA recovered signals",
    "PCA recovered signals",
]
colors = ["red", "steelblue", "orange"]

for ii, (model, name) in enumerate(zip(models, names), 1):
    plt.subplot(4, 1, ii)
    plt.title(name)
    for sig, color in zip(model.T, colors):
        plt.plot(sig, color=color)

plt.tight_layout()
plt.show()
Observations (mixed signal), True Sources, ICA recovered signals, PCA recovered signals

Общее время выполнения скрипта: (0 минут 0.338 секунд)

Связанные примеры

FastICA на 2D облаках точек

FastICA на 2D облаках точек

Orthogonal Matching Pursuit

Orthogonal Matching Pursuit

Сравнение ядерной гребневой регрессии и регрессии по методу Гауссовских процессов

Сравнение ядерной гребневой регрессии и регрессии по методу Гауссовских процессов

Способность гауссовского процесса регрессии (GPR) оценивать уровень шума данных

Способность гауссовского процесса регрессии (GPR) оценивать уровень шума данных

Галерея, созданная Sphinx-Gallery