SVM: Разделяющая гиперплоскость для несбалансированных классов#

Найдите оптимальную разделяющую гиперплоскость с использованием SVC для несбалансированных классов.

Сначала мы находим разделяющую плоскость с помощью простого SVC, а затем строим (пунктирной линией) разделяющую гиперплоскость с автоматической коррекцией для несбалансированных классов.

Примечание

#5211 SVC(kernel="linear") с SGDClassifier(loss="hinge"). Установка loss параметр метода SGDClassifier равно hinge приведет к поведению, аналогичному SVC с линейным ядром.

Например, попробуйте вместо SVC:

clf = SGDClassifier(n_iter=100, alpha=0.01)
plot separating hyperplane unbalanced
# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

import matplotlib.lines as mlines
import matplotlib.pyplot as plt

from sklearn import svm
from sklearn.datasets import make_blobs
from sklearn.inspection import DecisionBoundaryDisplay

# we create two clusters of random points
n_samples_1 = 1000
n_samples_2 = 100
centers = [[0.0, 0.0], [2.0, 2.0]]
clusters_std = [1.5, 0.5]
X, y = make_blobs(
    n_samples=[n_samples_1, n_samples_2],
    centers=centers,
    cluster_std=clusters_std,
    random_state=0,
    shuffle=False,
)

# fit the model and get the separating hyperplane
clf = svm.SVC(kernel="linear", C=1.0)
clf.fit(X, y)

# fit the model and get the separating hyperplane using weighted classes
wclf = svm.SVC(kernel="linear", class_weight={1: 10})
wclf.fit(X, y)

# plot the samples
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired, edgecolors="k")

# plot the decision functions for both classifiers
ax = plt.gca()
disp = DecisionBoundaryDisplay.from_estimator(
    clf,
    X,
    plot_method="contour",
    colors="k",
    levels=[0],
    alpha=0.5,
    linestyles=["-"],
    ax=ax,
)

# plot decision boundary and margins for weighted classes
wdisp = DecisionBoundaryDisplay.from_estimator(
    wclf,
    X,
    plot_method="contour",
    colors="r",
    levels=[0],
    alpha=0.5,
    linestyles=["-"],
    ax=ax,
)

plt.legend(
    [
        mlines.Line2D([], [], color="k", label="non weighted"),
        mlines.Line2D([], [], color="r", label="weighted"),
    ],
    ["non weighted", "weighted"],
    loc="upper right",
)
plt.show()

Общее время выполнения скрипта: (0 минут 0.146 секунд)

Связанные примеры

SVM: Разделяющая гиперплоскость с максимальным зазором

SVM: Разделяющая гиперплоскость с максимальным зазором

SGD: Гиперплоскость максимального разделяющего запаса

SGD: Гиперплоскость максимального разделяющего запаса

Построение различных классификаторов SVM на наборе данных iris

Построение различных классификаторов SVM на наборе данных iris

Пример границ SVM

Пример границ SVM

Галерея, созданная Sphinx-Gallery