Примеры#

Это галерея примеров, демонстрирующих, как можно использовать scikit-learn. Некоторые примеры показывают использование API в целом и некоторые демонстрируют конкретные приложения в форме учебника. Также ознакомьтесь с нашими руководство пользователя для более подробных иллюстраций.

Основные изменения в выпуске#

Эти примеры иллюстрируют основные особенности выпусков scikit-learn.

Основные нововведения в scikit-learn 1.8

Основные нововведения в scikit-learn 1.8

Основные новости выпуска scikit-learn 1.7

Основные новости выпуска scikit-learn 1.7

Основные новости выпуска scikit-learn 1.6

Основные новости выпуска scikit-learn 1.6

Основные новости выпуска scikit-learn 1.5

Основные новости выпуска scikit-learn 1.5

Основные нововведения выпуска scikit-learn 1.4

Основные нововведения выпуска scikit-learn 1.4

Основные изменения в выпуске scikit-learn 1.3

Основные изменения в выпуске scikit-learn 1.3

Основные новости выпуска scikit-learn 1.2

Основные новости выпуска scikit-learn 1.2

Основные изменения в выпуске scikit-learn 1.1

Основные изменения в выпуске scikit-learn 1.1

Основные новости выпуска scikit-learn 1.0

Основные новости выпуска scikit-learn 1.0

Основные нововведения scikit-learn 0.24

Основные нововведения scikit-learn 0.24

Основные новости выпуска scikit-learn 0.23

Основные новости выпуска scikit-learn 0.23

Основные нововведения в выпуске scikit-learn 0.22

Основные нововведения в выпуске scikit-learn 0.22

Бикластеризация#

Примеры, касающиеся методов бикластеризации.

Демонстрация алгоритма Spectral Biclustering

Демонстрация алгоритма Spectral Biclustering

Демонстрация алгоритма спектральной совместной кластеризации

Демонстрация алгоритма спектральной совместной кластеризации

Бикластеризация документов с помощью алгоритма спектральной совместной кластеризации

Бикластеризация документов с помощью алгоритма спектральной совместной кластеризации

Калибровка#

Примеры, иллюстрирующие калибровку предсказанных вероятностей классификаторов.

Сравнение калибровки классификаторов

Сравнение калибровки классификаторов

Кривые калибровки вероятности

Кривые калибровки вероятности

Калибровка вероятностей для классификации на 3 класса

Калибровка вероятностей для классификации на 3 класса

Калибровка вероятностей классификаторов

Калибровка вероятностей классификаторов

Классификация#

Общие примеры о классификационных алгоритмах.

Сравнение классификаторов

Сравнение классификаторов

Линейный и квадратичный дискриминантный анализ с эллипсоидом ковариации

Линейный и квадратичный дискриминантный анализ с эллипсоидом ковариации

Нормальный, Ledoit-Wolf и OAS линейный дискриминантный анализ для классификации

Нормальный, Ledoit-Wolf и OAS линейный дискриминантный анализ для классификации

Построить график вероятности классификации

Построить график вероятности классификации

Распознавание рукописных цифр

Распознавание рукописных цифр

Кластеризация#

Примеры, касающиеся sklearn.cluster модуль.

Демонстрация кластеризации K-Means на данных рукописных цифр

Демонстрация кластеризации K-Means на данных рукописных цифр

Демонстрация структурированной иерархической кластеризации Уорда на изображении монет

Демонстрация структурированной иерархической кластеризации Уорда на изображении монет

Демонстрация алгоритма кластеризации mean-shift

Демонстрация алгоритма кластеризации mean-shift

Коррекция на случайность в оценке производительности кластеризации

Коррекция на случайность в оценке производительности кластеризации

Агломеративная кластеризация с разными метриками

Агломеративная кластеризация с разными метриками

Пример инициализации K-Means++

Пример инициализации K-Means++

Сравнение производительности биссекционного K-средних и обычного K-средних

Сравнение производительности биссекционного K-средних и обычного K-средних

Сравнение BIRCH и MiniBatchKMeans

Сравнение BIRCH и MiniBatchKMeans

Сравнение различных алгоритмов кластеризации на игрушечных наборах данных

Сравнение различных алгоритмов кластеризации на игрушечных наборах данных

Сравнение различных методов иерархической связи на игрушечных наборах данных

Сравнение различных методов иерархической связи на игрушечных наборах данных

Сравнение алгоритмов кластеризации K-Means и MiniBatchKMeans

Сравнение алгоритмов кластеризации K-Means и MiniBatchKMeans

Демонстрация алгоритма кластеризации DBSCAN

Демонстрация алгоритма кластеризации DBSCAN

Демонстрация алгоритма кластеризации HDBSCAN

Демонстрация алгоритма кластеризации HDBSCAN

Демонстрация алгоритма кластеризации OPTICS

Демонстрация алгоритма кластеризации OPTICS

Демонстрация алгоритма кластеризации с распространением аффинности

Демонстрация алгоритма кластеризации с распространением аффинности

Демонстрация предположений k-means

Демонстрация предположений k-means

Эмпирическая оценка влияния инициализации k-means

Эмпирическая оценка влияния инициализации k-means

Агломерация признаков

Агломерация признаков

Агломерация признаков против одномерного отбора

Агломерация признаков против одномерного отбора

Иерархическая кластеризация со структурой и без

Иерархическая кластеризация со структурой и без

Индуктивная кластеризация

Индуктивная кластеризация

Онлайн-обучение словаря частей лиц

Онлайн-обучение словаря частей лиц

Построить дендрограмму иерархической кластеризации

Построить дендрограмму иерархической кластеризации

Сегментация изображения греческих монет на регионы

Сегментация изображения греческих монет на регионы

Выбор количества кластеров с помощью анализа силуэта для кластеризации KMeans

Выбор количества кластеров с помощью анализа силуэта для кластеризации KMeans

Спектральная кластеризация для сегментации изображений

Спектральная кластеризация для сегментации изображений

Различные агломеративные кластеризации на 2D-вложении цифр

Различные агломеративные кластеризации на 2D-вложении цифр

Пример векторного квантования

Пример векторного квантования

Оценка ковариации#

Примеры, касающиеся sklearn.covariance модуль.

Оценка Ледойта-Вольфа против OAS оценки

Оценка Ледойта-Вольфа против OAS оценки

Робастная оценка ковариации и релевантность расстояний Махаланобиса

Робастная оценка ковариации и релевантность расстояний Махаланобиса

Робастная vs эмпирическая оценка ковариации

Робастная vs эмпирическая оценка ковариации

Оценка ковариации сжатием: LedoitWolf vs OAS и максимальное правдоподобие

Оценка ковариации сжатием: LedoitWolf vs OAS и максимальное правдоподобие

Оценка разреженной обратной ковариации

Оценка разреженной обратной ковариации

Перекрестное разложение#

Примеры, касающиеся sklearn.cross_decomposition модуль.

Сравнить методы перекрёстного разложения

Сравнить методы перекрёстного разложения

Регрессия на главных компонентах против регрессии методом частичных наименьших квадратов

Регрессия на главных компонентах против регрессии методом частичных наименьших квадратов

Примеры наборов данных#

Примеры, касающиеся sklearn.datasets модуль.

Построение случайно сгенерированного многометочного набора данных

Построение случайно сгенерированного многометочного набора данных

Деревья решений#

Примеры, касающиеся sklearn.tree модуль.

Регрессия дерева решений

Регрессия дерева решений

Построить поверхность решений деревьев решений, обученных на наборе данных ирисов

Построить поверхность решений деревьев решений, обученных на наборе данных ирисов

Пост-обрезка деревьев решений с обрезкой по стоимости сложности

Пост-обрезка деревьев решений с обрезкой по стоимости сложности

Понимание структуры дерева решений

Понимание структуры дерева решений

Разложение#

Примеры, касающиеся sklearn.decomposition модуль.

Разделение слепых источников с использованием FastICA

Разделение слепых источников с использованием FastICA

Сравнение LDA и PCA 2D проекции набора данных Iris

Сравнение LDA и PCA 2D проекции набора данных Iris

Разложения набора данных Faces

Разложения набора данных Faces

Факторный анализ (с вращением) для визуализации паттернов

Факторный анализ (с вращением) для визуализации паттернов

FastICA на 2D облаках точек

FastICA на 2D облаках точек

Удаление шума изображений с использованием обучения словаря

Удаление шума изображений с использованием обучения словаря

Инкрементальный PCA

Инкрементальный PCA

Ядерный PCA

Ядерный PCA

Выбор модели с вероятностным PCA и факторным анализом (FA)

Выбор модели с вероятностным PCA и факторным анализом (FA)

Анализ главных компонент (PCA) на наборе данных Iris

Анализ главных компонент (PCA) на наборе данных Iris

Разреженное кодирование с предвычисленным словарём

Разреженное кодирование с предвычисленным словарём

Разработка оценщиков#

Примеры, касающиеся разработки пользовательского оценщика.

__sklearn_is_fitted__ как API для разработчиков

__sklearn_is_fitted__ как API для разработчиков

Ансамблевые методы#

Примеры, касающиеся sklearn.ensemble модуль.

Поддержка категориальных признаков в градиентном бустинге

Поддержка категориальных признаков в градиентном бустинге

Объедините предикторы с помощью стекинга

Объедините предикторы с помощью стекинга

Сравнение моделей случайных лесов и градиентного бустинга на гистограммах

Сравнение моделей случайных лесов и градиентного бустинга на гистограммах

Сравнение случайных лесов и мета-оценщика с множественным выходом

Сравнение случайных лесов и мета-оценщика с множественным выходом

Регрессия решающего дерева с AdaBoost

Регрессия решающего дерева с AdaBoost

Ранняя остановка в градиентном бустинге

Ранняя остановка в градиентном бустинге

Важность признаков с использованием леса деревьев

Важность признаков с использованием леса деревьев

Преобразования признаков с ансамблями деревьев

Преобразования признаков с ансамблями деревьев

Признаки в деревьях с градиентным бустингом на гистограммах

Признаки в деревьях с градиентным бустингом на гистограммах

Оценки Gradient Boosting Out-of-Bag

Оценки Gradient Boosting Out-of-Bag

Градиентный бустинг для регрессии

Градиентный бустинг для регрессии

Регуляризация градиентного бустинга

Регуляризация градиентного бустинга

Преобразование признаков с хешированием с использованием полностью случайных деревьев

Преобразование признаков с хешированием с использованием полностью случайных деревьев

Пример IsolationForest

Пример IsolationForest

Монотонные ограничения

Монотонные ограничения

Многоклассовые деревья решений с бустингом AdaBoost

Многоклассовые деревья решений с бустингом AdaBoost

Ошибки OOB для случайных лесов

Ошибки OOB для случайных лесов

Построить индивидуальные и голосующие регрессионные предсказания

Построить индивидуальные и голосующие регрессионные предсказания

Построить поверхности решений ансамблей деревьев на наборе данных ирисов

Построить поверхности решений ансамблей деревьев на наборе данных ирисов

Интервалы прогнозирования для регрессии градиентного бустинга

Интервалы прогнозирования для регрессии градиентного бустинга

Один оценщик против бэггинга: декомпозиция смещения-дисперсии

Один оценщик против бэггинга: декомпозиция смещения-дисперсии

Двухклассовый AdaBoost

Двухклассовый AdaBoost

Визуализация вероятностных предсказаний VotingClassifier

Визуализация вероятностных предсказаний VotingClassifier

Примеры на основе реальных наборов данных#

Применение к реальным задачам с некоторыми наборами данных среднего размера или интерактивным пользовательским интерфейсом.

Компрессионное зондирование: реконструкция томографии с априорным распределением L1 (Lasso)

Компрессионное зондирование: реконструкция томографии с априорным распределением L1 (Lasso)

Пример распознавания лиц с использованием собственных лиц и SVM

Пример распознавания лиц с использованием собственных лиц и SVM

Удаление шума с изображения с использованием ядерного PCA

Удаление шума с изображения с использованием ядерного PCA

Лаггированные признаки для прогнозирования временных рядов

Лаггированные признаки для прогнозирования временных рядов

Влияние сложности модели

Влияние сложности модели

Классификация текстовых документов вне памяти

Классификация текстовых документов вне памяти

Обнаружение выбросов на реальном наборе данных

Обнаружение выбросов на реальном наборе данных

Задержка предсказания

Задержка предсказания

Моделирование распределения видов

Моделирование распределения видов

Инженерия временных признаков

Инженерия временных признаков

Извлечение тем с использованием неотрицательной матричной факторизации и латентного размещения Дирихле

Извлечение тем с использованием неотрицательной матричной факторизации и латентного размещения Дирихле

Визуализация структуры фондового рынка

Визуализация структуры фондового рынка

Главный собственный вектор Википедии

Главный собственный вектор Википедии

Выбор признаков#

Примеры, касающиеся sklearn.feature_selection модуль.

Сравнение F-теста и взаимной информации

Сравнение F-теста и взаимной информации

Основанный на модели и последовательный отбор признаков

Основанный на модели и последовательный отбор признаков

Конвейер ANOVA SVM

Конвейер ANOVA SVM

Рекурсивное исключение признаков

Рекурсивное исключение признаков

Рекурсивное исключение признаков с перекрестной проверкой

Рекурсивное исключение признаков с перекрестной проверкой

Одномерный отбор признаков

Одномерный отбор признаков

Замороженные оценщики#

Примеры, касающиеся sklearn.frozen модуль.

Примеры использования FrozenEstimator

Примеры использования FrozenEstimator

Гауссовские смеси моделей#

Примеры, касающиеся sklearn.mixture модуль.

Анализ вариации байесовской гауссовой смеси с априорным типом концентрации

Анализ вариации байесовской гауссовой смеси с априорным типом концентрации

Оценка плотности для гауссовской смеси

Оценка плотности для гауссовской смеси

Методы инициализации GMM

Методы инициализации GMM

Ковариации GMM

Ковариации GMM

Эллипсоиды гауссовской смеси

Эллипсоиды гауссовской смеси

Выбор модели гауссовской смеси

Выбор модели гауссовской смеси

Гауссова смесь моделей синусоидальной кривой

Гауссова смесь моделей синусоидальной кривой

Гауссовский процесс для машинного обучения#

Примеры, касающиеся sklearn.gaussian_process модуль.

Способность гауссовского процесса регрессии (GPR) оценивать уровень шума данных

Способность гауссовского процесса регрессии (GPR) оценивать уровень шума данных

Сравнение ядерной гребневой регрессии и регрессии по методу Гауссовских процессов

Сравнение ядерной гребневой регрессии и регрессии по методу Гауссовских процессов

Прогнозирование уровня CO2 на наборе данных Mona Loa с использованием гауссовской регрессии (GPR)

Прогнозирование уровня CO2 на наборе данных Mona Loa с использованием гауссовской регрессии (GPR)

Регрессия гауссовских процессов: базовый вводный пример

Регрессия гауссовских процессов: базовый вводный пример

Гауссовский процесс классификации (GPC) на наборе данных iris

Гауссовский процесс классификации (GPC) на наборе данных iris

Гауссовские процессы на дискретных структурах данных

Гауссовские процессы на дискретных структурах данных

Иллюстрация классификации гауссовским процессом (GPC) на наборе данных XOR

Иллюстрация классификации гауссовским процессом (GPC) на наборе данных XOR

Иллюстрация априорного и апостериорного гауссовских процессов для различных ядер

Иллюстрация априорного и апостериорного гауссовских процессов для различных ядер

Изолинии равной вероятности для классификации гауссовских процессов (GPC)

Изолинии равной вероятности для классификации гауссовских процессов (GPC)

Вероятностные предсказания с гауссовским процессом классификации (GPC)

Вероятностные предсказания с гауссовским процессом классификации (GPC)

Обобщенные линейные модели#

Примеры, касающиеся sklearn.linear_model модуль.

Сравнение линейных байесовских регрессоров

Сравнение линейных байесовских регрессоров

Аппроксимация кривой с использованием байесовской гребневой регрессии

Аппроксимация кривой с использованием байесовской гребневой регрессии

Границы решений мультиномиальной и логистической регрессии One-vs-Rest

Границы решений мультиномиальной и логистической регрессии One-vs-Rest

Ранняя остановка стохастического градиентного спуска

Ранняя остановка стохастического градиентного спуска

Обучение Elastic Net с предвычисленной матрицей Грама и взвешенными выборками

Обучение Elastic Net с предвычисленной матрицей Грама и взвешенными выборками

HuberRegressor против Ridge на наборе данных с сильными выбросами

HuberRegressor против Ridge на наборе данных с сильными выбросами

Совместный отбор признаков с многозадачным Lasso

Совместный отбор признаков с многозадачным Lasso

L1-штраф и разреженность в логистической регрессии

L1-штраф и разреженность в логистической регрессии

Модели на основе L1 для разреженных сигналов

Модели на основе L1 для разреженных сигналов

Выбор модели Lasso с помощью информационных критериев

Выбор модели Lasso с помощью информационных критериев

Выбор модели Lasso: AIC-BIC / перекрёстная проверка

Выбор модели Lasso: AIC-BIC / перекрёстная проверка

Lasso на плотных и разреженных данных

Lasso на плотных и разреженных данных

Пути Lasso, Lasso-LARS и Elastic Net

Пути Lasso, Lasso-LARS и Elastic Net

Классификация MNIST с использованием мультиномиальной логистической регрессии + L1

Классификация MNIST с использованием мультиномиальной логистической регрессии + L1

Многоклассовая разреженная логистическая регрессия на 20newsgroups

Многоклассовая разреженная логистическая регрессия на 20newsgroups

Метод наименьших квадратов с неотрицательными ограничениями

Метод наименьших квадратов с неотрицательными ограничениями

One-Class SVM против One-Class SVM с использованием стохастического градиентного спуска

One-Class SVM против One-Class SVM с использованием стохастического градиентного спуска

Метод наименьших квадратов и гребневая регрессия

Метод наименьших квадратов и гребневая регрессия

Orthogonal Matching Pursuit

Orthogonal Matching Pursuit

Построение коэффициентов Ridge как функции регуляризации

Построение коэффициентов Ridge как функции регуляризации

Построение многоклассового SGD на наборе данных iris

Построение многоклассового SGD на наборе данных iris

Пуассоновская регрессия и ненормальные потери

Пуассоновская регрессия и ненормальные потери

Полиномиальная и сплайновая интерполяция

Полиномиальная и сплайновая интерполяция

Квантильная регрессия

Квантильная регрессия

Регуляризационный путь L1-логистической регрессии

Регуляризационный путь L1-логистической регрессии

Коэффициенты Ridge как функция L2-регуляризации

Коэффициенты Ridge как функция L2-регуляризации

Робастная оценка линейной модели

Робастная оценка линейной модели

Робастная оценка линейной модели с использованием RANSAC

Робастная оценка линейной модели с использованием RANSAC

SGD: Гиперплоскость максимального разделяющего запаса

SGD: Гиперплоскость максимального разделяющего запаса

SGD: Штрафы

SGD: Штрафы

SGD: Взвешенные выборки

SGD: Взвешенные выборки

SGD: выпуклые функции потерь

SGD: выпуклые функции потерь

Регрессия Тейла-Сена

Регрессия Тейла-Сена

Регрессия Твиди для страховых случаев

Регрессия Твиди для страховых случаев

Инспекция#

Примеры, связанные с sklearn.inspection модуль.

Распространённые ошибки в интерпретации коэффициентов линейных моделей

Распространённые ошибки в интерпретации коэффициентов линейных моделей

Неспособность машинного обучения выводить причинно-следственные связи

Неспособность машинного обучения выводить причинно-следственные связи

Графики частичной зависимости и индивидуального условного ожидания

Графики частичной зависимости и индивидуального условного ожидания

Важность перестановок против важности признаков случайного леса (MDI)

Важность перестановок против важности признаков случайного леса (MDI)

Важность перестановок с мультиколлинеарными или коррелированными признаками

Важность перестановок с мультиколлинеарными или коррелированными признаками

Аппроксимация ядра#

Примеры, касающиеся sklearn.kernel_approximation модуль.

Масштабируемое обучение с полиномиальной аппроксимацией ядра

Масштабируемое обучение с полиномиальной аппроксимацией ядра

Обучение многообразию#

Примеры, касающиеся sklearn.manifold модуль.

Сравнение методов обучения многообразий

Сравнение методов обучения многообразий

Методы обучения многообразий на разрезанной сфере

Методы обучения многообразий на разрезанной сфере

Обучение многообразию на рукописных цифрах: Locally Linear Embedding, Isomap…

Обучение многообразию на рукописных цифрах: Локально линейное вложение, Isomap...

load_files

load_files

Снижение размерности Swiss Roll и Swiss-Hole

Снижение размерности Swiss Roll и Swiss-Hole

t-SNE: Влияние различных значений perplexity на форму

t-SNE: Влияние различных значений perplexity на форму

Разное#

Различные и вводные примеры для scikit-learn.

Расширенное построение графиков с частичной зависимостью

Расширенное построение графиков с частичной зависимостью

Сравнение алгоритмов обнаружения аномалий для выявления выбросов на игрушечных наборах данных

Сравнение алгоритмов обнаружения аномалий для выявления выбросов на игрушечных наборах данных

Сравнение ядерной регрессии гребня и SVR

Сравнение ядерной регрессии гребня и SVR

Отображение конвейеров

Отображение конвейеров

Отображение оценщиков и сложных конвейеров

Отображение оценщиков и сложных конвейеров

Оценка оценщиков обнаружения выбросов

Оценка оценщиков обнаружения выбросов

Аппроксимация явного отображения признаков для RBF-ядер

Аппроксимация явного отображения признаков для RBF-ядер

Завершение лица с помощью многоканальных оценщиков

Завершение лица с помощью многоканальных оценщиков

Введение API set_output

Введение API set_output

Изотоническая регрессия

Изотоническая регрессия

Маршрутизация метаданных

Маршрутизация метаданных

Многометочная классификация

Многометочная классификация

Кривая ROC с API визуализации

Кривая ROC с API визуализации

Граница Джонсона-Линденштрауса для вложения с помощью случайных проекций

Граница Джонсона-Линденштрауса для вложения с помощью случайных проекций

Визуализации с объектами Display

Визуализации с объектами Display

Импутация пропущенных значений#

Примеры, касающиеся sklearn.impute модуль.

Заполнение пропущенных значений перед построением оценщика

Заполнение пропущенных значений перед построением оценщика

Заполнение пропущенных значений с вариантами IterativeImputer

Заполнение пропущенных значений с вариантами IterativeImputer

Выбор модели#

Примеры, связанные с sklearn.model_selection модуль.

Баланс сложности модели и кросс-валидационной оценки

Баланс сложности модели и кросс-валидационной оценки

Graham Clenaghan

Graham Clenaghan

Сравнение рандомизированного поиска и поиска по сетке для оценки гиперпараметров

Сравнение рандомизированного поиска и поиска по сетке для оценки гиперпараметров

Сравнение между поиском по сетке и последовательным сокращением вдвое

Сравнение между поиском по сетке и последовательным сокращением вдвое

Пользовательская стратегия повторного обучения для поиска по сетке с кросс-валидацией

Пользовательская стратегия повторного обучения для поиска по сетке с кросс-валидацией

Демонстрация многометрической оценки на cross_val_score и GridSearchCV

Демонстрация многометрической оценки на cross_val_score и GridSearchCV

Кривая компромисса ошибок обнаружения (DET)

Кривая компромисса ошибок обнаружения (DET)

Влияние регуляризации модели на ошибку обучения и тестирования

Влияние регуляризации модели на ошибку обучения и тестирования

Оценить производительность классификатора с помощью матрицы ошибок

Оценить производительность классификатора с помощью матрицы ошибок

Многоклассовая рабочая характеристика приемника (ROC)

Многоклассовая рабочая характеристика приемника (ROC)

Вложенная и невложенная перекрестная проверка

Вложенная и невложенная перекрестная проверка

Построение перекрестно проверенных предсказаний

Построение перекрестно проверенных предсказаний

Построение кривых обучения и проверка масштабируемости моделей

Построение кривых обучения и проверка масштабируемости моделей

Пост-фактумная настройка точки отсечения функции принятия решений

Пост-фактумная настройка точки отсечения функции принятия решений

Последующая настройка порога принятия решений для обучения с учетом стоимости

Последующая настройка порога принятия решений для обучения с учетом стоимости

Precision-Recall

Precision-Recall

Рабочая характеристика приёмника (ROC) с перекрёстной проверкой

Рабочая характеристика приёмника (ROC) с перекрёстной проверкой

Примерный пайплайн для извлечения и оценки текстовых признаков

Примерный пайплайн для извлечения и оценки текстовых признаков

Статистическое сравнение моделей с использованием поиска по сетке

Статистическое сравнение моделей с использованием поиска по сетке

Последовательные итерации деления пополам

Последовательные итерации деления пополам

Тест с перестановками для значимости оценки классификации

Тест с перестановками для значимости оценки классификации

Недообучение vs. Переобучение

Недообучение vs. Переобучение

Визуализация поведения кросс-валидации в scikit-learn

Визуализация поведения кросс-валидации в scikit-learn

Многоклассовые методы#

Примеры, касающиеся sklearn.multiclass модуль.

Обзор мета-оценщиков для многоклассового обучения

Обзор мета-оценщиков для многоклассового обучения

Многовариантные методы#

Примеры, касающиеся sklearn.multioutput модуль.

Многометочная классификация с использованием цепочки классификаторов

Многометочная классификация с использованием цепочки классификаторов

Ближайшие соседи#

Примеры, касающиеся sklearn.neighbors модуль.

Приближенные ближайшие соседи в TSNE

Приближенные ближайшие соседи в TSNE

Кэширование ближайших соседей

Кэширование ближайших соседей

Сравнение ближайших соседей с анализом компонент соседства и без него

Сравнение ближайших соседей с анализом компонент соседства и без него

Снижение размерности с помощью анализа компонентов соседства

Снижение размерности с помощью анализа компонентов соседства

Оценка плотности ядра распределения видов

Оценка плотности ядра распределения видов

Оценка плотности ядра

Оценка плотности ядра

Классификация по ближайшему центроиду

Классификация по ближайшему центроиду

Классификация методом ближайших соседей

Классификация методом ближайших соседей

Регрессия методом ближайших соседей

Регрессия методом ближайших соседей

Иллюстрация анализа компонентов соседства

Иллюстрация анализа компонентов соседства

Обнаружение новизны с помощью локального фактора выбросов (LOF)

Обнаружение новизны с помощью локального фактора выбросов (LOF)

Обнаружение выбросов с помощью фактора локальных выбросов (LOF)

Обнаружение выбросов с помощью фактора локальных выбросов (LOF)

Простое одномерное ядерное сглаживание плотности

Простое одномерное ядерное сглаживание плотности

Нейронные сети#

Примеры, касающиеся sklearn.neural_network модуль.

Сравнение стохастических стратегий обучения для MLPClassifier

Сравнение стохастических стратегий обучения для MLPClassifier

Признаки ограниченной машины Больцмана для классификации цифр

Признаки ограниченной машины Больцмана для классификации цифр

Изменение регуляризации в многослойном перцептроне

Изменение регуляризации в многослойном перцептроне

Visualization of MLP weights on MNIST

Visualization of MLP weights on MNIST

Конвейеры и составные оценщики#

Примеры того, как составлять трансформеры и пайплайны из других оценщиков. Смотрите Руководство пользователя.

Трансформер столбцов с разнородными источниками данных

Трансформер столбцов с разнородными источниками данных

Трансформер столбцов со смешанными типами

Трансформер столбцов со смешанными типами

Объединение нескольких методов извлечения признаков

Объединение нескольких методов извлечения признаков

Эффект преобразования целей в регрессионной модели

Эффект преобразования целей в регрессионной модели

Конвейеризация: объединение PCA и логистической регрессии

Конвейеризация: объединение PCA и логистической регрессии

Выбор уменьшения размерности с помощью Pipeline и GridSearchCV

Выбор уменьшения размерности с помощью Pipeline и GridSearchCV

Предобработка#

Примеры, касающиеся sklearn.preprocessing модуль.

Сравнение влияния различных масштабировщиков на данные с выбросами

Сравнение влияния различных масштабировщиков на данные с выбросами

Сравнение Target Encoder с другими кодировщиками

Сравнение Target Encoder с другими кодировщиками

Демонстрация различных стратегий KBinsDiscretizer

Демонстрация различных стратегий KBinsDiscretizer

Дискретизация признаков

Дискретизация признаков

Важность масштабирования признаков

Важность масштабирования признаков

Преобразует данные в нормальное распределение

Преобразует данные в нормальное распределение

Внутренняя перекрестная подгонка Target Encoder

Внутренняя перекрестная подгонка Target Encoder

Использование KBinsDiscretizer для дискретизации непрерывных признаков

Использование KBinsDiscretizer для дискретизации непрерывных признаков

Полуавтоматическая классификация#

Примеры, касающиеся sklearn.semi_supervised модуль.

Граница решения полуконтролируемых классификаторов против SVM на наборе данных Iris

Граница решения полуконтролируемых классификаторов против SVM на наборе данных Iris

Влияние изменения порога для самообучения

Влияние изменения порога для самообучения

Распространение меток по кругам: Обучение сложной структуре

Распространение меток по кругам: Обучение сложной структуре

Распространение меток цифр: Активное обучение

Распространение меток цифр: Активное обучение

Распространение меток на цифрах: Демонстрация производительности

Распространение меток на цифрах: Демонстрация производительности

Полу-контролируемая классификация на текстовом наборе данных

Полу-контролируемая классификация на текстовом наборе данных

Метод опорных векторов#

Примеры, касающиеся sklearn.svm модуль.

Одноклассовый SVM с нелинейным ядром (RBF)

Одноклассовый SVM с нелинейным ядром (RBF)

Построение границ классификации с различными ядрами SVM

Построение границ классификации с различными ядрами SVM

Построение различных классификаторов SVM на наборе данных iris

Построение различных классификаторов SVM на наборе данных iris

Построить опорные векторы в LinearSVC

Построить опорные векторы в LinearSVC

Параметры SVM с RBF-ядром

Параметры SVM с RBF-ядром

Пример границ SVM

Пример границ SVM

Пример разрешения ничьей в SVM

Пример разрешения ничьей в SVM

SVM с пользовательским ядром

SVM с пользовательским ядром

SVM-Anova: SVM с одномерным отбором признаков

SVM-Anova: SVM с одномерным отбором признаков

SVM: Разделяющая гиперплоскость с максимальным зазором

SVM: Разделяющая гиперплоскость с максимальным зазором

SVM: Разделяющая гиперплоскость для несбалансированных классов

SVM: Разделяющая гиперплоскость для несбалансированных классов

SVM: Взвешенные образцы

SVM: Взвешенные образцы

Масштабирование параметра регуляризации для SVC

Масштабирование параметра регуляризации для SVC

Регрессия на основе метода опорных векторов (SVR) с использованием линейных и нелинейных ядер

Регрессия на основе метода опорных векторов (SVR) с использованием линейных и нелинейных ядер

Работа с текстовыми документами#

Примеры, касающиеся sklearn.feature_extraction.text модуль.

Классификация текстовых документов с использованием разреженных признаков

Классификация текстовых документов с использованием разреженных признаков

Кластеризация текстовых документов с использованием k-means

Кластеризация текстовых документов с использованием k-means

Сравнение FeatureHasher и DictVectorizer

Сравнение FeatureHasher и DictVectorizer

Галерея, созданная Sphinx-Gallery