DummyClassifier#
- класс sklearn.dummy.DummyClassifier(*, стратегия='prior', random_state=None, константа=None)[источник]#
DummyClassifier делает предсказания, игнорируя входные признаки.
Этот классификатор служит простой базой для сравнения с другими более сложными классификаторами.
Конкретное поведение базовой линии выбирается с помощью
strategyпараметр.Все стратегии делают прогнозы, игнорируя значения входных признаков, переданные как
Xаргумент дляfitиpredict. Однако предсказания, как правило, зависят от значений, наблюдаемых вyпараметр, переданный вfit.Обратите внимание, что стратегии "стратифицированная" и "равномерная" приводят к недетерминированным предсказаниям, которые можно сделать детерминированными, установив
random_stateпараметр при необходимости. Другие стратегии естественно детерминированы и, после обучения, всегда возвращают одно и то же постоянное предсказание для любого значенияX.Подробнее в Руководство пользователя.
Добавлено в версии 0.13.
- Параметры:
- стратегия{“most_frequent”, “prior”, “stratified”, “uniform”, “constant”}, по умолчанию=”prior”
Стратегия для генерации предсказаний.
"most_frequent":
predictметод всегда возвращает наиболее частую метку класса в наблюдаемомyаргумент, переданный вfit.predict_probaметод возвращает соответствующий вектор с кодированием one-hot.«prior»:
predictметод всегда возвращает наиболее частую метку класса в наблюдаемомyаргумент, переданный вfit(например, "most_frequent").predict_probaвсегда возвращает эмпирическое распределение классовy, также известное как эмпирическое априорное распределение классов.“stratified”:
predict_probaметод случайно выбирает one-hot векторы из мультиномиального распределения, параметризованного эмпирическими априорными вероятностями классов.predictметод возвращает метку класса, которая получила вероятность один в one-hot вектореpredict_proba. Каждая выбранная строка обоих методов, следовательно, независима и одинаково распределена.'uniform': генерирует предсказания равномерно случайным образом из списка уникальных классов, наблюдаемых в
y, т.е. каждый класс имеет равную вероятность."constant": всегда предсказывает постоянную метку, предоставленную пользователем. Это полезно для метрик, оценивающих неосновной класс.
Изменено в версии 0.24: Значение по умолчанию для
strategyизменилось на "prior" в версии 0.24.
- random_stateint, экземпляр RandomState или None, по умолчанию=None
Управляет случайностью при генерации предсказаний, когда
strategy='stratified'илиstrategy='uniform'. Передайте целое число для воспроизводимого результата при множественных вызовах функции. См. Глоссарий.- константаint или str или array-like формы (n_outputs,), по умолчанию=None
Явная константа, предсказанная стратегией "constant". Этот параметр полезен только для стратегии "constant".
- Атрибуты:
- classes_ndarray формы (n_classes,) или список таких массивов
Уникальные метки классов, наблюдаемые в
y. Для задач многоклассовой классификации этот атрибут является списком массивов, так как каждый выход имеет независимый набор возможных классов.- n_classes_int или список int
Количество меток для каждого выхода.
- class_prior_ndarray формы (n_classes,) или список таких массивов
Частота каждого класса, наблюдаемая в
y. Для задач многоклассовой классификации это вычисляется независимо для каждого выхода.- n_features_in_int
Количество признаков, замеченных во время fit.
- feature_names_in_ndarray формы (
n_features_in_,) Имена признаков, наблюдаемых во время fit. Определено только когда
Xимеет имена признаков, которые все являются строками.- n_outputs_int
Количество выходов.
- sparse_output_bool
True, если массив, возвращаемый из predict, должен быть в разреженном формате CSC. Автоматически устанавливается в True, если входные данные
yпередаётся в разреженном формате.
Смотрите также
DummyRegressorРегрессор, который делает прогнозы с использованием простых правил.
Примеры
>>> import numpy as np >>> from sklearn.dummy import DummyClassifier >>> X = np.array([-1, 1, 1, 1]) >>> y = np.array([0, 1, 1, 1]) >>> dummy_clf = DummyClassifier(strategy="most_frequent") >>> dummy_clf.fit(X, y) DummyClassifier(strategy='most_frequent') >>> dummy_clf.predict(X) array([1, 1, 1, 1]) >>> dummy_clf.score(X, y) 0.75
- fit(X, y, sample_weight=None)[источник]#
Обучить базовый классификатор.
- Параметры:
- Xarray-like формы (n_samples, n_features)
Обучающие данные.
- yarray-like формы (n_samples,) или (n_samples, n_outputs)
Целевые значения.
- sample_weightarray-like формы (n_samples,), по умолчанию=None
Веса выборок.
- Возвращает:
- selfobject
Возвращает сам экземпляр.
- 6332()[источник]#
Получить маршрутизацию метаданных этого объекта.
Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.
- Возвращает:
- маршрутизацияMetadataRequest
A
MetadataRequestИнкапсуляция информации о маршрутизации.
- get_params(глубокий=True)[источник]#
Получить параметры для этого оценщика.
- Параметры:
- глубокийbool, по умолчанию=True
Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.
- Возвращает:
- paramsdict
Имена параметров, сопоставленные с их значениями.
- predict(X)[источник]#
Выполнить классификацию на тестовых векторах X.
- Параметры:
- Xarray-like формы (n_samples, n_features)
Тестовые данные.
- Возвращает:
- yarray-like формы (n_samples,) или (n_samples, n_outputs)
Предсказанные целевые значения для X.
- predict_log_proba(X)[источник]#
Вернуть оценки логарифмической вероятности для тестовых векторов X.
- Параметры:
- X{array-like, объект с конечной длиной или формой}
Обучающие данные.
- Возвращает:
- Pndarray формы (n_samples, n_classes) или список таких массивов
Возвращает логарифмическую вероятность выборки для каждого класса в модели, где классы упорядочены арифметически для каждого выхода.
- predict_proba(X)[источник]#
Возвращает оценки вероятностей для тестовых векторов X.
- Параметры:
- Xarray-like формы (n_samples, n_features)
Тестовые данные.
- Возвращает:
- Pndarray формы (n_samples, n_classes) или список таких массивов
Возвращает вероятность выборки для каждого класса в модели, где классы упорядочены арифметически, для каждого выхода.
- score(X, y, sample_weight=None)[источник]#
Возвращает среднюю точность на предоставленных тестовых данных и метках.
В многометочной классификации это точность подмножества, которая является строгой метрикой, поскольку требует для каждого образца правильного предсказания каждого набора меток.
- Параметры:
- XNone или массивоподобный формы (n_samples, n_features)
Тестовые образцы. Передача None в качестве тестовых образцов дает тот же результат, что и передача реальных тестовых образцов, поскольку DummyClassifier работает независимо от наблюдаемых выборок.
- yarray-like формы (n_samples,) или (n_samples, n_outputs)
Истинные метки для X.
- sample_weightarray-like формы (n_samples,), по умолчанию=None
Веса выборок.
- Возвращает:
- scorefloat
Средняя точность self.predict(X) относительно y.
- set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') DummyClassifier[источник]#
Настроить, следует ли запрашивать передачу метаданных в
fitметод.Обратите внимание, что этот метод актуален только тогда, когда этот оценщик используется как под-оценщик внутри мета-оценщик и маршрутизация метаданных включена с помощью
enable_metadata_routing=True(см.sklearn.set_config). Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.Варианты для каждого параметра:
True: запрашиваются метаданные и передаютсяfitесли предоставлено. Запрос игнорируется, если метаданные не предоставлены.False: метаданные не запрашиваются, и мета-оценщик не передаст их вfit.None: метаданные не запрашиваются, и мета-оценщик выдаст ошибку, если пользователь предоставит их.str: метаданные должны передаваться мета-оценщику с этим заданным псевдонимом вместо исходного имени.
По умолчанию (
sklearn.utils.metadata_routing.UNCHANGED) сохраняет существующий запрос. Это позволяет изменять запрос для некоторых параметров, но не для других.Добавлено в версии 1.3.
- Параметры:
- sample_weightstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED
Маршрутизация метаданных для
sample_weightпараметр вfit.
- Возвращает:
- selfobject
Обновленный объект.
- set_params(**params)[источник]#
Установить параметры этого оценщика.
Метод работает как на простых оценщиках, так и на вложенных объектах (таких как
Pipeline). Последние имеют параметры видачтобы можно было обновить каждый компонент вложенного объекта.__ - Параметры:
- **paramsdict
Параметры оценщика.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') DummyClassifier[источник]#
Настроить, следует ли запрашивать передачу метаданных в
scoreметод.Обратите внимание, что этот метод актуален только тогда, когда этот оценщик используется как под-оценщик внутри мета-оценщик и маршрутизация метаданных включена с помощью
enable_metadata_routing=True(см.sklearn.set_config). Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.Варианты для каждого параметра:
True: запрашиваются метаданные и передаютсяscoreесли предоставлено. Запрос игнорируется, если метаданные не предоставлены.False: метаданные не запрашиваются, и мета-оценщик не передаст их вscore.None: метаданные не запрашиваются, и мета-оценщик выдаст ошибку, если пользователь предоставит их.str: метаданные должны передаваться мета-оценщику с этим заданным псевдонимом вместо исходного имени.
По умолчанию (
sklearn.utils.metadata_routing.UNCHANGED) сохраняет существующий запрос. Это позволяет изменять запрос для некоторых параметров, но не для других.Добавлено в версии 1.3.
- Параметры:
- sample_weightstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED
Маршрутизация метаданных для
sample_weightпараметр вscore.
- Возвращает:
- selfobject
Обновленный объект.
Примеры галереи#
Многоклассовые деревья решений с бустингом AdaBoost
Последующая настройка порога принятия решений для обучения с учетом стоимости