GradientBoostingRegressor#
- класс sklearn.ensemble.GradientBoostingRegressor(*, потеря='squared_error', learning_rate=0.1, n_estimators=100, subsample=1.0, критерий='friedman_mse', min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_depth=3, min_impurity_decrease=0.0, init=None, random_state=None, max_features=None, alpha=0.9, verbose=0, max_leaf_nodes=None, warm_start=False, validation_fraction=0.1, n_iter_no_change=None, tol=0.0001, ccp_alpha=0.0)[источник]#
Градиентный бустинг для регрессии.
Этот оценщик строит аддитивную модель поэтапно; он позволяет оптимизировать произвольные дифференцируемые функции потерь. На каждом этапе регрессионное дерево подгоняется к отрицательному градиенту заданной функции потерь.
HistGradientBoostingRegressorявляется гораздо более быстрым вариантом этого алгоритма для промежуточных и больших наборов данных (n_samples >= 10_000) и поддерживает монотонные ограничения.Подробнее в Руководство пользователя.
- Параметры:
- потеря{‘squared_error’, ‘absolute_error’, ‘huber’, ‘quantile’}, по умолчанию=’squared_error’
Функция потерь для оптимизации. 'squared_error' относится к квадратичной ошибке для регрессии. 'absolute_error' относится к абсолютной ошибке регрессии и является устойчивой функцией потерь. 'huber' — это комбинация двух. 'quantile' позволяет выполнять квантильную регрессию (используйте
alphaчтобы указать квантиль). См. Интервалы прогнозирования для регрессии градиентного бустинга для примера, демонстрирующего квантильную регрессию для создания интервалов прогнозирования сloss='quantile'.- learning_ratefloat, по умолчанию=0.1
Скорость обучения уменьшает вклад каждого дерева на
learning_rate. Существует компромисс между learning_rate и n_estimators. Значения должны быть в диапазоне[0.0, inf).- n_estimatorsint, по умолчанию=100
Количество этапов бустинга для выполнения. Градиентный бустинг довольно устойчив к переобучению, поэтому большое количество обычно приводит к лучшей производительности. Значения должны быть в диапазоне
[1, inf).- subsamplefloat, по умолчанию=1.0
Доля выборок, используемая для обучения отдельных базовых моделей. Если значение меньше 1.0, это приводит к стохастическому градиентному бустингу.
subsampleвзаимодействует с параметромn_estimators. Выборsubsample < 1.0приводит к уменьшению дисперсии и увеличению смещения. Значения должны быть в диапазоне(0.0, 1.0].- критерий{‘friedman_mse’, ‘squared_error’}, по умолчанию=‘friedman_mse’
Функция для измерения качества разделения. Поддерживаемые критерии: "friedman_mse" для среднеквадратичной ошибки с оценкой улучшения по Фридману, "squared_error" для среднеквадратичной ошибки. Значение по умолчанию "friedman_mse" обычно является лучшим, так как может обеспечить лучшее приближение в некоторых случаях.
Добавлено в версии 0.18.
- min_samples_splitint или float, по умолчанию=2
Минимальное количество образцов, необходимое для разделения внутреннего узла:
Если int, значения должны быть в диапазоне
[2, inf).Если float, значения должны быть в диапазоне
(0.0, 1.0]иmin_samples_splitбудетceil(min_samples_split * n_samples).
Изменено в версии 0.18: Добавлены дробные значения.
- min_samples_leafint или float, по умолчанию=1
Минимальное количество выборок, требуемое для нахождения в листовом узле. Точка разделения на любой глубине будет рассматриваться только если она оставляет по крайней мере
min_samples_leafобучающих выборок в каждой из левой и правой ветвей. Это может сгладить модель, особенно в регрессии.Если int, значения должны быть в диапазоне
[1, inf).Если float, значения должны быть в диапазоне
(0.0, 1.0)иmin_samples_leafбудетceil(min_samples_leaf * n_samples).
Изменено в версии 0.18: Добавлены дробные значения.
- min_weight_fraction_leaffloat, по умолчанию=0.0
Минимальная взвешенная доля от общей суммы весов (всех входных выборок), требуемая для узла листа. Выборки имеют равный вес, когда sample_weight не предоставлен. Значения должны быть в диапазоне
[0.0, 0.5].- max_depthint или None, по умолчанию=3
Максимальная глубина отдельных регрессионных оценщиков. Максимальная глубина ограничивает количество узлов в дереве. Настройте этот параметр для лучшей производительности; оптимальное значение зависит от взаимодействия входных переменных. Если None, то узлы расширяются до тех пор, пока все листья не станут чистыми или пока все листья не будут содержать менее min_samples_split выборок. Если int, значения должны быть в диапазоне
[1, inf).- min_impurity_decreasefloat, по умолчанию=0.0
Узел будет разделён, если это разделение вызывает уменьшение неопределённости большее или равное этому значению. Значения должны быть в диапазоне
[0.0, inf).Уравнение взвешенного уменьшения неопределённости следующее:
N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity)
где
N— это общее количество выборок,N_t— это количество выборок в текущем узле,N_t_L— это количество образцов в левом дочернем узле, иN_t_Rэто количество выборок в правом дочернем узле.N,N_t,N_t_RиN_t_Lвсе относятся к взвешенной сумме, еслиsample_weightпередается.Добавлено в версии 0.19.
- initоценщик или 'zero', по умолчанию=None
Объект-оценщик, используемый для вычисления начальных предсказаний.
initдолжен предоставить fit и predict. Если 'zero', начальные необработанные прогнозы устанавливаются в ноль. По умолчаниюDummyEstimatorиспользуется, предсказывая либо среднее целевое значение (для loss='squared_error'), либо квантиль для других потерь.- random_stateint, экземпляр RandomState или None, по умолчанию=None
Управляет случайным сидом, передаваемым каждому оценщику Tree на каждой итерации бустинга. Кроме того, он управляет случайной перестановкой признаков при каждом разбиении (см. примечания для подробностей). Также управляет случайным разделением обучающих данных для получения проверочного набора, если
n_iter_no_changeне равно None. Передайте целое число для воспроизводимого результата при множественных вызовах функции. См. Глоссарий.- max_features{'sqrt', 'log2'}, int или float, по умолчанию=None
Количество признаков, которые следует учитывать при поиске наилучшего разделения:
Если int, значения должны быть в диапазоне
[1, inf).Если float, значения должны быть в диапазоне
(0.0, 1.0]и признаки, рассматриваемые при каждом разделении, будутmax(1, int(max_features * n_features_in_)).Если "sqrt", то
max_features=sqrt(n_features).Если "log2", то
max_features=log2(n_features).Если None, то
max_features=n_features.
Выбор
max_features < n_featuresприводит к уменьшению дисперсии и увеличению смещения.Истинные (правильные) целевые значения. Требуется y_true > 0.
max_featuresпризнаков.- alphafloat, default=0.9
Альфа-квантиль функции потерь Хьюбера и функции потерь квантиля. Только если
loss='huber'илиloss='quantile'. Значения должны находиться в диапазоне(0.0, 1.0).- verboseint, по умолчанию=0
Включить подробный вывод. Если 1, то выводит прогресс и производительность время от времени (чем больше деревьев, тем ниже частота). Если больше 1, то выводит прогресс и производительность для каждого дерева. Значения должны быть в диапазоне
[0, inf).- max_leaf_nodesint, default=None
Выращивайте деревья с
max_leaf_nodesв порядке лучшего первого. Лучшие узлы определяются как относительное снижение примеси. Значения должны быть в диапазоне[2, inf). Если None, то неограниченное количество листовых узлов.- warm_startbool, по умолчанию=False
При установке значения
True, повторно используйте решение предыдущего вызова fit и добавьте больше оценщиков в ансамбль, в противном случае просто сотрите предыдущее решение. См. Глоссарий.- validation_fractionfloat, по умолчанию=0.1
Доля обучающих данных, которую следует отложить в качестве проверочного набора для ранней остановки. Значения должны быть в диапазоне
(0.0, 1.0). Используется только еслиn_iter_no_changeустановлен в целое число.Добавлено в версии 0.20.
- n_iter_no_changeint, default=None
n_iter_no_changeиспользуется для решения, будет ли использоваться ранняя остановка для завершения обучения, когда оценка валидации не улучшается. По умолчанию установлено None для отключения ранней остановки. Если установлено число, оно выделитvalidation_fractionразмер обучающих данных в качестве валидации и прекращает обучение, когда оценка валидации не улучшается во всех предыдущихn_iter_no_changeколичество итераций. Значения должны находиться в диапазоне[1, inf). См. Ранняя остановка в градиентном бустинге.Добавлено в версии 0.20.
- tolfloat, по умолчанию=1e-4
Допуск для ранней остановки. Когда потери не улучшаются по крайней мере на tol в течение
n_iter_no_changeитераций (если установлено число), обучение останавливается. Значения должны находиться в диапазоне[0.0, inf).Добавлено в версии 0.20.
- ccp_alphaнеотрицательное число с плавающей точкой, default=0.0
Параметр сложности, используемый для минимальной стоимостно-сложностной обрезки. Поддерево с наибольшей стоимостью сложности, которое меньше чем
ccp_alphaбудет выбрано. По умолчанию обрезка не выполняется. Значения должны находиться в диапазоне[0.0, inf). См. Минимальная обрезка по стоимости-сложности для подробностей. См. Пост-обрезка деревьев решений с обрезкой по стоимости сложности для примера такой обрезки.Добавлено в версии 0.22.
- Атрибуты:
- n_estimators_int
Количество оценщиков, выбранных ранней остановкой (если
n_iter_no_changeуказано). В противном случае устанавливается вn_estimators.- n_trees_per_iteration_int
Количество деревьев, которые строятся на каждой итерации. Для регрессоров это всегда 1.
Добавлено в версии 1.4.0.
feature_importances_ndarray формы (n_features,)Важность признаков на основе нечистоты.
- oob_improvement_ndarray формы (n_estimators,)
Улучшение потерь на out-of-bag выборках относительно предыдущей итерации.
oob_improvement_[0]это улучшение потерь первого этапа по сравнению сinitоценщик. Доступно только еслиsubsample < 1.0.- oob_scores_ndarray формы (n_estimators,)
Полная история значений потерь на внепакетных образцах. Доступно только если
subsample < 1.0.Добавлено в версии 1.3.
- oob_score_float
Последнее значение потерь на внепакетных выборках. Оно такое же, как
oob_scores_[-1]. Доступно только еслиsubsample < 1.0.Добавлено в версии 1.3.
- train_score_ndarray формы (n_estimators,)
i-я оценка
train_score_[i]это потери модели на итерацииiна внутрипакетном образце. Еслиsubsample == 1это потери на обучающих данных.- init_estimator
Оценщик, предоставляющий начальные предсказания. Устанавливается через
initаргумент.- estimators_ndarray из DecisionTreeRegressor формы (n_estimators, 1)
Коллекция обученных суб-оценщиков.
- n_features_in_int
Количество признаков, замеченных во время fit.
Добавлено в версии 0.24.
- feature_names_in_ndarray формы (
n_features_in_,) Имена признаков, наблюдаемых во время fit. Определено только когда
Xимеет имена признаков, которые все являются строками.Добавлено в версии 1.0.
- Представление вероятностного распределения гауссовской смеси. Этот класс позволяет оценивать параметры распределения гауссовской смеси.int
Выведенное значение max_features.
Смотрите также
HistGradientBoostingRegressorГистограммный градиентный бустинг для классификационных деревьев.
sklearn.tree.DecisionTreeRegressorРегрессор дерева решений.
sklearn.ensemble.RandomForestRegressorРегрессор случайного леса.
Примечания
Признаки всегда случайным образом переставляются на каждом разбиении. Поэтому, наилучшее найденное разбиение может варьироваться, даже при тех же обучающих данных и
max_features=n_features, если улучшение критерия идентично для нескольких разбиений, перечисленных при поиске наилучшего разбиения. Чтобы получить детерминированное поведение при обучении,random_stateдолжен быть фиксированным.Ссылки
J. Friedman, Greedy Function Approximation: A Gradient Boosting Machine, The Annals of Statistics, Vol. 29, No. 5, 2001.
Friedman, Stochastic Gradient Boosting, 1999
T. Hastie, R. Tibshirani и J. Friedman. Elements of Statistical Learning Ed. 2, Springer, 2009.
Примеры
>>> from sklearn.datasets import make_regression >>> from sklearn.ensemble import GradientBoostingRegressor >>> from sklearn.model_selection import train_test_split >>> X, y = make_regression(random_state=0) >>> X_train, X_test, y_train, y_test = train_test_split( ... X, y, random_state=0) >>> reg = GradientBoostingRegressor(random_state=0) >>> reg.fit(X_train, y_train) GradientBoostingRegressor(random_state=0) >>> reg.predict(X_test[1:2]) array([-61.1]) >>> reg.score(X_test, y_test) 0.4...
Для подробного примера использования
GradientBoostingRegressorдля обучения ансамбля слабых прогностических моделей, обратитесь к Градиентный бустинг для регрессии.- apply(X)[источник]#
Примените деревья в ансамбле к X, верните индексы листьев.
Добавлено в версии 0.17.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Входные выборки. Внутренне их тип данных будет преобразован в
dtype=np.float32. Если предоставлена разреженная матрица, она будет преобразована в разреженнуюcsr_matrix.
- Возвращает:
- X_leavesarray-like формы (n_samples, n_estimators)
Для каждой точки данных x в X и для каждого дерева в ансамбле, возвращает индекс листа, в который попадает x в каждом оценщике.
- fit(X, y, sample_weight=None, монитор=None)[источник]#
Обучить модель градиентного бустинга.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Входные выборки. Внутренне они будут преобразованы в
dtype=np.float32и если разреженная матрица предоставлена, в разреженнуюcsr_matrix.- yarray-like формы (n_samples,)
Целевые значения (строки или целые числа в классификации, вещественные числа в регрессии). Для классификации метки должны соответствовать классам.
- sample_weightarray-like формы (n_samples,), по умолчанию=None
Веса выборок. Если None, то выборки имеют одинаковый вес. Разделения, которые создадут дочерние узлы с нулевым или отрицательным суммарным весом, игнорируются при поиске разделения в каждом узле. В случае классификации разделения также игнорируются, если они приведут к тому, что любой отдельный класс будет иметь отрицательный вес в любом из дочерних узлов.
- мониторвызываемый объект, по умолчанию=None
Монитор вызывается после каждой итерации с текущей итерацией, ссылкой на оценщик и локальными переменными
_fit_stagesв качестве аргументов ключевых словcallable(i, self, locals()). Если вызываемый объект возвращаетTrueпроцедура подгонки останавливается. Монитор может использоваться для различных целей, таких как вычисление оценок на отложенных данных, ранняя остановка, интроспекция модели и создание снимков.
- Возвращает:
- selfobject
Обученный оценщик.
- 6332()[источник]#
Получить маршрутизацию метаданных этого объекта.
Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.
- Возвращает:
- маршрутизацияMetadataRequest
A
MetadataRequestИнкапсуляция информации о маршрутизации.
- get_params(глубокий=True)[источник]#
Получить параметры для этого оценщика.
- Параметры:
- глубокийbool, по умолчанию=True
Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.
- Возвращает:
- paramsdict
Имена параметров, сопоставленные с их значениями.
- predict(X)[источник]#
Предсказать регрессионную цель для X.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Входные выборки. Внутренне они будут преобразованы в
dtype=np.float32и если разреженная матрица предоставлена, в разреженнуюcsr_matrix.
- Возвращает:
- yndarray формы (n_samples,)
Предсказанные значения.
- score(X, y, sample_weight=None)[источник]#
Возвращает коэффициент детерминации на тестовых данных.
Коэффициент детерминации, \(R^2\), определяется как \((1 - \frac{u}{v})\), где \(u\) является остаточной суммой квадратов
((y_true - y_pred)** 2).sum()и \(v\) является общей суммой квадратов((y_true - y_true.mean()) ** 2).sum()Лучший возможный результат - 1.0, и он может быть отрицательным (потому что модель может быть сколь угодно хуже). Постоянная модель, которая всегда предсказывает ожидаемое значениеy, игнорируя входные признаки, получит \(R^2\) оценка 0.0.- Параметры:
- Xarray-like формы (n_samples, n_features)
Тестовые выборки. Для некоторых оценщиков это может быть предварительно вычисленная матрица ядра или список общих объектов вместо этого с формой
(n_samples, n_samples_fitted), гдеn_samples_fitted— это количество образцов, использованных при обучении оценщика.- yarray-like формы (n_samples,) или (n_samples, n_outputs)
Истинные значения для
X.- sample_weightarray-like формы (n_samples,), по умолчанию=None
Веса выборок.
- Возвращает:
- scorefloat
\(R^2\) of
self.predict(X)относительноy.
Примечания
The \(R^2\) оценка, используемая при вызове
scoreна регрессоре используетmultioutput='uniform_average'с версии 0.23 для сохранения согласованности со значением по умолчаниюr2_score. Это влияет наscoreметод всех многомерных регрессоров (кромеMultiOutputRegressor).
- set_fit_request(*, монитор: bool | None | str = '$UNCHANGED$', sample_weight: bool | None | str = '$UNCHANGED$') GradientBoostingRegressor[источник]#
Настроить, следует ли запрашивать передачу метаданных в
fitметод.Обратите внимание, что этот метод актуален только тогда, когда этот оценщик используется как под-оценщик внутри мета-оценщик и маршрутизация метаданных включена с помощью
enable_metadata_routing=True(см.sklearn.set_config). Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.Варианты для каждого параметра:
True: запрашиваются метаданные и передаютсяfitесли предоставлено. Запрос игнорируется, если метаданные не предоставлены.False: метаданные не запрашиваются, и мета-оценщик не передаст их вfit.None: метаданные не запрашиваются, и мета-оценщик выдаст ошибку, если пользователь предоставит их.str: метаданные должны передаваться мета-оценщику с этим заданным псевдонимом вместо исходного имени.
По умолчанию (
sklearn.utils.metadata_routing.UNCHANGED) сохраняет существующий запрос. Это позволяет изменять запрос для некоторых параметров, но не для других.Добавлено в версии 1.3.
- Параметры:
- мониторstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED
Маршрутизация метаданных для
monitorпараметр вfit.- sample_weightstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED
Маршрутизация метаданных для
sample_weightпараметр вfit.
- Возвращает:
- selfobject
Обновленный объект.
- set_params(**params)[источник]#
Установить параметры этого оценщика.
Метод работает как на простых оценщиках, так и на вложенных объектах (таких как
Pipeline). Последние имеют параметры видачтобы можно было обновить каждый компонент вложенного объекта.__ - Параметры:
- **paramsdict
Параметры оценщика.
- Возвращает:
- selfэкземпляр estimator
Экземпляр оценщика.
- set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') GradientBoostingRegressor[источник]#
Настроить, следует ли запрашивать передачу метаданных в
scoreметод.Обратите внимание, что этот метод актуален только тогда, когда этот оценщик используется как под-оценщик внутри мета-оценщик и маршрутизация метаданных включена с помощью
enable_metadata_routing=True(см.sklearn.set_config). Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.Варианты для каждого параметра:
True: запрашиваются метаданные и передаютсяscoreесли предоставлено. Запрос игнорируется, если метаданные не предоставлены.False: метаданные не запрашиваются, и мета-оценщик не передаст их вscore.None: метаданные не запрашиваются, и мета-оценщик выдаст ошибку, если пользователь предоставит их.str: метаданные должны передаваться мета-оценщику с этим заданным псевдонимом вместо исходного имени.
По умолчанию (
sklearn.utils.metadata_routing.UNCHANGED) сохраняет существующий запрос. Это позволяет изменять запрос для некоторых параметров, но не для других.Добавлено в версии 1.3.
- Параметры:
- sample_weightstr, True, False или None, по умолчанию=sklearn.utils.metadata_routing.UNCHANGED
Маршрутизация метаданных для
sample_weightпараметр вscore.
- Возвращает:
- selfobject
Обновленный объект.
- staged_predict(X)[источник]#
Предсказать регрессионную цель на каждом этапе для X.
Этот метод позволяет осуществлять мониторинг (т.е. определять ошибку на тестовом наборе) после каждого этапа.
- Параметры:
- X{array-like, sparse matrix} формы (n_samples, n_features)
Входные выборки. Внутренне они будут преобразованы в
dtype=np.float32и если разреженная матрица предоставлена, в разреженнуюcsr_matrix.
- Возвращает:
- yгенератор ndarray формы (n_samples,)
Предсказанное значение входных выборок.
Примеры галереи#
Интервалы прогнозирования для регрессии градиентного бустинга
Построить индивидуальные и голосующие регрессионные предсказания