Версия 1.8#

Для краткого описания основных особенностей выпуска, пожалуйста, обратитесь к Основные нововведения в scikit-learn 1.8.

Легенда для списков изменений

Основная функция что-то большое, что вы не могли сделать раньше.
Функция что-то, что вы не могли делать раньше.
Эффективность существующий признак теперь может не требовать столько вычислений или памяти.
Улучшение различные мелкие улучшения.
Исправление то, что ранее не работало, как задокументировано – или согласно разумным ожиданиям – теперь должно работать.
Изменение API вам потребуется изменить свой код, чтобы добиться того же эффекта в будущем; или функция будет удалена в будущем.

Версия 1.8.0#

Декабрь 2025

Изменения, затрагивающие многие модули#

Эффективность Улучшено использование процессора и памяти в оценщиках и функциях метрик, которые полагаются на взвешенные процентили, и лучше соответствуют реализациям процентилей NumPy и Scipy (без взвешивания). Lucy Liu #31775

Поддержка Array API#

Дополнительные оценщики и функции были обновлены для включения поддержки всех Array API соответствующие входные данные.

См. Поддержка Array API (экспериментальная) для получения дополнительной информации.

Функция sklearn.preprocessing.StandardScaler теперь поддерживает входные данные, совместимые с Array API. С помощью Alexander Fabisch, Эдоардо Абати, Оливье Гризель и Чарльз Хилл. #27113
Функция linear_model.RidgeCV, linear_model.RidgeClassifier и linear_model.RidgeClassifierCV теперь поддерживают совместимые с array API входные данные с solver="svd". Путем Жером Докес. #27961
Функция metrics.pairwise.pairwise_kernels для любого ядра, кроме "лапласианского" и metrics.pairwise_distances для метрик "cosine", "euclidean" и "l2" теперь поддерживает входные данные API массивов. Благодаря Emily Chen и Lucy Liu #29822
Функция sklearn.metrics.confusion_matrix теперь поддерживает входные данные, совместимые с Array API. Путём Stefanie Senger #30562
Функция sklearn.mixture.GaussianMixture с init_params="random" или init_params="random_from_data" и warm_start=False теперь поддерживает входные данные, совместимые с Array API. Путём Stefanie Senger и Loïc Estève #30777
Функция sklearn.metrics.roc_curve теперь поддерживает входные данные, совместимые с Array API. Путём Thomas Li #30878
Функция preprocessing.PolynomialFeatures теперь поддерживает входные данные, совместимые с API массивов. По Omar Salman #31580
Функция calibration.CalibratedClassifierCV теперь поддерживает совместимые с Array API входные данные с method="temperature" и когда базовый estimator также поддерживает Array API. С помощью Omar Salman #32246
Функция sklearn.metrics.precision_recall_curve теперь поддерживает входные данные, совместимые с array API. Путем Lucy Liu #32249
Функция sklearn.model_selection.cross_val_predict теперь поддерживает входные данные, совместимые с API массивов. По Omar Salman #32270
Функция sklearn.metrics.brier_score_loss, sklearn.metrics.log_loss, sklearn.metrics.d2_brier_score и sklearn.metrics.d2_log_loss_score теперь поддерживают совместимые с Array API входные данные. Путем Omar Salman #32422
Функция naive_bayes.GaussianNB теперь поддерживает входные данные, совместимые с API массивов. По Omar Salman #32497
Функция preprocessing.LabelBinarizer и preprocessing.label_binarize теперь поддерживает совместимые с числовым array API входные данные с sparse_output=False. Путем Вирджил Чан. #32582
Функция sklearn.metrics.det_curve теперь поддерживает входные данные, совместимые с Array API. С помощью Йозеф Аффуртит. #32586
Функция sklearn.metrics.pairwise.manhattan_distances теперь поддерживает входные данные, совместимые с API массивов. По Omar Salman. #32597
Функция sklearn.metrics.calinski_harabasz_score теперь поддерживает входные данные, совместимые с Array API. С помощью Йозеф Аффуртит. #32600
Функция sklearn.metrics.balanced_accuracy_score теперь поддерживает входные данные, совместимые с API массивов. По Omar Salman. #32604
Функция sklearn.metrics.pairwise.laplacian_kernel теперь поддерживает входные данные, совместимые с API массивов. По Zubair Shakoor. #32613
Функция sklearn.metrics.cohen_kappa_score теперь поддерживает входные данные, совместимые с API массивов. По Omar Salman. теперь поддерживает пользовательские стратегии путем передачи функции вместо имени стратегии.
Функция sklearn.metrics.cluster.davies_bouldin_score теперь поддерживает входные данные, совместимые с Array API. С помощью Йозеф Аффуртит. #32693
Исправление Оценщики с поддержкой array API больше не отклоняют входные данные dataframe, когда включена поддержка array API. По Tim Head #32838

при использовании парсера pandas. Параметр#

См. Руководство по маршрутизации метаданных для более подробной информации.

Исправление Исправлена проблема, когда передача sample_weight в Pipeline внутри GridSearchCV выдаст ошибку при включенной маршрутизации метаданных. Путем Адрин Джалали. #31898

Поддержка свободнопоточного CPython 3.14#

scikit-learn поддерживает свободнопоточный CPython, в частности свободнопоточные сборки доступны для всех поддерживаемых платформ на Python 3.14.

Свободнопоточный (также известный как nogil) CPython — это версия CPython, которая направлена на обеспечение эффективных многопоточных сценариев использования путем удаления глобальной блокировки интерпретатора (GIL).

Если вы хотите попробовать свободнопоточный Python, рекомендуется использовать Python 3.14, в котором исправлен ряд проблем по сравнению с Python 3.13. Не стесняйтесь пробовать свободнопоточную версию на вашем случае использования и сообщать о любых проблемах!

Для получения дополнительной информации о свободнопоточном CPython см. документация py-free-threading, в частности как установить свободнопоточный CPython и Отслеживание совместимости экосистемы.

По Loïc Estève и Оливье Гризель и многие другие люди в более широкой экосистеме Scientific Python и CPython, например Nathan Goldbaum, Ralf Gommers, Эдгар Андрес Маргффой Туай. #32079

`sklearn.base`#

Функция Рефакторинг dir в BaseEstimator для распознавания проверки условия в available_if. Путем Джон Хендрикс и Miguel Parece. #31928
Исправление Исправлена обработка пропущенных значений pandas в HTML-отображении всех оценивателей. От Dea María Léon. #32341

`sklearn.calibration`#

Функция Добавлен метод масштабирования температуры в calibration.CalibratedClassifierCV. Путем Вирджил Чан и Christian Lorentzen. #31068

`sklearn.cluster`#

Эффективность cluster.kmeans_plusplus теперь использует np.cumsum напрямую без дополнительных проверок численной устойчивости и без приведения к np.float64. Путем Тициано Зито #31991
Исправление Значение по умолчанию для copy параметр в cluster.HDBSCAN изменится с False to True в 1.10, чтобы избежать модификации данных и сохранить согласованность с другими оценщиками. По Sarthak Puri. #31973

`sklearn.compose`#

Исправление The compose.ColumnTransformer теперь корректно обучается на данных, предоставленных в виде polars.DataFrame когда любой преобразователь имеет разреженный вывод. При Филипп Гнан. #32188

`sklearn.covariance`#

Эффективность sklearn.covariance.GraphicalLasso, sklearn.covariance.GraphicalLassoCV и sklearn.covariance.graphical_lasso с mode="cd" выигрывают от улучшения производительности времени обучения sklearn.linear_model.Lasso с помощью правил безопасного отсечения по разрыву. Christian Lorentzen. #31987
Исправление Исправлена неконтролируемая случайность в sklearn.covariance.GraphicalLasso, sklearn.covariance.GraphicalLassoCV и sklearn.covariance.graphical_lasso. Для mode="cd", теперь они используют циклический покоординатный спуск. Раньше это был случайный покоординатный спуск с неуправляемым начальным числом для генерации случайных чисел. По Christian Lorentzen. #31987
Исправление Добавлена поправка к covariance.MinCovDet для корректировки согласованности при нормальном распределении. Это уменьшает смещение, присутствующее при применении этого метода к данным, распределенным нормально. Путем Даниэль Эррера-Эспосито #32117

`sklearn.decomposition`#

Эффективность sklearn.decomposition.DictionaryLearning и sklearn.decomposition.MiniBatchDictionaryLearning с fit_algorithm="cd", sklearn.decomposition.SparseCoder с transform_algorithm="lasso_cd", sklearn.decomposition.MiniBatchSparsePCA, sklearn.decomposition.SparsePCA, sklearn.decomposition.dict_learning и sklearn.decomposition.dict_learning_online с method="cd", sklearn.decomposition.sparse_encode с algorithm="lasso_cd" все выигрывают от улучшения производительности времени обучения sklearn.linear_model.Lasso с помощью gap safe screening rules. С помощью Christian Lorentzen. #31987
Улучшение decomposition.SparseCoder теперь следует API трансформеров scikit-learn. Кроме того, fit метод теперь проверяет входные данные и параметры. При 2. может быть любым подходящим способом извлечения признаков среди различных. Исправления в
Исправление Добавить проверки входных данных в inverse_transform метод decomposition.PCA и decomposition.IncrementalPCA. #29310 by будет изменён с. #29310

`sklearn.discriminant_analysis`#

Функция Добавлен solver, covariance_estimator и shrinkage в discriminant_analysis.QuadraticDiscriminantAnalysis. Полученный класс более похож на discriminant_analysis.LinearDiscriminantAnalysis и позволяет получить большую гибкость в оценке ковариационных матриц. По Даниэль Эррера-Эспосито. #32108

`sklearn.ensemble`#

Исправление ensemble.BaggingClassifier, ensemble.BaggingRegressor и ensemble.IsolationForest теперь использует sample_weight для выборки образцов вместо их передачи, умноженных на равномерно выбранную маску, к базовым оценщикам. Кроме того, когда max_samples является float, теперь интерпретируется как доля sample_weight.sum() вместо X.shape[0]. Новое значение по умолчанию max_samples=None рисует X.shape[0] образцов, независимо от sample_weight. Путем Antoine Baker. #31414 и #32825

`sklearn.feature_selection`#

Улучшение feature_selection.SelectFromModel теперь не принуждает max_features должно быть меньше или равно количеству входных признаков. Путём Thibault #31939

`sklearn.gaussian_process`#

Эффективность make GaussianProcessRegressor.predict быстрее, когда return_cov и return_std оба False. Путем Rafael Ayllón Gavilán. #31431

`sklearn.linear_model`#

Эффективность linear_model.ElasticNet и linear_model.Lasso с precompute=False использовать меньше памяти для плотных X и немного быстрее. Ранее они использовали вдвое больше памяти, чем X даже для Fortran-непрерывных X. Путем Christian Lorentzen #31665
Эффективность linear_model.ElasticNet и linear_model.Lasso избежать двойной проверки входных данных и поэтому немного быстрее. По Christian Lorentzen. #31848
Эффективность linear_model.ElasticNet, linear_model.ElasticNetCV, linear_model.Lasso, linear_model.LassoCV, linear_model.MultiTaskElasticNet, linear_model.MultiTaskElasticNetCV, linear_model.MultiTaskLasso и linear_model.MultiTaskLassoCV обучаются быстрее, избегая вызова BLAS уровня 1 (axpy) во внутреннем цикле. То же самое для функций linear_model.enet_path и linear_model.lasso_path. Путем Christian Lorentzen #31956 и #31880
Эффективность linear_model.ElasticNetCV, linear_model.LassoCV, linear_model.MultiTaskElasticNetCV и linear_model.MultiTaskLassoCV избежать дополнительной копии X со значением по умолчанию copy_X=True. Путем Christian Lorentzen. #31946
Эффективность linear_model.ElasticNet, linear_model.ElasticNetCV, linear_model.Lasso, linear_model.LassoCV, linear_model.MultiTaskElasticNet, linear_model.MultiTaskElasticNetCV linear_model.MultiTaskLasso, linear_model.MultiTaskLassoCV а также linear_model.lasso_path и linear_model.enet_path теперь реализуют правила безопасного отсечения зазора в решателе координатного спуска для плотных и разреженных X. Ускорение времени обучения особенно заметно (возможно в 10 раз) при вычислении путей регуляризации, как это делают *CV-варианты вышеуказанных оценщиков. Теперь есть дополнительная проверка критерия остановки перед входом в основной цикл шагов спуска. Поскольку критерий остановки требует вычисления двойственного разрыва, отсечение происходит всякий раз, когда вычисляется двойственный разрыв. Автор Christian Lorentzen #31882, #31986, #31987 и #32014
Улучшение linear_model.ElasticNet, linear_model.ElasticNetCV, linear_model.Lasso, linear_model.LassoCV, MultiTaskElasticNet, MultiTaskElasticNetCV, MultiTaskLasso, MultiTaskLassoCV, а также linear_model.enet_path и linear_model.lasso_path теперь использует dual gap <= tol вместо dual gap < tol как критерий остановки. Полученные коэффициенты могут отличаться от предыдущих версий scikit-learn в редких случаях. По Christian Lorentzen. #31906
Исправление Исправлены критерии сходимости для моделей SGD, чтобы избежать преждевременной сходимости, когда tol != None. Это в первую очередь влияет на SGDOneClassSVM но также влияет на SGDClassifier и SGDRegressor. До этого исправления только функция потерь без штрафа использовалась для проверки сходимости, тогда как теперь используется полная целевая функция с регуляризацией. Guillaume Lemaitre и kostayScr #31856
Исправление Допустимый диапазон параметров для начальной скорости обучения eta0 в linear_model.SGDClassifier, linear_model.SGDOneClassSVM, linear_model.SGDRegressor и linear_model.Perceptron изменено с неотрицательных чисел на строго положительные числа. Как следствие, значение по умолчанию eta0 of linear_model.SGDClassifier и linear_model.SGDOneClassSVM изменилось с 0 на 0.01. Но обратите внимание, что eta0 не используется по умолчанию для скорости обучения "optimal" этих двух оценщиков. Путем Christian Lorentzen. #31933
Исправление linear_model.LogisticRegressionCV способен обрабатывать разбиения перекрёстной проверки, где некоторые метки классов отсутствуют в некоторых фолдах. Раньше он вызывал ошибку, когда метка класса отсутствовала в фолде. Благодаря Christian Lorentzen. #32747
Изменение API linear_model.PassiveAggressiveClassifier и linear_model.PassiveAggressiveRegressor are deprecated and will be removed in 1.10. Equivalent estimators are available with linear_model.SGDClassifier и SGDRegressor, оба из которых предоставляют опции learning_rate="pa1" и "pa2". Параметр eta0 можно использовать для указания параметра агрессивности алгоритмов Passive-Aggressive, называемого C в исходной статье. Путём Christian Lorentzen #31932 и #29097
Изменение API linear_model.SGDClassifier, linear_model.SGDRegressor, и linear_model.SGDOneClassSVM теперь устаревает для отрицательных значений power_t параметр. Использование отрицательного значения вызовет предупреждение в версии 1.8 и ошибку в версии 1.10. Вместо этого необходимо использовать значение в диапазоне [0.0, inf). По Ритви Алагусанкар #31474
Изменение API Вызов ошибки в sklearn.linear_model.LogisticRegression когда используется решатель liblinear и входные значения X больше 1e30, решатель liblinear иначе зависает. Путем Шрути Нат. #31888
Изменение API linear_model.LogisticRegressionCV получил новый параметр use_legacy_attributes для управления типами и формами подогнанных атрибутов C_, l1_ratio_, coefs_paths_, scores_ и n_iter_. Текущее значение по умолчанию True сохраняет устаревшее поведение. Если False тогда:
- C_ является числом с плавающей точкой.
- l1_ratio_ является числом с плавающей точкой.
- coefs_paths_ является ndarray формы (n_folds, n_l1_ratios, n_cs, n_classes, n_features). Для бинарных задач (n_classes=2), предпоследнее измерение равно 1.
- scores_ является ndarray формы (n_folds, n_l1_ratios, n_cs).
- n_iter_ является ndarray формы (n_folds, n_l1_ratios, n_cs).
В версии 1.10 значение по умолчанию изменится на False и use_legacy_attributes будет устаревать. В 1.12 use_legacy_attributes будет удален. По Christian Lorentzen. #32114
Изменение API Параметр penalty of linear_model.LogisticRegression и linear_model.LogisticRegressionCV устарел и будет удален в версии 1.10. Эквивалентное поведение можно получить следующим образом:
- для linear_model.LogisticRegression
  - использовать l1_ratio=0 вместо penalty="l2"
  - использовать l1_ratio=1 вместо penalty="l1"
  - использовать 0 вместо penalty="elasticnet"
  - использовать C=np.inf вместо penalty=None
- для linear_model.LogisticRegressionCV
  - использовать l1_ratios=(0,) вместо penalty="l2"
  - использовать l1_ratios=(1,) вместо penalty="l1"
  - эквивалент penalty=None состоит в том, чтобы иметь np.inf как элемент Cs параметр
Для linear_model.LogisticRegression, значение по умолчанию l1_ratio изменился с None to 0.0. Установка l1_ratio=None устарел и будет вызывать ошибку в версии 1.10

Для linear_model.LogisticRegressionCV, значение по умолчанию l1_ratios изменился с None to "warn". Он будет изменён на (0,) в версии 1.10. Установка l1_ratios=None устарел и будет вызывать ошибку в версии 1.10.

По Christian Lorentzen. #32659
Изменение API The n_jobs параметр linear_model.LogisticRegression устарел и будет удалён в версии 1.10. Он не оказывает эффекта с версии 1.8. По Loïc Estève. #32742

`sklearn.manifold`#

Основная функция manifold.ClassicalMDS был реализован для выполнения классического MDS (разложение по собственным значениям дважды центрированной матрицы расстояний). По Dmitry Kobak и Meekail Zain #31322
Функция manifold.MDS теперь поддерживает произвольные метрики расстояния (через metric и metric_params параметры) и инициализация через классический MDS (через init параметр). dissimilarity параметр был устаревшим. Старый metric параметр был переименован в metric_mds. Путем Dmitry Kobak #32229
Функция manifold.TSNE теперь поддерживает инициализацию PCA с разреженными входными матрицами. С помощью Arturo Amor. #32433

`sklearn.metrics`#

Функция metrics.d2_brier_score был добавлен, который вычисляет D^2 для оценки Брайера. С помощью Omar Salman. #28971
Функция Добавить metrics.confusion_matrix_at_thresholds функция, возвращающая количество истинно отрицательных, ложноположительных, ложноотрицательных и истинно положительных случаев на порог. По Success Moses. #30134
Эффективность Избегать избыточной проверки входных данных в metrics.d2_log_loss_score приводя к ускорению в 1,2 раза в крупномасштабных тестах. С помощью Оливье Гризель и Omar Salman #32356
Улучшение metrics.median_absolute_error теперь поддерживает входные данные, совместимые с Array API. Путём Lucy Liu. #31406
Улучшение Улучшено сообщение об ошибке для разреженных входов для следующих метрик: metrics.accuracy_score, metrics.multilabel_confusion_matrix, metrics.jaccard_score, metrics.zero_one_loss, metrics.f1_score, metrics.fbeta_score, metrics.precision_recall_fscore_support, metrics.class_likelihood_ratios, metrics.precision_score, metrics.recall_score, metrics.classification_report, metrics.hamming_loss. Путем Lucy Liu. #32047
Исправление metrics.median_absolute_error теперь использует _averaged_weighted_percentile вместо _weighted_percentile для вычисления медианы, когда sample_weight не является None. Это эквивалентно использованию "averaged_inverted_cdf" вместо "inverted_cdf" метода квантилей, что даёт результаты, эквивалентные numpy.median если используются равные веса. По Lucy Liu #30787
Исправление Дополнительные sample_weight проверка была добавлена в metrics.accuracy_score, metrics.balanced_accuracy_score, metrics.brier_score_loss, metrics.class_likelihood_ratios, metrics.classification_report, metrics.cohen_kappa_score, metrics.confusion_matrix, metrics.f1_score, metrics.fbeta_score, metrics.hamming_loss, metrics.jaccard_score, metrics.matthews_corrcoef, metrics.multilabel_confusion_matrix, metrics.precision_recall_fscore_support, metrics.precision_score, metrics.recall_score и metrics.zero_one_loss. sample_weight может быть только 1D, согласованно с y_true и y_pred по длине, и все значения должны быть конечными и не комплексными. По Lucy Liu. #31701
Исправление y_pred устарел в пользу y_score в metrics.DetCurveDisplay.from_predictions и metrics.PrecisionRecallDisplay.from_predictions. y_pred будет удален в v1.10. Путем Luis #31764
Исправление repr на оценщике, который был создан с partial score_func теперь корректно работает и использует repr данного partial объект. Адрин Джалали. #31891
Исправление kwargs, указанные в curve_kwargs параметр metrics.RocCurveDisplay.from_cv_results теперь перезаписывают только свои соответствующие значения по умолчанию перед передачей в plot. Ранее передача любого curve_kwargs перезаписал бы все аргументы по умолчанию. С помощью Lucy Liu. #32313
Исправление Зарегистрированные именованные объекты оценщика для metrics.d2_brier_score и metrics.d2_log_loss_score и обновили проверку входных данных для согласованности с родственными функциями метрик. Автор Оливье Гризель и Omar Salman #32356
Исправление metrics.RocCurveDisplay.from_cv_results теперь будет выводить pos_label как estimator.classes_[-1], используя оценщик из cv_results, когда pos_label=None. Ранее ошибка возникала, когда pos_label=None. Путем Lucy Liu. #32372
Исправление Все метрики классификации теперь вызывают ValueError когда требуются входные массивы (y_pred, y_true, y1, y2, pred_decision, или y_proba) пусты. Ранее, accuracy_score, class_likelihood_ratios, classification_report, confusion_matrix, hamming_loss, jaccard_score, matthews_corrcoef, multilabel_confusion_matrix, и precision_recall_fscore_support не вызывал эту ошибку последовательно. По Stefanie Senger. #32549
Изменение API metrics.cluster.entropy устарел и будет удален в v1.10. С помощью Lucy Liu #31294
Изменение API The estimator_name parameter устарел в пользу name в metrics.PrecisionRecallDisplay и будет удален в версии 1.10. По Lucy Liu. #32310

`sklearn.model_selection`#

Улучшение model_selection.StratifiedShuffleSplit теперь будет указывать, какие классы
имеют слишком мало членов при возникновении ValueError если какой-либо класс имеет менее 2 элементов. Это полезно для определения того, какие классы вызывают ошибку. По Marc Bresson #32265
Исправление Исправлено поведение перемешивания в model_selection.StratifiedGroupKFold. Теперь стратификация между фолдами также сохраняется, когда shuffle=True. Путем Pau Folch. #32540

`sklearn.multiclass`#

Исправление Исправление поведения при разрешении ничьих в multiclass.OneVsRestClassifier для соответствия np.argmax поведение при разрешении ничьих. Путем Лакшми Кришнан. #15504

`sklearn.naive_bayes`#

Исправление naive_bayes.GaussianNB сохраняет тип данных обученных атрибутов в соответствии с типом данных X. Путем Omar Salman #32497

`sklearn.preprocessing`#

Улучшение preprocessing.SplineTransformer теперь может обрабатывать пропущенные значения с параметром handle_missing. С помощью Stefanie Senger. #28043
Улучшение The preprocessing.PowerTransformer теперь возвращает предупреждение при обнаружении значений NaN в обратном преобразовании, inverse_transform, обычно вызвано сильно несбалансированными данными. По Roberto Mourao #29307
Улучшение preprocessing.MaxAbsScaler теперь может обрезать значения вне диапазона в отложенных данных с помощью параметра clip. Путем Hleb Levitski. #31790
Исправление Исправлена ошибка в preprocessing.OneHotEncoder где handle_unknown='warn' некорректно вел себя как 'ignore' вместо 'infrequent_if_exist'. Путем Nithurshen #32592

`sklearn.semi_supervised`#

Исправление Пользовательские ядерные результаты теперь нормализуются в semi_supervised.LabelPropagation так что все суммы строк равны 1, даже если ядро дает асимметричные или неравномерные суммы строк. По Дэн Шульт. #31924

`sklearn.tree`#

Эффективность tree.DecisionTreeRegressor с criterion="absolute_error" теперь работает намного быстрее: сложность O(n log n) против предыдущей O(n^2), что позволяет масштабироваться до миллионов точек данных, даже сотен миллионов. Arthur Lacote #32100
Исправление Сделать tree.export_text потокобезопасный. С помощью Оливье Гризель. #30041
Исправление export_graphviz теперь вызывает ValueError если заданные имена признаков не все являются строками. Автор Гилерме Пейшоту #31036
Исправление tree.DecisionTreeRegressor с criterion="absolute_error" иногда делал неоптимальные разбиения (т.е. разбиения, которые не минимизируют абсолютную ошибку). Теперь это исправлено. Поэтому переобучение деревьев может давать немного другие результаты. Автор Arthur Lacote #32100
Исправление Исправлена регрессия в деревья решений где почти постоянные признаки не обрабатывались должным образом. Автор Sercan Turkmen. #32259
Исправление Исправлена логика разделения во время обучения в tree.DecisionTree* (и, следовательно, в ensemble.RandomForest*) для узлов, содержащих почти постоянные значения признаков и пропущенные значения. Ранее деревья обрезались раньше, если находился постоянный признак, даже если можно было выполнить больше разбиений на основе пропущенных значений. С помощью Arthur Lacote #32274
Исправление Исправление обработки пропущенных значений в методе decision_path деревьев (tree.DecisionTreeClassifier, tree.DecisionTreeRegressor, tree.ExtraTreeClassifier и tree.ExtraTreeRegressor) По Arthur Lacote. #32280
Исправление Исправлено разделение дерева решений с отсутствующими значениями в некоторых признаках. В некоторых случаях последний неотсутствующий образец не разделялся правильно. Автор: Tim Head и Arthur Lacote. #32351

`sklearn.utils`#

Эффективность Функция sklearn.utils.extmath.safe_sparse_dot был улучшен за счет выделенного Cython-кода для случая a @ b с разреженными двумерными a и b и когда требуется плотный вывод, т.е., dense_output=True. Это улучшает несколько алгоритмов в scikit-learn при работе с разреженными массивами (или матрицами). Путем Christian Lorentzen. #31952
Улучшение Таблица параметров в HTML-представлении всех оценщиков scikit-learn и, в более общем смысле, оценщиков, наследующих от base.BaseEstimator теперь отображает описание параметра в виде всплывающей подсказки и имеет ссылку на онлайн-документацию для каждого параметра. Автор Dea María Léon. #31564
Улучшение sklearn.utils._check_sample_weight теперь выводит более понятное сообщение об ошибке, когда предоставленные веса не являются ни скаляром, ни одномерным массивоподобным объектом того же размера, что и входные данные. Автор: Капил Парех. #31873
Улучшение sklearn.utils.estimator_checks.parametrize_with_checks теперь позволяет настроить строгий режим для xfailing проверок. Тесты, которые неожиданно проходят, приведут к провалу теста. Поведение по умолчанию не изменено. С помощью Tim Head. #31951
Улучшение Исправлено выравнивание символов "?" и "i" и улучшен цветовой стиль HTML-представления оценок. Автор Guillaume Lemaitre. #31969
Исправление Изменяет способ выбора цвета при отображении оценщика в виде HTML-представления. Цвета больше не адаптируются к теме пользователя, а выбираются на основе объявленной цветовой схемы темы (светлая или темная) для VSCode и JupyterLab. Если тема не объявляет цветовую схему, схема выбирается в соответствии с цветом текста по умолчанию на странице, если это не удается, используется медиа-запрос. По Мэтт Дж.. #32330
Изменение API utils.extmath.stable_cumsum устарел и будет удален в v1.10. Используйте np.cumulative_sum с желаемым dtype напрямую вместо. По Тициано Зито. Для примера использования

Участники кода и документации

Благодарим всех, кто внес вклад в поддержку и улучшение проекта с версии 1.7, включая:

$id, 4hm3d, Acciaro Gennaro Daniele, achyuthan.s, Adam J. Stewart, Adriano Leão, Adrien Linares, Adrin Jalali, Aitsaid Azzedine Idir, Alexander Fabisch, Alexandre Abraham, Andrés H. Zapke, Anne Beyer, Anthony Gitter, AnthonyPrudent, antoinebaker, Arpan Mukherjee, Arthur, Arthur Lacote, Arturo Amor, ayoub.agouzoul, Ayrat, Ayush, Ayush Tanwar, Basile Jezequel, Bhavya Patwa, BRYANT MUSI BABILA, Casey Heath, Chems Ben, Christian Lorentzen, Christian Veenhuis, Christine P. Chai, cstec, C. Titus Brown, Daniel Herrera-Esposito, Dan Schult, dbXD320, Dea María Léon, Deepyaman Datta, dependabot[bot], Dhyey Findoriya, Dimitri Papadopoulos Orfanos, Dipak Dhangar, Dmitry Kobak, elenafillo, Elham Babaei, EmilyXinyi, Emily (Xinyi) Chen, Eugen-Bleck, Evgeni Burovski, fabarca, Fabrizio Damicelli, Faizan-Ul Huda, François Goupil, François Paugam, Gaetan, GaetandeCast, Gesa Loof, Gonçalo Guiomar, Gordon Grey, Gowtham Kumar K., Guilherme Peixoto, Guillaume Lemaitre, hakan çanakçı, Harshil Sanghvi, Henri Bonamy, Hleb Levitski, HulusiOzy, hvtruong, Ian Faust, Imad Saddik, Jérémie du Boisberranger, Jérôme Dockès, John Hendricks, Joris Van den Bossche, Josef Affourtit, Josh, jshn9515, Junaid, KALLA GANASEKHAR, Kapil Parekh, Kenneth Enevoldsen, Kian Eliasi, kostayScr, Krishnan Vignesh, kryggird, Kyle S, Lakshmi Krishnan, Leomax, Loic Esteve, Luca Bittarello, Lucas Colley, Lucy Liu, Luigi Giugliano, Luis, Mahdi Abid, Mahi Dhiman, Maitrey Talware, Mamduh Zabidi, Manikandan Gobalakrishnan, Marc Bresson, Marco Edward Gorelli, Marek Pokropiński, Maren Westermann, Marie Sacksick, Marija Vlajic, Matt J., Mayank Raj, Michael Burkhart, Michael Šimáček, Miguel Fernandes, Miro Hrončok, Mohamed DHIFALLAH, Muhammad Waseem, MUHAMMED SINAN D, Natalia Mokeeva, Nicholas Farr, Nicolas Bolle, Nicolas Hug, nithish-74, Nithurshen, Nitin Pratap Singh, NotAceNinja, Olivier Grisel, omahs, Omar Salman, Patrick Walsh, Peter Holzer, pfolch, ph-ll-pp, Prashant Bansal, Quan H. Nguyen, Radovenchyk, Rafael Ayllón Gavilán, Raghvender, Ranjodh Singh, Ravichandranayakar, Remi Gau, Reshama Shaikh, Richard Harris, RishiP2006, Ritvi Alagusankar, Roberto Mourao, Robert Pollak, Roshangoli, roychan, R Sagar Shresti, Sarthak Puri, saskra, scikit-learn-bot, Scott Huberty, Sercan Turkmen, Sergio P, Shashank S, Shaurya Bisht, Shivam, Shruti Nath, SIKAI ZHANG, sisird864, SiyuJin-1, S. M. Mohiuddin Khan Shiam, Somdutta Banerjee, sotagg, Sota Goto, Spencer Bradkin, Stefan, Stefanie Senger, Steffen Rehberg, Steven Hur, Success Moses, Sylvain Combettes, ThibaultDECO, Thomas J. Fan, Thomas Li, Thomas S., Tim Head, Tingwei Zhu, Tiziano Zito, TJ Norred, Username46786, Utsab Dahal, Vasanth K, Veghit, VirenPassi, Virgil Chan, Vivaan Nanavati, Xiao Yuan, xuzhang0327, Yaroslav Halchenko, Yaswanth Kumar, Zijun yi, zodchi94, Zubair Shakoor