Версия 1.1#

Для краткого описания основных особенностей выпуска, пожалуйста, обратитесь к Основные изменения в выпуске scikit-learn 1.1.

Легенда для списков изменений

Основная функция что-то большое, что вы не могли сделать раньше.
Функция что-то, что вы не могли делать раньше.
Эффективность существующий признак теперь может не требовать столько вычислений или памяти.
Улучшение различные мелкие улучшения.
Исправление то, что ранее не работало, как задокументировано – или согласно разумным ожиданиям – теперь должно работать.
Изменение API вам потребуется изменить свой код, чтобы добиться того же эффекта в будущем; или функция будет удалена в будущем.

Версия 1.1.3#

Октябрь 2022

Этот выпуск с исправлением ошибок включает только исправления для совместимости с последним релизом SciPy >= 1.9.2. К значительным изменениям относятся:

Исправление Включить msvcp140.dll в колесах scikit-learn, так как он был удалён в последних колесах SciPy. #24631 by Кьяра Мармо.
Улучшение Создать wheels для Python 3.11. #24446 by Кьяра Мармо.

Другие исправления ошибок будут доступны в следующем выпуске 1.2, который выйдет в ближайшие недели.

Обратите внимание, что поддержка 32-битного Python в Windows была прекращена в этом выпуске. Это связано с тем, что SciPy 1.9.2 также прекратил поддержку этой платформы. Пользователям Windows рекомендуется установить 64-битную версию Python.

Версия 1.1.2#

Август 2022

Измененные модели#

Следующие оценщики и функции, при обучении на тех же данных и параметрах, могут создавать модели, отличные от предыдущей версии. Это часто происходит из-за изменений в логике моделирования (исправления ошибок или улучшения) или в процедурах случайной выборки.

Исправление manifold.TSNE теперь вызывает ValueError при обучении с perplexity>=n_samples для обеспечения математической корректности алгоритма. #10805 by Mathias Andersen и #23471 by Meekail Zain.

Журнал изменений#

Исправление Представление по умолчанию в HTML показано для мета-оценщиков с недопустимыми параметрами. #24015 by Томас Фан.
Исправление Добавлена поддержка F-смежных массивов для оценщиков и функций, чей бэкенд был изменён в версии 1.1. #23990 by Julien Jerphanion.
Исправление Теперь доступны колеса для MacOS 10.9 и выше. #23833 by Томас Фан.

`sklearn.base`#

Исправление The get_params метод base.BaseEstimator класс теперь поддерживает оценщики с type-type параметры, которые имеют get_params метод. #24017 by Генри Сорски.

`sklearn.cluster`#

Исправление Исправлена ошибка в cluster.Birch что может вызвать ошибку при разделении узла, если в наборе данных есть дубликаты. #23395 by Жереми дю Буаберранже.

`sklearn.feature_selection`#

Исправление feature_selection.SelectFromModel по умолчанию использует порог выбора 1e-5, когда оценщик является либо linear_model.ElasticNet или linear_model.ElasticNetCV с l1_ratio равно 1 или linear_model.LassoCV. #23636 by Hao Chun Chang.

`sklearn.impute`#

Исправление impute.SimpleImputer использует dtype, наблюдаемый в fit для transform когда dtype является object. #22063 by Томас Фан.

`sklearn.linear_model`#

Исправление Использовать допуски, учитывающие тип данных, для проверки матриц Грама (переданных пользователями или предвычисленных). #22059 by Malte S. Kurz.
Исправление Исправлена ошибка в linear_model.LogisticRegression с solver="newton-cg", fit_intercept=True, и один признак. #23608 by Tom Dupre la Tour.

`sklearn.manifold`#

Исправление manifold.TSNE теперь вызывает ValueError при обучении с perplexity>=n_samples для обеспечения математической корректности алгоритма. #10805 by Mathias Andersen и #23471 by Meekail Zain.

`sklearn.metrics`#

Исправление Исправлено сообщение об ошибке metrics.coverage_error для одномерного массива на входе. Текущее состояние кодовой базы scikit-learn не соответствует всем этим рекомендациям, но мы ожидаем, что применение этих ограничений ко всем новым вкладам улучшит общее качество кодовой базы. by Hao Chun Chang.

`sklearn.preprocessing`#

Исправление preprocessing.OrdinalEncoder.inverse_transform правильно обрабатывает случаи использования, когда unknown_value или encoded_missing_value является nan. #24087 by Томас Фан.

`sklearn.tree`#

Исправление Исправлена ошибка недопустимого доступа к памяти во время обучения в tree.DecisionTreeRegressor и tree.DecisionTreeClassifier. #23273 by Томас Фан.

Версия 1.1.1#

Май 2022

Журнал изменений#

Улучшение Сообщение об ошибке улучшено при импорте model_selection.HalvingGridSearchCV, model_selection.HalvingRandomSearchCV, или impute.IterativeImputer без импорта экспериментального флага. #23194 by Томас Фан.
Улучшение Добавлено расширение в doc/conf.py для автоматической генерации списка оценщиков, обрабатывающих значения NaN. #23198 by Lise Kleiber, Zhehao Liu и Кьяра Мармо.

`sklearn.datasets`#

Исправление Избегать таймаутов в datasets.fetch_openml не передавая timeout аргумент, #23358 by Loïc Estève.

`sklearn.decomposition`#

Исправление Избежать ложного предупреждения в decomposition.IncrementalPCA когда n_samples == n_components. #23264 by Lucy Liu.

`sklearn.feature_selection`#

Исправление The partial_fit метод feature_selection.SelectFromModel теперь проводит валидацию для max_features и feature_names_in параметры. #23299 by Long Bao.

`sklearn.metrics`#

Исправление Исправления metrics.precision_recall_curve для вычисления точности-полноты при 100% полноте. Кривая точности-полноты теперь отображает последнюю точку, соответствующую классификатору, который всегда предсказывает положительный класс: полнота=100% и точность=баланс классов. #23214 by Стефан Колло и Max Baak.

`sklearn.preprocessing`#

Исправление preprocessing.PolynomialFeatures с degree равным 0 вызовет ошибку, когда include_bias установлен в False и выводит единый постоянный массив, когда include_bias установлено в True. #23370 by Zhehao Liu.

`sklearn.tree`#

Исправление Исправляет регрессию производительности с признаками низкой мощности для tree.DecisionTreeClassifier, tree.DecisionTreeRegressor, ensemble.RandomForestClassifier, ensemble.RandomForestRegressor, ensemble.GradientBoostingClassifier, и ensemble.GradientBoostingRegressor. #23410 by Loïc Estève.

`sklearn.utils`#

Исправление utils.class_weight.compute_sample_weight теперь работает с разреженными данными y. #23115 by kernc.

Версия 1.1.0#

Май 2022

Минимальные зависимости#

Версия 1.1.0 scikit-learn требует python 3.8+, numpy 1.17.3+ и scipy 1.3.2+. Опциональная минимальная зависимость - matplotlib 3.1.2+.

Измененные модели#

Следующие оценщики и функции, при обучении на тех же данных и параметрах, могут создавать модели, отличные от предыдущей версии. Это часто происходит из-за изменений в логике моделирования (исправления ошибок или улучшения) или в процедурах случайной выборки.

Эффективность cluster.KMeans теперь по умолчанию algorithm="lloyd" вместо algorithm="auto", что было эквивалентно algorithm="elkan". Алгоритм Ллойда и алгоритм Элкана сходятся к одному и тому же решению, с точностью до ошибок округления, но в целом алгоритм Ллойда использует гораздо меньше памяти и часто быстрее.
Эффективность Обучение tree.DecisionTreeClassifier, tree.DecisionTreeRegressor, ensemble.RandomForestClassifier, ensemble.RandomForestRegressor, ensemble.GradientBoostingClassifier, и ensemble.GradientBoostingRegressor в среднем на 15% быстрее, чем в предыдущих версиях, благодаря новому алгоритму сортировки для нахождения наилучшего разделения. Модели могут отличаться из-за другого подхода к обработке разделений со связанными значениями критерия: как старый, так и новый алгоритмы сортировки являются неустойчивыми алгоритмами сортировки. #22868 by Томас Фан.
Исправление Инициализация собственных векторов для cluster.SpectralClustering и manifold.SpectralEmbedding теперь сэмплирует из гауссовского распределения при использовании 'amg' или 'lobpcg' решатель. Это изменение улучшает численную устойчивость решателя, но может привести к другой модели.
Исправление feature_selection.f_regression и feature_selection.r_regression теперь будет возвращать конечную оценку по умолчанию вместо np.nan и np.inf для некоторых крайних случаев. Вы можете использовать force_finite=False если вы действительно хотите получить не конечные значения и сохранить старое поведение.
Исправление DataFrames библиотеки Panda со всеми нестроковыми столбцами, такими как MultiIndex, больше не предупреждают при передаче в Estimator. Estimator продолжат игнорировать имена столбцов в DataFrames с нестроковыми столбцами. Для feature_names_in_ чтобы быть определенными, столбцы должны состоять только из строк. #22410 by Томас Фан.
Исправление preprocessing.KBinsDiscretizer изменена обработка границ бинов немного, что может привести к другому кодированию с теми же данными.
Исправление calibration.calibration_curve изменена обработка границ бинов, что может привести к другой выходной кривой при тех же данных.
Исправление discriminant_analysis.LinearDiscriminantAnalysis теперь использует правильный коэффициент масштабирования дисперсии, что может привести к другому поведению модели.
Исправление feature_selection.SelectFromModel.fit и feature_selection.SelectFromModel.partial_fit теперь можно вызывать с prefit=True. estimators_ будет глубокой копией estimator когда prefit=True. #23271 by Guillaume Lemaitre.

Журнал изменений#

Эффективность Низкоуровневые процедуры для редукций на попарных расстояниях для плотных наборов данных float64 были переработаны. Следующие функции и оценщики теперь получают улучшенную производительность с точки зрения аппаратной масштабируемости и ускорения:
Например sklearn.neighbors.NearestNeighbors.kneighbors и sklearn.neighbors.NearestNeighbors.radius_neighbors могут быть соответственно до ×20 и ×5 быстрее, чем ранее, на ноутбуке.

Более того, реализации этих двух алгоритмов теперь подходят для машин со многими ядрами, что делает их пригодными для наборов данных, состоящих из миллионов образцов.

#21987, #22064, #22065, #22288 и #22320 by Julien Jerphanion.
Улучшение Все модели scikit-learn теперь генерируют более информативное сообщение об ошибке, когда некоторые входные данные содержат неожиданные NaN или бесконечные значения. В частности, сообщение содержит имя входных данных (“X”, “y” или “sample_weight”) и если неожиданное NaN значение найдено в X, сообщение об ошибке предлагает потенциальные решения. #21219 by Оливье Гризель.
Улучшение Все модели scikit-learn теперь генерируют более информативное сообщение об ошибке при установке недопустимых гиперпараметров с помощью set_params. #21542 by Оливье Гризель.
Улучшение Удаляет случайные уникальные идентификаторы в HTML-представлении. С этим изменением jupyter notebooks воспроизводимы, пока ячейки запускаются в том же порядке. #23098 by Томас Фан.
Исправление Оценщики с non_deterministic тег установлен в True пропустит оба check_methods_sample_order_invariance и check_methods_subset_invariance тесты. #22318 by Zhehao Liu.
Изменение API Опция использования логарифмической потери, также известной как биномиальное или мультиномиальное отклонение, через loss параметров стала более согласованной. Предпочтительный способ — установка значения в "log_loss". Старые названия опций всё ещё действительны и создают те же модели, но устарели и будут удалены в версии 1.3.
- Для ensemble.GradientBoostingClassifier, loss параметр «deviance» устарел в пользу нового названия «log_loss», которое теперь используется по умолчанию. #23036 by Christian Lorentzen.
- Для ensemble.HistGradientBoostingClassifier, loss имена параметров "auto", "binary_crossentropy" и "categorical_crossentropy" устарели в пользу нового имени "log_loss", которое теперь используется по умолчанию. #23040 by Christian Lorentzen.
- Для linear_model.SGDClassifier, loss имя параметра “log” устарело в пользу нового имени “log_loss”. #23046 by Christian Lorentzen.
Изменение API Богатое HTML-представление оценщиков теперь включено по умолчанию в Jupyter блокнотах. Его можно отключить, установив display='text' в sklearn.set_config. #22856 by Жереми дю Буаберранже.

`sklearn.calibration`#

Улучшение calibration.calibration_curve принимает параметр pos_label для указания метки положительного класса. #21032 by Guillaume Lemaitre.
Улучшение calibration.CalibratedClassifierCV.fit теперь поддерживает передачу fit_params, которые направляются к base_estimator. #18170 by Бенджамин Боссан.
Улучшение calibration.CalibrationDisplay принимает параметр pos_label чтобы добавить эту информацию на график. #21038 by Guillaume Lemaitre.
Исправление calibration.calibration_curve теперь более последовательно обрабатывает границы бинов. #14975 by Андреас Мюллер и #22526 by Meekail Zain.
Изменение API calibration.calibration_curve’s normalize параметр теперь устарел и будет удален в версии 1.3. Рекомендуется использовать правильную вероятность (т.е. predict_proba положительный класс) используется для y_prob. #23095 by Джордан Силк.

`sklearn.cluster`#

Основная функция cluster.BisectingKMeans введение алгоритма Bisecting K-Means #20031 by Михал Кравчик, Tom Dupre la Tour и Жереми дю Буаберранже.
Улучшение cluster.SpectralClustering и cluster.spectral_clustering теперь включают новый 'cluster_qr' метод, который кластеризует образцы в пространстве вложений как альтернативу существующему 'kmeans' и 'discrete' методы. См. cluster.spectral_clustering для получения дополнительной информации. #21148 by Andrew Knyazev.
Улучшение Добавляет get_feature_names_out to cluster.Birch, cluster.FeatureAgglomeration, cluster.KMeans, cluster.MiniBatchKMeans. #22255 by Томас Фан.
Улучшение cluster.SpectralClustering теперь вызывает согласованные сообщения об ошибках при передаче недопустимых значений для n_clusters, n_init, gamma, n_neighbors, eigen_tol или degree. #21881 by Хьюго Васард.
Улучшение cluster.AffinityPropagation теперь возвращает центры кластеров и метки, если они существуют, даже если модель не полностью сошлась. При возврате этих потенциально вырожденных центров кластеров и меток появляется новое предупреждающее сообщение. Если центры кластеров не были построены, то центры кластеров остаются пустым списком, а метки устанавливаются в -1 и исходное предупреждающее сообщение отображается. #22217 by Meekail Zain.
Эффективность В cluster.KMeans, значение по умолчанию algorithm теперь "lloyd" который является полным классическим алгоритмом в стиле EM. Оба "auto" и "full" устарели и будут удалены в версии 1.3. Теперь они являются псевдонимами для "lloyd". Предыдущим значением по умолчанию было "auto", который полагался на алгоритм Элкана. Алгоритм Ллойда использует меньше памяти, чем алгоритм Элкана, он быстрее на многих наборах данных, и его результаты идентичны, отсюда и изменение. #21735 by Орельен Жерон.
Исправление cluster.KMeans’s init параметр теперь правильно поддерживает ввод в виде массива и строковые скаляры NumPy. #22154 by Томас Фан.

`sklearn.compose`#

Исправление compose.ColumnTransformer теперь удаляет ошибки валидации из __init__ и set_params методы. #22537 by iofall и Ариса Я..
Исправление get_feature_names_out функциональность в compose.ColumnTransformer был сломан, когда столбцы были указаны с помощью slice. Это исправлено в #22775 и #22913 by randomgeek78.

`sklearn.covariance`#

Исправление covariance.GraphicalLassoCV теперь принимает массив NumPy для параметра alphas. #22493 by Guillaume Lemaitre.

`sklearn.cross_decomposition`#

Улучшение the inverse_transform метод cross_decomposition.PLSRegression, cross_decomposition.PLSCanonical и cross_decomposition.CCA теперь позволяет восстановить X целевая переменная, когда Y параметр задан. #19680 by Robin Thibaut.
Улучшение Добавляет get_feature_names_out ко всем преобразователям в cross_decomposition модуль: cross_decomposition.CCA, cross_decomposition.PLSSVD, cross_decomposition.PLSRegression, и cross_decomposition.PLSCanonical. #22119 by Томас Фан.
Исправление Форма coef_ атрибут cross_decomposition.CCA, cross_decomposition.PLSCanonical и cross_decomposition.PLSRegression изменится в версии 1.3, с (n_features, n_targets) to (n_targets, n_features), для согласованности с другими линейными моделями и для работы с интерфейсом, ожидающим определенную форму для coef_ (например, feature_selection.RFE). #22016 by Guillaume Lemaitre.
Изменение API добавить атрибут fitted intercept_ to cross_decomposition.PLSCanonical, cross_decomposition.PLSRegression, и cross_decomposition.CCA. Метод predict действительно эквивалентно Y = X @ coef_ + intercept_. #22015 by Guillaume Lemaitre.

`sklearn.datasets`#

Функция datasets.load_files теперь принимает список игнорирования и список разрешения на основе расширений файлов. #19747 by Тони Аталла и #22498 by Meekail Zain.
Улучшение datasets.make_swiss_roll теперь поддерживает необязательный аргумент hole; при установке в True возвращает набор данных swiss-hole. #21482 by Sebastian Pujalte.
Улучшение datasets.make_blobs больше не копирует данные в процессе генерации, поэтому использует меньше памяти. #22412 by Zhehao Liu.
Улучшение datasets.load_diabetes теперь принимает параметр scaled, чтобы позволить загрузку немасштабированных данных. Масштабированная версия этого набора данных теперь вычисляется из немасштабированных данных и может давать немного другие результаты, чем в предыдущей версии (в пределах абсолютной погрешности 1e-4). #16605 by Мэнди Гу.
Улучшение datasets.fetch_openml теперь имеет два необязательных аргумента n_retries и delay. По умолчанию, datasets.fetch_openml повторит попытку 3 раза в случае сбоя сети с задержкой между каждой попыткой. #21901 by Rileran.
Исправление datasets.fetch_covtype теперь безопасен для параллельного выполнения: данные загружаются во временный каталог перед перемещением в каталог данных. #23113 by Илион Бейст.
Изменение API datasets.make_sparse_coded_signal теперь принимает параметр data_transposed для явного указания формы матрицы X. Поведение по умолчанию True заключается в возврате транспонированной матрицы X соответствующий (n_features, n_samples) форма. Значение по умолчанию изменится на False в версии 1.3. #21425 by Gabriel Stefanini Vicente.

`sklearn.decomposition`#

Основная функция Добавлен новый оценщик decomposition.MiniBatchNMF. Это более быстрая, но менее точная версия неотрицательного матричного разложения, лучше подходящая для больших наборов данных. #16948 by Кьяра Мармо, Patricio Cerda и Жереми дю Буаберранже.
Улучшение decomposition.dict_learning, decomposition.dict_learning_online и decomposition.sparse_encode сохранить dtype для numpy.float32. decomposition.DictionaryLearning, decomposition.MiniBatchDictionaryLearning и decomposition.SparseCoder сохранить dtype для numpy.float32. #22002 by Takeshi Oura.
Улучшение decomposition.PCA предоставляет параметр n_oversamples настроить utils.extmath.randomized_svd и получать точные результаты, когда количество признаков велико. #21109 by Smile.
Улучшение The decomposition.MiniBatchDictionaryLearning и decomposition.dict_learning_online были переработаны и теперь имеют критерий остановки, основанный на небольшом изменении словаря или целевой функции, контролируемом новым max_iter, tol и max_no_improvement параметров. Кроме того, некоторые из их параметров и атрибутов устарели.
- the n_iter параметр обоих устарел. Используйте max_iter вместо этого.
- the iter_offset, return_inner_stats, inner_stats и return_n_iter параметры decomposition.dict_learning_online служат внутренним целям и устарели.
- the inner_stats_, iter_offset_ и random_state_ атрибуты decomposition.MiniBatchDictionaryLearning служат внутренним целям и являются устаревшими.
- значение по умолчанию для batch_size параметр обоих изменится с 3 на 256 в версии 1.3.
#18975 by Жереми дю Буаберранже.
Улучшение decomposition.SparsePCA и decomposition.MiniBatchSparsePCA сохранить dtype для numpy.float32. #22111 by Takeshi Oura.
Улучшение decomposition.TruncatedSVD теперь позволяет n_components == n_features, если algorithm='randomized'. #22181 by Zach Deane-Mayer.
Улучшение Добавляет get_feature_names_out ко всем преобразователям в decomposition модуль: decomposition.DictionaryLearning, decomposition.FactorAnalysis, decomposition.FastICA, decomposition.IncrementalPCA, decomposition.KernelPCA, decomposition.LatentDirichletAllocation, decomposition.MiniBatchDictionaryLearning, decomposition.MiniBatchSparsePCA, decomposition.NMF, decomposition.PCA, decomposition.SparsePCA, и decomposition.TruncatedSVD. #21334 by Томас Фан.
Улучшение decomposition.TruncatedSVD предоставляет параметр n_oversamples и power_iteration_normalizer настроить utils.extmath.randomized_svd и получать точные результаты, когда количество признаков велико, ранг матрицы высок, или другие особенности матрицы затрудняют низкоранговую аппроксимацию. #21705 by Jay S. Stanley III.
Улучшение decomposition.PCA предоставляет параметр power_iteration_normalizer настроить utils.extmath.randomized_svd и получать более точные результаты, когда низкоранговое приближение затруднено. #21705 by Jay S. Stanley III.
Исправление decomposition.FastICA теперь проверяет входные параметры в fit вместо __init__. #21432 by Ханна Боле и Марен Вестерманн.
Исправление decomposition.FastICA теперь принимает np.float32 суммы предсказанных вероятностей, что рекомендуется для fit и fit_transform и основные обученные атрибуты используют тип данных той же точности, что и обучающие данные. #22806 by Джихан Беннис и Оливье Гризель.
Исправление decomposition.FactorAnalysis теперь проверяет входные параметры в fit вместо __init__. #21713 by Haya и Крум Арнаудов.
Исправление decomposition.KernelPCA теперь проверяет входные параметры в fit вместо __init__. #21567 by Мэгги Чеге.
Исправление decomposition.PCA и decomposition.IncrementalPCA более безопасно вычислять точность с использованием обратной матрицы ковариации, если self.noise_variance_ равно нулю. #22300 by Meekail Zain и #15948 by @sysuresh.
Исправление Значительно снижено пиковое использование памяти в decomposition.PCA при вызове fit или fit_transform. #22553 by Meekail Zain.
Изменение API decomposition.FastICA теперь поддерживает единичную дисперсию для отбеливания. Значение по умолчанию для его whiten аргумент изменится с True (который ведет себя как 'arbitrary-variance') в 'unit-variance' в версии 1.3. #19490 by Facundo Ferrin и Julien Jerphanion.

`sklearn.discriminant_analysis`#

Улучшение Добавляет get_feature_names_out to discriminant_analysis.LinearDiscriminantAnalysis. #22120 by Томас Фан.
Исправление discriminant_analysis.LinearDiscriminantAnalysis теперь использует правильный коэффициент масштабирования дисперсии, что может привести к другому поведению модели. #15984 by Okon Samuel и #22696 by Meekail Zain.

`sklearn.dummy`#

Исправление dummy.DummyRegressor больше не переопределяет constant параметр во время fit. #22486 by Томас Фан.

`sklearn.ensemble`#

Основная функция Добавлена дополнительная опция loss="quantile" to ensemble.HistGradientBoostingRegressor для моделирования квантилей. Уровень квантиля может быть указан с помощью нового параметра quantile. #21800 и #20567 by Christian Lorentzen.
Эффективность fit of ensemble.GradientBoostingClassifier и ensemble.GradientBoostingRegressor теперь вызывает utils.check_array с параметром force_all_finite=False для последующих запусков с теплым стартом, так как это уже было проверено ранее. #22159 by Geoffrey Paris.
Улучшение ensemble.HistGradientBoostingClassifier быстрее, для бинарных и особенно для многоклассовых задач благодаря новому модулю приватной функции потерь. #20811, #20567 и #21814 by Christian Lorentzen.
Улучшение Добавлена поддержка использования предварительно обученных моделей с cv="prefit" в ensemble.StackingClassifier и ensemble.StackingRegressor. #16748 by Siqi He и #22215 by Meekail Zain.
Улучшение ensemble.RandomForestClassifier и ensemble.ExtraTreesClassifier иметь новый criterion="log_loss", что эквивалентно criterion="entropy". #23047 by Christian Lorentzen.
Улучшение Добавляет get_feature_names_out to ensemble.VotingClassifier, ensemble.VotingRegressor, ensemble.StackingClassifier, и ensemble.StackingRegressor. #22695 и #22697 by Томас Фан.
Улучшение ensemble.RandomTreesEmbedding теперь имеет информативный get_feature_names_out функция, которая включает как индекс дерева, так и индекс листа в имена выходных признаков. #21762 by Zhehao Liu и Томас Фан.
Эффективность Обучение ensemble.RandomForestClassifier, ensemble.RandomForestRegressor, ensemble.ExtraTreesClassifier, ensemble.ExtraTreesRegressor, и ensemble.RandomTreesEmbedding теперь работает быстрее в многопроцессорной среде, особенно для последующих подгонок с warm_start включено. #22106 by Pieter Gijsbers.
Исправление Изменить параметр validation_fraction в ensemble.GradientBoostingClassifier и ensemble.GradientBoostingRegressor чтобы ошибка возникала, если в качестве аргумента передано что-либо, кроме числа с плавающей точкой. #21632 by Genesis Valencia.
Исправление Устранен потенциальный источник переподписки CPU в ensemble.HistGradientBoostingClassifier и ensemble.HistGradientBoostingRegressor когда использование ресурсов ЦП ограничено, например, с использованием квот cgroups в контейнере docker. #22566 by Жереми дю Буаберранже.
Исправление ensemble.HistGradientBoostingClassifier и ensemble.HistGradientBoostingRegressor больше не предупреждает при обучении на pandas DataFrame с нестандартным scoring параметр и early_stopping включен. #22908 by Томас Фан.
Исправление Исправляет HTML repr для ensemble.StackingClassifier и ensemble.StackingRegressor. #23097 by Томас Фан.
Изменение API Атрибут loss_ of ensemble.GradientBoostingClassifier и ensemble.GradientBoostingRegressor был устаревшим и будет удален в версии 1.3. #23079 by Christian Lorentzen.
Изменение API Изменено значение по умолчанию для max_features до 1.0 для ensemble.RandomForestRegressor и для "sqrt" для ensemble.RandomForestClassifier. Обратите внимание, что они дают те же результаты подгонки, что и раньше, но их гораздо легче понять. Старое значение по умолчанию "auto" был устаревшим и будет удален в версии 1.3. Те же изменения также применяются для ensemble.ExtraTreesRegressor и ensemble.ExtraTreesClassifier. #20803 by Brian Sun.
Эффективность Улучшена производительность времени выполнения ensemble.IsolationForest пропуская повторяющиеся проверки входных данных. #23149 by Zhehao Liu.

`sklearn.feature_extraction`#

Функция feature_extraction.FeatureHasher теперь поддерживает PyPy. #23023 by Томас Фан.
Исправление feature_extraction.FeatureHasher теперь проверяет входные параметры в transform вместо __init__. #21573 by Ханна Боле и Марен Вестерманн.
Исправление feature_extraction.text.TfidfVectorizer теперь не создаёт feature_extraction.text.TfidfTransformer в __init__ как требуется нашим API. #21832 by Guillaume Lemaitre.

`sklearn.feature_selection`#

Функция Добавлен автоматический режим в feature_selection.SequentialFeatureSelector. Если аргумент n_features_to_select является 'auto', выбирайте признаки, пока улучшение оценки не превысит аргумент tol. Значение по умолчанию для n_features_to_select изменено с None to 'warn' в 1.1 и станет 'auto' в 1.3. None и 'warn' будет удалено в версии 1.3. #20145 by murata-yu.
Функция Добавлена возможность передавать вызываемые объекты в max_features оценок. feature_selection.SelectFromModel. Также введен новый атрибут max_features_ который выводится из max_features и данные во время fit. Если max_features является целым числом, тогда max_features_ = max_features. Если max_features является вызываемым объектом, то max_features_ = max_features(X). #22356 by Meekail Zain.
Улучшение feature_selection.GenericUnivariateSelect сохраняет тип float32. #18482 by Тьерри Гамейро и Даниэль Харса и #22370 by Meekail Zain.
Улучшение Добавить параметр force_finite to feature_selection.f_regression и feature_selection.r_regression. Этот параметр позволяет принудительно сделать выход конечным в случае, когда признак или целевая переменная постоянны или когда признак и целевая переменная идеально коррелированы (только для F-статистики). #17819 by Juan Carlos Alfaro Jiménez.
Эффективность Улучшена производительность времени выполнения feature_selection.chi2 с булевыми массивами. #22235 by Томас Фан.
Эффективность Сниженное использование памяти feature_selection.chi2. #21837 by Louis Wagner.

`sklearn.gaussian_process`#

Исправление predict и sample_y методы gaussian_process.GaussianProcessRegressor теперь возвращают массивы правильной формы в случаях с одной целью и несколькими целями, и для обоих normalize_y=False и normalize_y=True. #22199 by Guillaume Lemaitre, Айдар Шакеримов и Тенави Накамура-Циммер.
Исправление gaussian_process.GaussianProcessClassifier вызывает более информативную ошибку, если CompoundKernel передается через kernel. #22223 by MarcoM.

`sklearn.impute`#

Улучшение impute.SimpleImputer теперь предупреждает с именами признаков, когда признаки пропускаются из-за отсутствия наблюдаемых значений в обучающем наборе. #21617 by Christian Ritter.
Улучшение Добавлена поддержка для pd.NA в impute.SimpleImputer. #21114 by Ying Xiong.
Улучшение Добавляет get_feature_names_out to impute.SimpleImputer, impute.KNNImputer, impute.IterativeImputer, и impute.MissingIndicator. #21078 by Томас Фан.
Изменение API The verbose параметр был устаревшим для impute.SimpleImputer. При удалении пустых столбцов всегда будет выдаваться предупреждение. #21448 by Oleh Kozynets и Christian Ritter.

`sklearn.inspection`#

Функция Добавьте отображение для построения границы решений классификатора с помощью метода inspection.DecisionBoundaryDisplay.from_estimator. #16061 by Томас Фан.
Улучшение В inspection.PartialDependenceDisplay.from_estimator, разрешить kind для принятия списка строк, указывающих, какой тип графика рисовать для каждого взаимодействия признаков. #19438 by Guillaume Lemaitre.
Улучшение inspection.PartialDependenceDisplay.from_estimator, inspection.PartialDependenceDisplay.plot, и inspection.plot_partial_dependence теперь поддерживают построение центрированных кривых индивидуального условного ожидания (cICE) и центрированных кривых частных зависимостей (PDP), управляемых установкой параметра centered. #18310 by Johannes Elfner и Guillaume Lemaitre.

`sklearn.isotonic`#

Улучшение Добавляет get_feature_names_out to isotonic.IsotonicRegression. #22249 by Томас Фан.

`sklearn.kernel_approximation`#

Улучшение Добавляет get_feature_names_out to kernel_approximation.AdditiveChi2Sampler. kernel_approximation.Nystroem, kernel_approximation.PolynomialCountSketch, kernel_approximation.RBFSampler, и kernel_approximation.SkewedChi2Sampler. #22137 и #22694 by Томас Фан.

`sklearn.linear_model`#

Функция linear_model.ElasticNet, linear_model.ElasticNetCV, linear_model.Lasso и linear_model.LassoCV поддержка sample_weight для разреженного ввода X. #22808 by Christian Lorentzen.
Функция linear_model.Ridge с solver="lsqr" теперь поддерживает обучение на разреженных входных данных с fit_intercept=True. #22950 by Christian Lorentzen.
Улучшение linear_model.QuantileRegressor поддерживает разреженный ввод для решателей на основе highs. #21086 by Venkatachalam Natchiappan. Кроме того, эти решатели теперь используют CSC-матрицу с самого начала, что ускоряет обучение. #22206 by Christian Lorentzen.
Улучшение linear_model.LogisticRegression быстрее для solvers="lbfgs" и solver="newton-cg", для бинарных и в частности для многоклассовых задач благодаря новому приватному модулю функции потерь. В многоклассовом случае потребление памяти также было уменьшено для этих решателей, так как целевая переменная теперь кодируется метками (преобразуется в целые числа) вместо бинаризации меток (one-hot кодирования). Чем больше классов, тем больше преимущество. #21808, #20567 и #21814 by Christian Lorentzen.
Улучшение linear_model.GammaRegressor, linear_model.PoissonRegressor и linear_model.TweedieRegressor быстрее для solvers="lbfgs". #22548, #21808 и #20567 by Christian Lorentzen.
Улучшение Переименовать параметр base_estimator to estimator в linear_model.RANSACRegressor для улучшения читаемости и согласованности. base_estimator устарел и будет удалён в версии 1.3. #22062 by Adrian Trujillo.
Улучшение linear_model.ElasticNet и другие классы линейных моделей, использующие координатный спуск, показывают сообщения об ошибках, когда создаются неконечные веса параметров. #22148 by Christian Ritter и Норберт Прейнинг.
Улучшение linear_model.ElasticNet и linear_model.Lasso теперь выдают согласованные сообщения об ошибках при передаче недопустимых значений для l1_ratio, alpha, max_iter и tol. #22240 by Arturo Amor.
Улучшение linear_model.BayesianRidge и linear_model.ARDRegression теперь сохраняют тип данных float32. #9087 by Arthur Imbert и #22525 by Meekail Zain.
Улучшение linear_model.RidgeClassifier теперь поддерживает многоклассовую классификацию. #19689 by Guillaume Lemaitre.
Улучшение linear_model.RidgeCV и linear_model.RidgeClassifierCV теперь выдают согласованное сообщение об ошибке при передаче недопустимых значений для alphas. #21606 by Arturo Amor.
Улучшение linear_model.Ridge и linear_model.RidgeClassifier теперь выдают согласованное сообщение об ошибке при передаче недопустимых значений для alpha, max_iter и tol. #21341 by Arturo Amor.
Улучшение linear_model.orthogonal_mp_gram сохраняет dtype для numpy.float32. #22002 by Takeshi Oura.
Исправление linear_model.LassoLarsIC теперь правильно вычисляет AIC и BIC. Теперь выдается ошибка, когда n_features > n_samples и когда дисперсия шума не предоставлена. #21481 by Guillaume Lemaitre и Андрес Бабино.
Исправление linear_model.TheilSenRegressor теперь проверяет входной параметр max_subpopulation в fit вместо __init__. #21767 by Марен Вестерманн.
Исправление linear_model.ElasticNetCV теперь выдает корректное предупреждение, когда l1_ratio=0. #21724 by Yar Khine Phyo.
Исправление linear_model.LogisticRegression и linear_model.LogisticRegressionCV теперь устанавливает n_iter_ атрибут с формой, соответствующей строке документации и согласованной с формой, полученной при использовании других решателей в настройке "один против всех". Ранее он записывал только максимальное количество итераций для каждой бинарной подзадачи, тогда как теперь записываются все из них. #21998 by Оливье Гризель.
Исправление Свойство family of linear_model.TweedieRegressor не проверяется в __init__ больше не используется. Вместо этого это (приватное) свойство устарело в linear_model.GammaRegressor, linear_model.PoissonRegressor и linear_model.TweedieRegressor, и будет удалён в 1.3. #22548 by Christian Lorentzen.
Исправление The coef_ и intercept_ атрибуты linear_model.LinearRegression теперь корректно вычисляются при наличии весов выборок, когда входные данные разрежены. #22891 by Жереми дю Буаберранже.
Исправление The coef_ и intercept_ атрибуты linear_model.Ridge с solver="sparse_cg" и solver="lbfgs" теперь корректно вычисляются при наличии весов образцов, когда входные данные разреженные. #22899 by Жереми дю Буаберранже.
Исправление linear_model.SGDRegressor и linear_model.SGDClassifier теперь правильно вычислять ошибку валидации при включенном раннем останове. #23256 by Zhehao Liu.
Изменение API linear_model.LassoLarsIC теперь предоставляет noise_variance как параметр, чтобы предоставить оценку дисперсии шума. Это особенно актуально, когда n_features > n_samples и оценщик дисперсии шума не может быть вычислен. #21481 by Guillaume Lemaitre.

`sklearn.manifold`#

Функция manifold.Isomap теперь поддерживает соседей на основе радиуса через radius аргумент. #19794 by Zhehao Liu.
Улучшение manifold.spectral_embedding и manifold.SpectralEmbedding поддержка np.float32 dtype и сохранит этот dtype. #21534 by Andrew Knyazev.
Улучшение Добавляет get_feature_names_out to manifold.Isomap и manifold.LocallyLinearEmbedding. #22254 by Томас Фан.
Улучшение добавлен metric_params to manifold.TSNE конструктор для дополнительных параметров метрики расстояния, используемой в оптимизации. #21805 by Jeanne Dionisi и #22685 by Meekail Zain.
Улучшение manifold.trustworthiness вызывает ошибку, если n_neighbours >= n_samples / 2 чтобы обеспечить правильную поддержку функции. #18832 by Hong Shao Yang и #23033 by Meekail Zain.
Исправление manifold.spectral_embedding теперь использует гауссовское вместо предыдущего равномерного на [0, 1] случайного начального приближения к собственным векторам в eigen_solvers lobpcg и amg для улучшения их численной устойчивости. #21565 by Andrew Knyazev.

`sklearn.metrics`#

Функция metrics.r2_score и metrics.explained_variance_score иметь новый force_finite параметр. Установка этого параметра в False вернет фактический неконечный балл в случае идеальных предсказаний или постоянных y_true, вместо конечной аппроксимации (1.0 и 0.0 соответственно) в настоящее время возвращаются по умолчанию. #17266 by Sylvain Marié.
Функция metrics.d2_pinball_score и metrics.d2_absolute_error_score вычислить \(D^2\) оценка регрессии для потерь пинбола и абсолютной ошибки соответственно. metrics.d2_absolute_error_score является частным случаем metrics.d2_pinball_score с фиксированным параметром квантиля alpha=0.5 для удобства использования и обнаружения. \(D^2\) оценки являются обобщениями r2_score и может интерпретироваться как доля объяснённого отклонения. #22118 by Ohad Michel.
Улучшение metrics.top_k_accuracy_score вызывает улучшенное сообщение об ошибке когда y_true является бинарным и y_score является двумерным. #22284 by Томас Фан.
Улучшение metrics.roc_auc_score теперь поддерживает average=None в многоклассовом случае, когда multiclass='ovr' , который вернёт оценку для каждого класса. #19158 by Nicki Skafte.
Улучшение Добавляет im_kw параметр для metrics.ConfusionMatrixDisplay.from_estimator metrics.ConfusionMatrixDisplay.from_predictions, и metrics.ConfusionMatrixDisplay.plot. im_kw параметр передается в matplotlib.pyplot.imshow вызов при построении матрицы ошибок. #20753 by Томас Фан.
Исправление metrics.silhouette_score теперь поддерживает целочисленный ввод для предварительно вычисленных расстояний. #22108 by Томас Фан.
Исправление Исправлена ошибка в metrics.normalized_mutual_info_score который может возвращать неограниченные значения. #22635 by Жереми дю Буаберранже.
Исправление Исправления metrics.precision_recall_curve и metrics.average_precision_score когда все истинные метки отрицательные. #19085 by Varun Agrawal.
Изменение API metrics.SCORERS устарел и будет удален в версии 1.3. Пожалуйста, используйте metrics.get_scorer_names для получения имён всех доступных оценщиков. #22866 by Адрин Джалали.
Изменение API Параметры sample_weight и multioutput of metrics.mean_absolute_percentage_error теперь являются только ключевыми словами, в соответствии с SLEP009. Был введен цикл устаревания. #21576 by Paul-Emile Dugnat.
Изменение API The "wminkowski" метрика metrics.DistanceMetric устарел и будет удален в версии 1.3. Вместо этого существующий "minkowski" метрика теперь принимает необязательный w параметр для весов. Это устаревание направлено на сохранение согласованности с соглашением SciPy 1.8. #21873 by Yar Khine Phyo.
Изменение API metrics.DistanceMetric аргумента для использования коэффициента корреляции Мэттьюса (MCC). sklearn.neighbors to sklearn.metrics. Используя neighbors.DistanceMetric для импортов всё ещё действителен для обратной совместимости, но этот псевдоним будет удалён в версии 1.3. #21177 by Julien Jerphanion.

`sklearn.mixture`#

Улучшение mixture.GaussianMixture и mixture.BayesianGaussianMixture теперь можно инициализировать с помощью k-means++ и случайных точек данных. #20408 by Gordon Walsh, Alberto Ceballos и Андрес Риос.
Исправление Исправлена ошибка, которая правильно инициализирует precisions_cholesky_ в mixture.GaussianMixture при указании precisions_init взяв его квадратный корень. #22058 by Guillaume Lemaitre.
Исправление mixture.GaussianMixture теперь нормализует weights_ более безопасно, предотвращая ошибки округления при вызове mixture.GaussianMixture.sample с n_components=1. #23034 by Meekail Zain.

`sklearn.model_selection`#

Улучшение теперь можно передавать scoring="matthews_corrcoef" ко всем инструментам выбора модели с scoring . Из-за его реализации в #22203 by Оливье Гризель.
Улучшение вызвать ошибку при перекрестной проверке, когда подгонки для всех разделов не удались. Аналогично вызвать ошибку при поиске по сетке, когда подгонки для всех моделей и всех разделов не удались. #21026 by Loïc Estève.
Исправление model_selection.GridSearchCV, model_selection.HalvingGridSearchCV теперь проверяет входные параметры в fit вместо __init__. #21880 by Mrinal Tyagi.
Исправление model_selection.learning_curve теперь поддерживает partial_fit с регрессорами. #22982 by Томас Фан.

`sklearn.multiclass`#

Улучшение multiclass.OneVsRestClassifier теперь поддерживает verbose параметр, чтобы можно было видеть прогресс обучения. #22508 by Chris Combs.
Исправление multiclass.OneVsOneClassifier.predict возвращает правильные предсказания, когда внутренний классификатор имеет только predict_proba. #22604 by Томас Фан.

`sklearn.neighbors`#

Улучшение Добавляет get_feature_names_out to neighbors.RadiusNeighborsTransformer, neighbors.KNeighborsTransformer и neighbors.NeighborhoodComponentsAnalysis. #22212 by Meekail Zain.
Исправление neighbors.KernelDensity теперь проверяет входные параметры в fit вместо __init__. #21430 by Десислава Василева и Lucy Jimenez.
Исправление neighbors.KNeighborsRegressor.predict теперь работает корректно при передаче массиво-подобного ввода, если KNeighborsRegressor сначала создается с вызываемым объектом, переданным в weights параметр. #22687 by Meekail Zain.

`sklearn.neural_network`#

Улучшение neural_network.MLPClassifier и neural_network.MLPRegressor показывать сообщения об ошибках, когда оптимизаторы выдают неконечные веса параметров. #22150 by Christian Ritter и Норберт Прейнинг.
Улучшение Добавляет get_feature_names_out to neural_network.BernoulliRBM. #22248 by Томас Фан.

`sklearn.pipeline`#

Улучшение Добавлена поддержка "passthrough" в pipeline.FeatureUnion. Установка трансформера в "passthrough" оставит признаки неизменными. #20860 by Shubhraneel Pal.
Исправление pipeline.Pipeline теперь не проверяет гиперпараметры в __init__ но в .fit(). #21888 by iofall и Ариса Я..
Исправление pipeline.FeatureUnion не проверяет гиперпараметры в __init__. Проверка теперь обрабатывается в .fit() и .fit_transform(). #21954 by iofall и Ариса Я..
Исправление Определяет __sklearn_is_fitted__ в pipeline.FeatureUnion для возврата корректного результата с utils.validation.check_is_fitted. #22953 by randomgeek78.

`sklearn.preprocessing`#

Функция preprocessing.OneHotEncoder теперь поддерживает группировку редких категорий в один признак. Группировка редких категорий включается указанием способа выбора редких категорий с помощью min_frequency или max_categories. #16018 by Томас Фан.
Улучшение Добавляет subsample параметр для preprocessing.KBinsDiscretizer. Это позволяет указать максимальное количество выборок для использования при обучении модели. Опция доступна только когда strategy установлено в quantile. #21445 by Фелипе Биду и Аманда Д'Суза.
Улучшение Добавляет encoded_missing_value to preprocessing.OrdinalEncoder для настройки закодированного значения пропущенных данных. #21988 by Томас Фан.
Улучшение Добавлен get_feature_names_out метод и новый параметр feature_names_out to preprocessing.FunctionTransformer. Вы можете установить feature_names_out в 'one-to-one', чтобы использовать имена входных признаков как имена выходных признаков, или вы можете установить его в вызываемый объект, который возвращает имена выходных признаков. Это особенно полезно, когда трансформер изменяет количество признаков. Если feature_names_out равно None (что является значением по умолчанию), тогда get_output_feature_names не определён. #21569 by Орельен Жерон.
Улучшение Добавляет get_feature_names_out to preprocessing.Normalizer, preprocessing.KernelCenterer, preprocessing.OrdinalEncoder, и preprocessing.Binarizer. #21079 by Томас Фан.
Исправление preprocessing.PowerTransformer с method='yeo-johnson' лучше поддерживает значительно негауссовские данные при поиске оптимального лямбда. #20653 by Томас Фан.
Исправление preprocessing.LabelBinarizer теперь проверяет входные параметры в fit вместо __init__. #21434 by Крум Арнаудов.
Исправление preprocessing.FunctionTransformer с check_inverse=True теперь предоставляет информативное сообщение об ошибке, когда входные данные имеют смешанные типы. #19916 by Zhehao Liu.
Исправление preprocessing.KBinsDiscretizer теперь более последовательно обрабатывает границы бинов. #14975 by Андреас Мюллер и #22526 by Meekail Zain.
Исправление Добавляет preprocessing.KBinsDiscretizer.get_feature_names_out поддержка, когда encode="ordinal". #22735 by Томас Фан.

`sklearn.random_projection`#

Улучшение Добавляет inverse_transform метод и compute_inverse_transform параметр для random_projection.GaussianRandomProjection и random_projection.SparseRandomProjection. Когда параметр установлен в True, псевдообратная компонентов вычисляется во время fit и сохраняется как inverse_components_. #21701 by Орельен Жерон.
Улучшение random_projection.SparseRandomProjection и random_projection.GaussianRandomProjection сохранить dtype для numpy.float32. #22114 by Takeshi Oura.
Улучшение Добавляет get_feature_names_out ко всем преобразователям в sklearn.random_projection модуль: random_projection.GaussianRandomProjection и random_projection.SparseRandomProjection. #21330 by Loïc Estève.

`sklearn.svm`#

Улучшение svm.OneClassSVM, svm.NuSVC, svm.NuSVR, svm.SVC и svm.SVR теперь предоставляют n_iter_, количество итераций процедуры оптимизации libsvm. #21408 by Хуан Мартин Лойола.
Улучшение svm.SVR, svm.SVC, svm.NuSVR, svm.OneClassSVM, svm.NuSVC теперь вызывает ошибку, когда оценка двойного разрыва дает неконечные веса параметров. #22149 by Christian Ritter и Норберт Прейнинг.
Исправление svm.NuSVC, svm.NuSVR, svm.SVC, svm.SVR, svm.OneClassSVM теперь проверяет входные параметры в fit вместо __init__. #21436 by Haidar Almubarak.

`sklearn.tree`#

Улучшение tree.DecisionTreeClassifier и tree.ExtraTreeClassifier иметь новый criterion="log_loss", что эквивалентно criterion="entropy". #23047 by Christian Lorentzen.
Исправление Исправление ошибки в критерии разделения Пуассона для tree.DecisionTreeRegressor. #22191 by Christian Lorentzen.
Изменение API Изменено значение по умолчанию для max_features до 1.0 для tree.ExtraTreeRegressor и для "sqrt" для tree.ExtraTreeClassifier, который не изменит результат обучения. Исходное значение по умолчанию "auto" был устаревшим и будет удален в версии 1.3. Установка max_features to "auto" также устарел для tree.DecisionTreeClassifier и tree.DecisionTreeRegressor. #22476 by Zhehao Liu.

`sklearn.utils`#

Улучшение utils.check_array и utils.multiclass.type_of_target теперь принимает input_name параметр, чтобы сделать сообщение об ошибке более информативным при передаче недопустимых входных данных (например, с NaN или бесконечными значениями). #21219 by Оливье Гризель.
Улучшение utils.check_array возвращает ndarray с плавающей точкой с np.nan когда передан Float32 или Float64 массив расширения pandas с pd.NA. #21278 by Томас Фан.
Улучшение utils.estimator_html_repr показывает более полезное сообщение об ошибке при запуске в jupyter notebook, который не является доверенным. #21316 by Томас Фан.
Улучшение utils.estimator_html_repr отображает стрелку в верхнем левом углу HTML-представления, чтобы показать, как элементы являются кликабельными. #21298 by Томас Фан.
Улучшение utils.check_array с dtype=None возвращает числовые массивы при передаче pandas DataFrame со смешанными типами данных. dtype="numeric" также лучше определит тип данных, когда DataFrame имеет смешанные типы данных. #22237 by Томас Фан.
Улучшение utils.check_scalar теперь имеет улучшенные сообщения при отображении типа. #22218 by Томас Фан.
Исправление Изменяет сообщение об ошибке ValidationError вызвано utils.check_X_y когда y равен None, чтобы он был совместим с check_requires_y_none проверка оценщика. #22578 by Claudio Salvatore Arcidiacono.
Исправление utils.class_weight.compute_class_weight теперь требует только, чтобы все классы в y иметь вес в class_weight. Ошибка все еще возникает, когда класс присутствует в y но не в class_weight. #22595 by Томас Фан.
Исправление utils.estimator_html_repr имеет улучшенную визуализацию для вложенных мета-оценщиков. #21310 by Томас Фан.
Исправление utils.check_scalar вызывает ошибку, когда include_boundaries={"left", "right"} и границы не установлены. #22027 by Marie Lanternier.
Исправление utils.metaestimators.available_if корректно возвращает ограниченный метод, который можно сериализовать. #23077 by Томас Фан.
Изменение API utils.estimator_checks.check_estimatorаргумент теперь называется estimator (предыдущее название было Estimator). #22188 by Матюрен Массиас.
Изменение API utils.metaestimators.if_delegate_has_method устарел и будет удалён в версии 1.3. Используйте utils.metaestimators.available_if вместо этого. #22830 by Жереми дю Буаберранже.

Участники кода и документации

Благодарим всех, кто внес вклад в поддержку и улучшение проекта с версии 1.0, включая:

2357juan, Abhishek Gupta, adamgonzo, Adam Li, adijohar, Aditya Kumawat, Aditya Raghuwanshi, Aditya Singh, Adrian Trujillo Duron, Adrin Jalali, ahmadjubair33, AJ Druck, aj-white, Alan Peixinho, Alberto Mario Ceballos-Arroyo, Alek Lefebvre, Alex, Alexandr, Alexandre Gramfort, alexanmv, almeidayoel, Amanda Dsouza, Aman Sharma, Amar pratap singh, Amit, amrcode, András Simon, Andreas Grivas, Andreas Mueller, Andrew Knyazev, Andriy, Angus L’Herrou, Ankit Sharma, Anne Ducout, Arisa, Arth, arthurmello, Arturo Amor, ArturoAmor, Atharva Patil, aufarkari, Aurélien Geron, avm19, Ayan Bag, baam, Bardiya Ak, Behrouz B, Ben3940, Benjamin Bossan, Bharat Raghunathan, Bijil Subhash, bmreiniger, Brandon Truth, Brenden Kadota, Brian Sun, cdrig, Chalmer Lowe, Chiara Marmo, Chitteti Srinath Reddy, Chloe-Agathe Azencott, Christian Lorentzen, Christian Ritter, christopherlim98, Christoph T. Weidemann, Christos Aridas, Claudio Salvatore Arcidiacono, combscCode, Daniela Fernandes, darioka, Darren Nguyen, Dave Eargle, David Gilbertson, David Poznik, Dea María Léon, Dennis Osei, DessyVV, Dev514, Dimitri Papadopoulos Orfanos, Diwakar Gupta, Dr. Felix M. Riese, drskd, Emiko Sano, Emmanouil Gionanidis, EricEllwanger, Erich Schubert, Eric Larson, Eric Ndirangu, ErmolaevPA, Estefania Barreto-Ojeda, eyast, Fatima GASMI, Federico Luna, Felix Glushchenkov, fkaren27, Fortune Uwha, FPGAwesome, francoisgoupil, Frans Larsson, ftorres16, Gabor Berei, Gabor Kertesz, Gabriel Stefanini Vicente, Gabriel S Vicente, Gael Varoquaux, GAURAV CHOUDHARY, Gauthier I, genvalen, Geoffrey-Paris, Giancarlo Pablo, glennfrutiz, gpapadok, Guillaume Lemaitre, Guillermo Tomás Fernández Martín, Gustavo Oliveira, Haidar Almubarak, Hannah Bohle, Hansin Ahuja, Haoyin Xu, Haya, Helder Geovane Gomes de Lima, henrymooresc, Hideaki Imamura, Himanshu Kumar, Hind-M, hmasdev, hvassard, i-aki-y, iasoon, Inclusive Coding Bot, Ingela, iofall, Ishan Kumar, Jack Liu, Jake Cowton, jalexand3r, J Alexander, Jauhar, Jaya Surya Kommireddy, Jay Stanley, Jeff Hale, je-kr, JElfner, Jenny Vo, Jérémie du Boisberranger, Jihane, Jirka Borovec, Joel Nothman, Jon Haitz Legarreta Gorroño, Jordan Silke, Jorge Ciprián, Jorge Loayza, Joseph Chazalon, Joseph Schwartz-Messing, Jovan Stojanovic, JSchuerz, Juan Carlos Alfaro Jiménez, Juan Martin Loyola, Julien Jerphanion, katotten, Kaushik Roy Chowdhury, Ken4git, Kenneth Prabakaran, kernc, Kevin Doucet, KimAYoung, Koushik Joshi, Kranthi Sedamaki, krishna kumar, krumetoft, lesnee, Lisa Casino, Logan Thomas, Loic Esteve, Louis Wagner, LucieClair, Lucy Liu, Luiz Eduardo Amaral, Magali, MaggieChege, Mai, mandjevant, Mandy Gu, Manimaran, MarcoM, Marco Wurps, Maren Westermann, Maria Boerner, MarieS-WiMLDS, Martel Corentin, martin-kokos, mathurinm, Matías, matjansen, Matteo Francia, Maxwell, Meekail Zain, Megabyte, Mehrdad Moradizadeh, melemo2, Michael I Chen, michalkrawczyk, Micky774, milana2, millawell, Ming-Yang Ho, Mitzi, miwojc, Mizuki, mlant, Mohamed Haseeb, Mohit Sharma, Moonkyung94, mpoemsl, MrinalTyagi, Mr. Leu, msabatier, murata-yu, N, Nadirhan Şahin, Naipawat Poolsawat, NartayXD, nastegiano, nathansquan, nat-salt, Nicki Skafte Detlefsen, Nicolas Hug, Niket Jain, Nikhil Suresh, Nikita Titov, Nikolay Kondratyev, Ohad Michel, Oleksandr Husak, Olivier Grisel, partev, Patrick Ferreira, Paul, pelennor, PierreAttard, Piet Brömmel, Pieter Gijsbers, Pinky, poloso, Pramod Anantharam, puhuk, Purna Chandra Mansingh, QuadV, Rahil Parikh, Randall Boyes, randomgeek78, Raz Hoshia, Reshama Shaikh, Ricardo Ferreira, Richard Taylor, Rileran, Rishabh, Robin Thibaut, Rocco Meli, Roman Feldbauer, Roman Yurchak, Ross Barnowski, rsnegrin, Sachin Yadav, sakinaOuisrani, Sam Adam Day, Sanjay Marreddi, Sebastian Pujalte, SEELE, SELEE, Seyedsaman (Sam) Emami, ShanDeng123, Shao Yang Hong, sharmadharmpal, shaymerNaturalint, Shuangchi He, Shubhraneel Pal, siavrez, slishak, Smile, spikebh, sply88, Srinath Kailasa, Stéphane Collot, Sultan Orazbayev, Sumit Saha, Sven Eschlbeck, Sven Stehle, Swapnil Jha, Sylvain Marié, Takeshi Oura, Tamires Santana, Tenavi, teunpe, Theis Ferré Hjortkjær, Thiruvenkadam, Thomas J. Fan, t-jakubek, toastedyeast, Tom Dupré la Tour, Tom McTiernan, TONY GEORGE, Tyler Martin, Tyler Reddy, Udit Gupta, Ugo Marchand, Varun Agrawal, Venkatachalam N, Vera Komeyer, victoirelouis, Vikas Vishwakarma, Vikrant khedkar, Vladimir Chernyy, Vladimir Kim, WeijiaDu, Xiao Yuan, Yar Khine Phyo, Ying Xiong, yiyangq, Yosshi999, Yuki Koyama, Zach Deane-Mayer, Zeel B Patel, zempleni, zhenfisher, 赵丰 (Zhao Feng)

Версия 1.1#

Версия 1.1.3#

Версия 1.1.2#

Измененные модели#

Журнал изменений#

Версия 1.1.1#

Журнал изменений#

Версия 1.1.0#

Минимальные зависимости#

Измененные модели#

Журнал изменений#

Эта страница