Версия 0.13#

Версия 0.13.1#

23 февраля 2013

Выпуск 0.13.1 исправляет только некоторые ошибки и не добавляет новой функциональности.

Журнал изменений#

Люди#

Список участников выпуска 0.13.1 по количеству коммитов.

Версия 0.13#

21 января 2013

Новые классы оценщиков#

Журнал изменений#

Сводка изменений API#

  • Переименованы все вхождения n_atoms to n_components для согласованности. Это применяется к decomposition.DictionaryLearning, decomposition.MiniBatchDictionaryLearning, decomposition.dict_learning, decomposition.dict_learning_online.

  • Переименованы все вхождения max_iters to max_iter для согласованности. Это применяется к semi_supervised.LabelPropagation и semi_supervised.label_propagation.LabelSpreading.

  • Переименованы все вхождения learn_rate to learning_rate для единообразия в ensemble.BaseGradientBoosting и ensemble.GradientBoostingRegressor.

  • Модуль sklearn.linear_model.sparse удалён. Поддержка разреженных матриц уже интегрирована в «обычные» линейные модели.

  • sklearn.metrics.mean_square_error, который некорректно возвращал накопленную ошибку, был удалён. Используйте metrics.mean_squared_error вместо этого.

  • Передача class_weight параметры для fit методы больше не поддерживаются. Передавайте их в конструкторы оценщиков вместо этого.

  • GMM больше не имеют decode и rvs методы. Используйте score, predict или sample методы вместо этого.

  • The solver опция fit в регрессии и классификации Ridge теперь устарела и будет удалена в v0.14. Используйте вместо этого опцию конструктора.

  • feature_extraction.text.DictVectorizer теперь возвращает разреженные матрицы в формате CSR вместо COO.

  • Переименовано k в cross_validation.KFold и cross_validation.StratifiedKFold to n_folds, переименован n_bootstraps to n_iter в cross_validation.Bootstrap.

  • Переименованы все вхождения n_iterations to n_iter для согласованности. Это применяется к cross_validation.ShuffleSplit, cross_validation.StratifiedShuffleSplit, utils.extmath.randomized_range_finder и utils.extmath.randomized_svd.

  • Заменен rho в linear_model.ElasticNet и linear_model.SGDClassifier by l1_ratio. rho параметр имел разные значения; l1_ratio был введён, чтобы избежать путаницы. Он имеет то же значение, что и ранее rho в linear_model.ElasticNet и (1-rho) в linear_model.SGDClassifier.

  • linear_model.LassoLars и linear_model.Lars теперь хранит список путей в случае нескольких целей, а не массив путей.

  • Атрибут gmm of hmm.GMMHMM был переименован в gmm_ для более строгого соответствия API.

  • cluster.spectral_embedding был перемещен в manifold.spectral_embedding.

  • Переименовано eig_tol в manifold.spectral_embedding, cluster.SpectralClustering to eigen_tol, переименован mode to eigen_solver.

  • Переименовано mode в manifold.spectral_embedding и cluster.SpectralClustering to eigen_solver.

  • classes_ и n_classes_ атрибуты tree.DecisionTreeClassifier и все производные ансамблевые модели теперь плоские в случае задач с одним выходом и вложенные в случае задач с несколькими выходами.

  • The estimators_ атрибут ensemble.GradientBoostingRegressor и ensemble.GradientBoostingClassifier теперь является массивом tree.DecisionTreeRegressor.

  • Переименовано chunk_size to batch_size в decomposition.MiniBatchDictionaryLearning и decomposition.MiniBatchSparsePCA для согласованности.

  • svm.SVC и svm.NuSVC теперь предоставляют classes_ атрибут и поддерживать произвольные типы данных для меток y. Кроме того, тип данных, возвращаемый predict теперь отражает dtype y во время fit (ранее было np.float).

  • Изменен test_size по умолчанию в cross_validation.train_test_split в None, добавлена возможность выводить test_size из train_size в cross_validation.ShuffleSplit и cross_validation.StratifiedShuffleSplit.

  • Переименованная функция sklearn.metrics.zero_one to sklearn.metrics.zero_one_loss. Учтите, что поведение по умолчанию в sklearn.metrics.zero_one_loss является многоклассовым набором данных кардиотокограмм плода, где классы представляют собой паттерны частоты сердечных сокращений плода (FHR), закодированные метками от 1 до 10. Здесь мы устанавливаем класс 3 (класс меньшинства) для представления выбросов. Он содержит 30 числовых признаков, некоторые из которых закодированы бинарно, а некоторые являются непрерывными. sklearn.metrics.zero_one: normalize=False изменено на normalize=True.

  • Переименованная функция metrics.zero_one_score to metrics.accuracy_score.

  • datasets.make_circles теперь имеет одинаковое количество внутренних и внешних точек.

  • В наивных байесовских классификаторах, class_prior параметр был перемещен из fit to __init__.

Люди#

Список контрибьюторов для релиза 0.13 по количеству коммитов.