Версия 0.13#

Версия 0.13.1#

23 февраля 2013

Выпуск 0.13.1 исправляет только некоторые ошибки и не добавляет новой функциональности.

Журнал изменений#

Исправлена ошибка тестирования, вызванная функцией cross_validation.train_test_split интерпретируется как тест Yaroslav Halchenko.
Исправлена ошибка в перераспределении маленьких кластеров в cluster.MiniBatchKMeans by Гаэль Варокво.
Исправлено значение по умолчанию для gamma в decomposition.KernelPCA by Lars Buitinck.
Обновлен joblib до 0.7.0d by Гаэль Варокво.
Исправленное масштабирование девиантности в ensemble.GradientBoostingClassifier by Peter Prettenhofer.
Улучшенное разрешение ничьих в multiclass.OneVsOneClassifier by Андреас Мюллер.
Другие небольшие улучшения тестов и документации.

Люди#

Список участников выпуска 0.13.1 по количеству коммитов.

16 Lars Buitinck
12 Андреас Мюллер
8 Гаэль Варокво
5 Роберт Марчман
3 Peter Prettenhofer
2 Hrishikesh Huilgolkar
1 Бастиан ван ден Берг
1 Диего Молья
1 Gilles Louppe
1 Мати́ Блондель
1 Нель Варокво
1 Rafael Cunha de Almeida
1 Rolando Espinoza La fuente
1 Vlad Niculae
1 Yaroslav Halchenko

Версия 0.13#

21 января 2013

Новые классы оценщиков#

dummy.DummyClassifier и dummy.DummyRegressor, два независимых от данных предиктора от Мати́ Блондель. Полезно для проверки ваших оценщиков. См. Фиктивные оценки в руководстве пользователя. Поддержка многомерного вывода добавлена Arnaud Joly.
decomposition.FactorAnalysis, трансформер, реализующий классический факторный анализ, с помощью Кристиан Осендорфер и Александр Грамфор. См. Факторный анализ в руководстве пользователя.
feature_extraction.FeatureHasher, трансформер, реализующий «хэширующий трюк» для быстрого извлечения признаков с низким потреблением памяти из строковых полей с помощью Lars Buitinck и feature_extraction.text.HashingVectorizer для текстовых документов с помощью Оливье Гризель См. Хеширование признаков и Векторизация большого текстового корпуса с помощью хеширования для документации и примеров использования.
pipeline.FeatureUnion, трансформер, который объединяет результаты нескольких других трансформеров путем Андреас Мюллер. См. FeatureUnion: составные пространства признаков в руководстве пользователя.
random_projection.GaussianRandomProjection, random_projection.SparseRandomProjection и функция random_projection.johnson_lindenstrauss_min_dim. Первые два являются преобразователями, реализующими матрицу проекции Гаусса и разреженную случайную проекцию от Оливье Гризель и Arnaud Joly. См. Случайная проекция в руководстве пользователя.
kernel_approximation.Nystroem, трансформер для аппроксимации произвольных ядер с помощью Андреас Мюллер. См. Метод Нистрёма для аппроксимации ядра в руководстве пользователя.
preprocessing.OneHotEncoder, трансформер, который вычисляет бинарные кодировки категориальных признаков с помощью Андреас Мюллер. См. Кодирование категориальных признаков в руководстве пользователя.
linear_model.PassiveAggressiveClassifier и linear_model.PassiveAggressiveRegressor, предикторы, реализующие эффективную стохастическую оптимизацию для линейных моделей с помощью Роб Зинков и Мати́ Блондель. См. Пассивно-агрессивные алгоритмы в руководстве пользователя.
ensemble.RandomTreesEmbedding, трансформер для создания высокоразмерных разреженных представлений с использованием ансамблей полностью случайных деревьев от Андреас Мюллер. См. Полностью случайные деревья вложения в руководстве пользователя.
manifold.SpectralEmbedding и функция manifold.spectral_embedding, реализующий преобразование 'собственных отображений лапласиана' для нелинейного снижения размерности Вэй Ли. См. Спектральное вложение в руководстве пользователя.
isotonic.IsotonicRegression by Fabian Pedregosa, Александр Грамфор и Нель Варокво,

Журнал изменений#

metrics.zero_one_loss (ранее metrics.zero_one) теперь имеет опцию нормализованного вывода, который сообщает долю неправильных классификаций, а не их количество. Автор: Кайл Бошамп.
tree.DecisionTreeClassifier и все производные ансамблевые модели теперь поддерживают взвешивание выборок, с помощью Noel Dawe и Gilles Louppe.
Ускорение при использовании бутстрап-выборок в лесах рандомизированных деревьев, благодаря Peter Prettenhofer и Gilles Louppe.
Графики частичной зависимости для Градиентный бустинг деревьев в ensemble.partial_dependence.partial_dependence by Peter Prettenhofer. См. Графики частичной зависимости и индивидуального условного ожидания для примера.
Оглавление на веб-сайте теперь стало раскрываемым благодаря Jaques Grobler.
feature_selection.SelectPercentile теперь разрешает связи детерминированно вместо возврата всех одинаково ранжированных признаков.
feature_selection.SelectKBest и feature_selection.SelectPercentile более численно устойчивы, поскольку используют оценки, а не p-значения, для ранжирования результатов. Это означает, что они могут иногда выбирать другие признаки, чем раньше.
Ридж-регрессия и ридж-классификация с обучением sparse_cg solver больше не имеет квадратичной сложности по памяти, благодаря Lars Buitinck и Fabian Pedregosa.
Ридж-регрессия и ридж-классификация теперь поддерживают новый быстрый решатель под названием lsqr, от Мати́ Блондель.
Ускорение metrics.precision_recall_curve от Conrad Lee.
Добавлена поддержка чтения/записи файлов svmlight с атрибутом парных предпочтений (qid в формате файла svmlight) в datasets.dump_svmlight_file и datasets.load_svmlight_file by Fabian Pedregosa.
Быстрее и более устойчивый metrics.confusion_matrix и Оценка производительности кластеризации от Wei Li.
cross_validation.cross_val_score теперь работает с предвычисленными ядрами и матрицами сходства, путем Андреас Мюллер.
использует внутренний Гаэль Варокво.
Более быстрая реализация metrics.precision_recall_curve от Conrad Lee.
Новое ядро metrics.chi2_kernel by Андреас Мюллер, часто используется в приложениях компьютерного зрения.
Исправление давней ошибки в naive_bayes.BernoulliNB исправлено Shaun Jackman.
Реализовано predict_proba в multiclass.OneVsRestClassifier, от Эндрю Винтермана.
Улучшение согласованности в градиентном бустинге: оценщики ensemble.GradientBoostingRegressor и ensemble.GradientBoostingClassifier используйте оценщик tree.DecisionTreeRegressor вместо tree._tree.Tree структуру данных с помощью Arnaud Joly.
Исправлено исключение с плавающей запятой в деревья решений модуль, от Seberg.
Исправление metrics.roc_curve не работает, когда y_true имеет только один класс, от Wei Li.
Добавьте metrics.mean_absolute_error функция, которая вычисляет среднюю абсолютную ошибку. metrics.mean_squared_error, metrics.mean_absolute_error и metrics.r2_score метрики поддерживают многомерный вывод с помощью Arnaud Joly.
Исправлено class_weight поддержка в svm.LinearSVC и linear_model.LogisticRegression by Андреас Мюллер. Значение параметра class_weight был обратён, поскольку ошибочно более высокий вес означал меньше положительных примеров данного класса в более ранних версиях.
Улучшение повествовательной документации и согласованности в sklearn.metrics для метрик регрессии и классификации по Arnaud Joly.
Исправлена ошибка в sklearn.svm.SVC при использовании csr-матриц с несортированными индексами от Xinfan Meng и Андреас Мюллер.
cluster.MiniBatchKMeans: Добавить случайное перераспределение центров кластеров с небольшим количеством прикрепленных к ним наблюдений, с помощью Гаэль Варокво.

Сводка изменений API#

Переименованы все вхождения n_atoms to n_components для согласованности. Это применяется к decomposition.DictionaryLearning, decomposition.MiniBatchDictionaryLearning, decomposition.dict_learning, decomposition.dict_learning_online.
Переименованы все вхождения max_iters to max_iter для согласованности. Это применяется к semi_supervised.LabelPropagation и semi_supervised.label_propagation.LabelSpreading.
Переименованы все вхождения learn_rate to learning_rate для единообразия в ensemble.BaseGradientBoosting и ensemble.GradientBoostingRegressor.
Модуль sklearn.linear_model.sparse удалён. Поддержка разреженных матриц уже интегрирована в «обычные» линейные модели.
sklearn.metrics.mean_square_error, который некорректно возвращал накопленную ошибку, был удалён. Используйте metrics.mean_squared_error вместо этого.
Передача class_weight параметры для fit методы больше не поддерживаются. Передавайте их в конструкторы оценщиков вместо этого.
GMM больше не имеют decode и rvs методы. Используйте score, predict или sample методы вместо этого.
The solver опция fit в регрессии и классификации Ridge теперь устарела и будет удалена в v0.14. Используйте вместо этого опцию конструктора.
feature_extraction.text.DictVectorizer теперь возвращает разреженные матрицы в формате CSR вместо COO.
Переименовано k в cross_validation.KFold и cross_validation.StratifiedKFold to n_folds, переименован n_bootstraps to n_iter в cross_validation.Bootstrap.
Переименованы все вхождения n_iterations to n_iter для согласованности. Это применяется к cross_validation.ShuffleSplit, cross_validation.StratifiedShuffleSplit, utils.extmath.randomized_range_finder и utils.extmath.randomized_svd.
Заменен rho в linear_model.ElasticNet и linear_model.SGDClassifier by l1_ratio. rho параметр имел разные значения; l1_ratio был введён, чтобы избежать путаницы. Он имеет то же значение, что и ранее rho в linear_model.ElasticNet и (1-rho) в linear_model.SGDClassifier.
linear_model.LassoLars и linear_model.Lars теперь хранит список путей в случае нескольких целей, а не массив путей.
Атрибут gmm of hmm.GMMHMM был переименован в gmm_ для более строгого соответствия API.
cluster.spectral_embedding был перемещен в manifold.spectral_embedding.
Переименовано eig_tol в manifold.spectral_embedding, cluster.SpectralClustering to eigen_tol, переименован mode to eigen_solver.
Переименовано mode в manifold.spectral_embedding и cluster.SpectralClustering to eigen_solver.
classes_ и n_classes_ атрибуты tree.DecisionTreeClassifier и все производные ансамблевые модели теперь плоские в случае задач с одним выходом и вложенные в случае задач с несколькими выходами.
The estimators_ атрибут ensemble.GradientBoostingRegressor и ensemble.GradientBoostingClassifier теперь является массивом tree.DecisionTreeRegressor.
Переименовано chunk_size to batch_size в decomposition.MiniBatchDictionaryLearning и decomposition.MiniBatchSparsePCA для согласованности.
svm.SVC и svm.NuSVC теперь предоставляют classes_ атрибут и поддерживать произвольные типы данных для меток y. Кроме того, тип данных, возвращаемый predict теперь отражает dtype y во время fit (ранее было np.float).
Изменен test_size по умолчанию в cross_validation.train_test_split в None, добавлена возможность выводить test_size из train_size в cross_validation.ShuffleSplit и cross_validation.StratifiedShuffleSplit.
Переименованная функция sklearn.metrics.zero_one to sklearn.metrics.zero_one_loss. Учтите, что поведение по умолчанию в sklearn.metrics.zero_one_loss является многоклассовым набором данных кардиотокограмм плода, где классы представляют собой паттерны частоты сердечных сокращений плода (FHR), закодированные метками от 1 до 10. Здесь мы устанавливаем класс 3 (класс меньшинства) для представления выбросов. Он содержит 30 числовых признаков, некоторые из которых закодированы бинарно, а некоторые являются непрерывными. sklearn.metrics.zero_one: normalize=False изменено на normalize=True.
Переименованная функция metrics.zero_one_score to metrics.accuracy_score.
datasets.make_circles теперь имеет одинаковое количество внутренних и внешних точек.
В наивных байесовских классификаторах, class_prior параметр был перемещен из fit to __init__.

Люди#

Список контрибьюторов для релиза 0.13 по количеству коммитов.

364 Андреас Мюллер
143 Arnaud Joly
137 Peter Prettenhofer
131 Гаэль Варокво
117 Мати́ Блондель
108 Lars Buitinck
106 Wei Li
101 Оливье Гризель
65 Vlad Niculae
54 Gilles Louppe
40 Jaques Grobler
38 Александр Грамфор
30 Роб Зинков
19 Aymeric Masurelle
18 Эндрю Винтерман
17 Fabian Pedregosa
17 Nelle Varoquaux
16 Кристиан Осендорфер
14 Daniel Nouri
13 Virgile Fritsch
13 syhw
12 Сатражит Гхош
10 Corey Lynch
10 Кайл Бошамп
9 Brian Cheung
9 Immanuel Bayer
9 мистер Шу
8 Conrad Lee
8 James Bergstra
7 Tadej Janež
6 Брайан Кахес
6 Jake Vanderplas
6 Michael
6 Noel Dawe
6 Tiago Nunes
6 корова
5 Анзе
5 Shiqiao Du
4 Christian Jauvin
4 Жак Квам
4 Ричард Т. Гай
4 Роберт Лейтон
3 Alexandre Abraham
3 Doug Coleman
3 Scott Dickerson
2 ApproximateIdentity
2 John Benediktsson
2 Марк Веронда
2 Matti Lyra
2 Михаил Коробов
2 Xinfan Meng
1 Alejandro Weinstein
1 Alexandre Passos
1 Christoph Deil
1 Евгений Нижибицкий
1 Кеннет К. Арнольд
1 Luis Pedro Coelho
1 Miroslav Batchkarov
1 Pavel
1 Себастьян Берг
1 Шон Джекман
1 Subhodeep Moitra
1 bob
1 dengemann
1 emanuele
1 x006

Версия 0.13#

Версия 0.13.1#

Журнал изменений#

Люди#

Версия 0.13#

Новые классы оценщиков#

Журнал изменений#

Сводка изменений API#

Люди#

Эта страница