Кто использует scikit-learn?#
J.P.Morgan#
Scikit-learn является незаменимой частью инструментария машинного обучения на Python в JPMorgan. Он очень широко используется во всех подразделениях банка для классификации, прогнозной аналитики и многих других задач машинного обучения. Его простой API, разнообразие алгоритмов и качество документации делают scikit-learn одновременно очень доступным и очень мощным.
Stephen Simmons, вице-президент, Athena Research, JPMorgan
Spotify#
Scikit-learn предоставляет инструментарий с надежными реализациями множества современных моделей и упрощает их интеграцию в существующие приложения. Мы довольно часто использовали его для рекомендаций музыки в Spotify, и я думаю, что это наиболее хорошо спроектированный пакет машинного обучения, который я видел до сих пор.
Эрик Бернхардссон, инженерный менеджер по музыкальным рекомендациям и машинному обучению, Spotify
Inria#
В INRIA мы используем scikit-learn для поддержки передовых фундаментальных исследований во многих командах: Parietal для нейровизуализации, Lear для компьютерного зрения, Visages для анализа медицинских изображений, Privatics для безопасности. Проект является фантастическим инструментом для решения сложных приложений машинного обучения в академической среде, так как он производителен и универсален, но все легко использовать и хорошо документировано, что делает его хорошо подходящим для аспирантов.
Гаэль Варо, исследования в Parietal
betaworks#
Betaworks — это нью-йоркская стартап-студия, которая создает новые продукты, развивает компании и инвестирует в другие. За последние 8 лет мы запустили несколько сервисов, основанных на анализе социальных данных, таких как Bitly, Chartbeat, digg и Scale Model. Команда data science Betaworks постоянно использует Scikit-learn для различных задач. От исследовательского анализа до разработки продуктов — это важная часть нашего инструментария. Недавние примеры использования включены в новая система рекомендаций видео digg, и Poncho динамическая эвристическая кластеризация подпространств.
Гилад Лотан, главный специалист по данным
Hugging Face#
В Hugging Face мы используем NLP и вероятностные модели для создания разговорных искусственных интеллектов, с которыми интересно общаться. Несмотря на использование глубоких нейронных сетей для несколько нашего задачи NLP, scikit-learn по-прежнему является основой нашей ежедневной рутины машинного обучения. Простота использования и предсказуемость интерфейса, а также прямые математические объяснения, доступные при необходимости, — это ключевая особенность. Мы используем различные модели scikit-learn в продакшене, и с ними также очень удобно работать операционно.
Жюльен Шомон, главный технический директор
Evernote#
Построение классификатора обычно представляет собой итеративный процесс исследования данных, выбора признаков (атрибутов данных, которые считаются предсказательными), обучения моделей и, наконец, их оценки. Для многих из этих задач мы полагались на отличный пакет scikit-learn для Python.
Марк Айзенштат, вице-президент, дополненный интеллект
Телеком ПарижТех#
В Telecom ParisTech scikit-learn используется для практических занятий и домашних заданий на вводных и продвинутых курсах по машинному обучению. Занятия предназначены для студентов бакалавриата и магистратуры. Большим преимуществом scikit-learn является его быстрая кривая обучения, которая позволяет студентам быстро начать работать над интересными и мотивирующими задачами.
Alexandre Gramfort, доцент
Booking.com#
В Booking.com мы используем алгоритмы машинного обучения для многих различных приложений, таких как рекомендация отелей и направлений нашим клиентам, обнаружение мошеннических бронирований или планирование работы агентов службы поддержки. Scikit-learn — один из инструментов, которые мы используем при реализации стандартных алгоритмов для задач прогнозирования. Его API и документация превосходны и облегчают использование. Разработчики scikit-learn отлично справляются с включением современных реализаций и новых алгоритмов в пакет. Таким образом, scikit-learn предоставляет удобный доступ к широкому спектру алгоритмов и позволяет нам легко находить подходящий инструмент для конкретной задачи.
Melanie Mueller, Data Scientist
AWeber#
Инструментарий scikit-learn незаменим для команды анализа и управления данными в AWeber. Он позволяет нам делать AWesome вещи, которые мы иначе не смогли бы осуществить из-за нехватки времени или ресурсов. Документация превосходна, позволяя новым инженерам быстро оценивать и применять множество различных алгоритмов к нашим данным. Утилиты извлечения текстовых признаков полезны при работе с большим объемом email-контента, который у нас есть в AWeber. Реализация RandomizedPCA вместе с Pipelining и FeatureUnions позволяет нам разрабатывать сложные алгоритмы машинного обучения эффективно и надежно.
Все, кто заинтересован в более подробном изучении того, как AWeber развертывает scikit-learn в производственной среде, могут ознакомиться с докладами с PyData Boston от AWeber’s Michael Becker, доступными по адресу mdbecker/pydata_2013.
Michael Becker, Software Engineer, Data Analysis and Management Ninjas
Yhat#
Сочетание согласованных API, тщательной документации и первоклассной реализации делает scikit-learn нашим любимым пакетом машинного обучения в Python. scikit-learn делает выполнение продвинутого анализа в Python доступным для всех. В Yhat мы упрощаем интеграцию этих моделей в ваши продакшен-приложения, устраняя ненужное время разработки, затрачиваемое на внедрение аналитической работы.
Грег Ламп, Соучредитель
Rangespan#
Инструментарий Python scikit-learn является основным инструментом в группе data science в Rangespan. Его большая коллекция хорошо документированных моделей и алгоритмов позволяет нашей команде специалистов по данным быстро создавать прототипы и итеративно находить правильное решение для наших задач обучения. Мы считаем, что scikit-learn - это не только правильный инструмент для прототипирования, но его тщательная и хорошо протестированная реализация дает нам уверенность в запуске моделей scikit-learn в производственной среде.
Юрген Ван Гаэль, директор по науке о данных
Birchbox#
В Birchbox мы сталкиваемся с рядом типичных для электронной коммерции задач машинного обучения: рекомендация продуктов, кластеризация пользователей, прогнозирование запасов, обнаружение трендов и т.д. Scikit-learn позволяет нам экспериментировать со многими моделями, особенно на этапе исследования нового проекта: данные могут передаваться единообразно; модели легко сохранять и повторно использовать; обновления информируют нас о новых разработках от исследовательского сообщества в области обнаружения паттернов. Scikit-learn — важный инструмент для нашей команды, созданный правильным образом на правильном языке.
Тьерри Бертен-Махье, Data Scientist
Bestofmedia Group#
Scikit-learn — наш инструмент №1 для всех задач машинного обучения в Bestofmedia. Мы используем его для различных задач (например, борьба со спамом, прогнозирование кликов по рекламе, различные модели ранжирования) благодаря разнообразным, современным реализациям алгоритмов, включенным в него. В лаборатории он ускоряет прототипирование сложных конвейеров. В продакшене могу сказать, что он доказал свою надежность и эффективность, чтобы быть развернутым для критически важных бизнес-компонентов.
Юсташ Дьемер, ведущий учёный
Change.org#
В change.org мы автоматизируем использование RandomForestClassifier из scikit-learn в наших производственных системах для таргетирования электронной почты, которая достигает миллионов пользователей по всему миру каждую неделю. В лабораторных условиях простота использования, производительность и общее разнообразие реализованных алгоритмов scikit-learn оказались бесценными, предоставляя нам единый надежный источник для наших задач машинного обучения.
Вижай Рамеш, инженер-программист в области данных/науки в Change.org
PHIMECA Engineering#
В PHIMECA Engineering мы используем оценщики scikit-learn в качестве суррогатов для численных моделей, требующих больших вычислительных ресурсов (в основном, но не исключительно, конечно-элементных механических моделей), чтобы ускорить интенсивные операции постобработки, задействованные в нашей системе принятия решений на основе моделирования. API fit/predict scikit-learn вместе с его эффективными инструментами кросс-валидации значительно упрощает задачу выбора наилучшего оценщика. Мы также используем scikit-learn для иллюстрации концепций на наших учебных занятиях. Слушатели всегда впечатлены простотой использования scikit-learn, несмотря на кажущуюся теоретическую сложность машинного обучения.
Венсан Дюбур, PHIMECA Engineering, PhD Engineer
HowAboutWe#
В HowAboutWe scikit-learn позволяет нам реализовать широкий спектр методов машинного обучения в анализе и в производстве, несмотря на небольшую команду. Мы используем алгоритмы классификации scikit-learn для прогнозирования поведения пользователей, что позволяет нам (например) оценивать ценность лидов из данного источника трафика на раннем этапе их пребывания на нашем сайте. Кроме того, профили наших пользователей состоят в основном из неструктурированных данных (ответов на открытые вопросы), поэтому мы используем инструменты извлечения признаков и уменьшения размерности scikit-learn для преобразования этих неструктурированных данных во входные данные для нашей системы подбора пар.
Дэниел Вайценфельд, старший специалист по данным в HowAboutWe
PeerIndex#
В PeerIndex мы используем научную методологию для построения Influence Graph — уникального набора данных, который позволяет нам определить, кто действительно влиятелен и в каком контексте. Для этого нам приходится решать ряд задач машинного обучения и прогнозного моделирования. Scikit-learn стал нашим основным инструментом для разработки прототипов и быстрого прогресса. От предсказания отсутствующих данных и классификации твитов до кластеризации сообществ пользователей социальных сетей, scikit- learn оказался полезным в различных приложениях. Его очень интуитивный интерфейс и отличная совместимость с другими инструментами Python делают его незаменимым инструментом в наших ежедневных исследовательских усилиях.
Ференц Хусар, старший специалист по данным в Peerindex
DataRobot#
DataRobot создает программное обеспечение для прогнозной аналитики следующего поколения, чтобы повысить продуктивность специалистов по данным, и scikit-learn является неотъемлемой частью нашей системы. Разнообразие методов машинного обучения в сочетании с надежными реализациями, которые предлагает scikit-learn, делает его универсальной библиотекой для машинного обучения на Python. Более того, его последовательный API, хорошо протестированный код и разрешительное лицензирование позволяют нам использовать его в производственной среде. Scikit-learn буквально сэкономил нам годы работы, которые нам пришлось бы выполнить самостоятельно, чтобы вывести наш продукт на рынок.
Джереми Ачин, CEO & Co-founder DataRobot Inc.
OkCupid#
Мы используем scikit-learn в OkCupid для оценки и улучшения нашей системы подбора пар. Диапазон функций, особенно утилит предобработки, означает, что мы можем использовать его для самых разных проектов, и он достаточно производителен, чтобы обрабатывать объём данных, который нам нужно отсортировать. Документация действительно тщательная, что делает библиотеку довольно простой в использовании.
Дэвид Ко - старший специалист по данным в OkCupid
Lovely#
В Lovely мы стремимся предоставить лучший рынок квартир, уважая наших пользователей и наши объявления. От понимания поведения пользователей, улучшения качества данных и обнаружения мошенничества, scikit-learn является регулярным инструментом для сбора аналитики, прогнозного моделирования и улучшения нашего продукта. Легкочитаемая документация и интуитивная архитектура API делают машинное обучение как исследовательским, так и доступным для широкого круга python-разработчиков. Я постоянно рекомендую больше разработчикам и учёным попробовать scikit-learn.
Simon Frid - Data Scientist, Lead at Lovely
Data Publica#
Data Publica создаёт новый инструмент прогнозирования продаж для коммерческих и маркетинговых команд под названием C-Radar. Мы активно используем scikit-learn для построения сегментаций клиентов через кластеризацию и для прогнозирования будущих клиентов на основе успеха или неудачи прошлых партнёрств. Мы также категоризируем компании, используя их коммуникацию на веб-сайте, благодаря scikit-learn и его реализациям алгоритмов машинного обучения. В конечном счёте, машинное обучение позволяет обнаруживать слабые сигналы, которые традиционные инструменты не могут увидеть. Все эти сложные задачи выполняются легко и прямым образом благодаря высокому качеству фреймворка scikit-learn.
Гийом Лебуржуа и Самуэль Шаррон - Data Scientists в Data Publica
Machinalis#
Scikit-learn является краеугольным камнем всех проектов машинного обучения, выполняемых в Machinalis. Он имеет последовательный API, широкий выбор алгоритмов и множество вспомогательных инструментов для работы с шаблонным кодом. Мы использовали его в производственных средах в различных проектах, включая предсказание кликов, извлечение информации, и даже подсчет овец!
Фактически, мы используем его так часто, что начали замораживать наши общие случаи использования в пакеты Python, некоторые из них с открытым исходным кодом, такие как FeatureForge. Scikit-learn одним словом: Потрясающе.
Rafael Carrascosa, ведущий разработчик
solido#
Scikit-learn помогает двигать закон Мура через Solido. Solido создает инструменты автоматизированного проектирования, используемые большинством топ-20 полупроводниковых компаний и фабрик, для проектирования передовых чипов внутри смартфонов, автомобилей и других устройств. Scikit-learn помогает питать алгоритмы Solido для оценки редких событий, проверки наихудших случаев, оптимизации и многого другого. В Solido мы особенно ценим библиотеки scikit-learn для Гауссовских процессов, крупномасштабной регуляризованной линейной регрессии и классификации. Scikit-learn повысил нашу производительность, потому что для многих задач ML нам больше не нужно "писать свой собственный" код. Этот доклад на PyData 2014 содержит подробности.
Трент МакКонаги, основатель, Solido Design Automation Inc.
INFONEA#
Мы используем scikit-learn для быстрого прототипирования и пользовательских решений в области Data Science в нашем in-memory программном обеспечении Business Intelligence INFONEA®. Как хорошо документированная и всеобъемлющая коллекция современных алгоритмов и методов конвейеризации, scikit-learn позволяет нам предоставлять гибкие и масштабируемые решения для научного анализа. Таким образом, scikit-learn чрезвычайно ценен для реализации мощной интеграции технологий Data Science в самообслуживаемую бизнес-аналитику.
Thorsten Kranz, Data Scientist, Coma Soft AG.
Dataiku#
Наше программное обеспечение, Data Science Studio (DSS), позволяет пользователям создавать сервисы данных, которые объединяют ETL с машинным обучением. Наш модуль машинного обучения интегрирует многие алгоритмы scikit-learn. Библиотека scikit-learn идеально интегрируется с DSS, поскольку предлагает алгоритмы практически для всех бизнес-кейсов. Наша цель — предоставить прозрачный и гибкий инструмент, который упрощает оптимизацию трудоёмких аспектов создания сервиса данных, подготовки данных и обучения алгоритмов машинного обучения на всех типах данных.
Флориан Дуэтто, CEO, Dataiku
Otto Group#
Здесь, в Otto Group, одном из глобальных Big Five B2C онлайн-ритейлеров, мы используем scikit-learn во всех аспектах нашей ежедневной работы: от исследования данных до разработки машинного обучения и производственного развертывания этих сервисов. Это помогает нам решать задачи машинного обучения, от электронной коммерции до логистики. Его последовательные API позволили нам построить Фреймворк Palladium REST-API вокруг него и непрерывно предоставлять услуги на основе scikit-learn.
Кристиан Раммиг, руководитель отдела Data Science, Otto Group
Zopa#
В Zopa, первой в мире платформе Peer-to-Peer кредитования, мы широко используем scikit-learn для ведения бизнеса и оптимизации опыта наших пользователей. Он питает наши модели машинного обучения, задействованные в кредитном риске, риске мошенничества, маркетинге и ценообразовании, и использовался для выдачи кредитов Zopa на сумму не менее 1 миллиарда фунтов стерлингов. Он очень хорошо документирован, мощный и простой в использовании. Мы благодарны за возможности, которые он предоставил, и за то, что позволил нам выполнить нашу миссию по упрощению и справедливости обращения с деньгами.
Власиос Василиу, руководитель отдела Data Science, Zopa
MARS#
Scikit-Learn является неотъемлемой частью экосистемы машинного обучения в Mars. Независимо от того, разрабатываем ли мы лучшие рецепты кормов для домашних животных или тщательно анализируем нашу цепочку поставок какао, Scikit-Learn используется как инструмент для быстрого прототипирования идей и их внедрения в производство. Это позволяет нам лучше понимать и удовлетворять потребности наших потребителей по всему миру. Богатый функционал Scikit-Learn прост в использовании и оснащает наших сотрудников возможностями, необходимыми для решения бизнес-задач, с которыми они сталкиваются каждый день.
Майкл Фитцке, старший руководитель технологий следующего поколения, Mars Inc.
BNP Paribas Cardif#
BNP Paribas Cardif использует scikit-learn для нескольких своих моделей машинного обучения в продакшене. Наше внутреннее сообщество разработчиков и специалистов по данным использует scikit-learn с 2015 года по нескольким причинам: качество разработок, документации и управления вкладом, а также огромный размер сообщества участников. Мы даже явно упоминаем использование конвейеров scikit-learn в нашем внутреннем управлении рисками моделей как одну из наших лучших практик для снижения операционных рисков и риска переобучения. В качестве способа поддержки разработки открытого программного обеспечения и, в частности, проекта scikit-learn, мы решили участвовать в консорциуме scikit-learn в La Fondation Inria с момента его создания в 2018 году.
Себастьен Конарт, главный специалист по данным, BNP Paribas Cardif