sklearn.feature_extraction#

Извлечение признаков из сырых данных.

Руководство пользователя. См. Извлечение признаков раздел для дальнейших деталей.

DictVectorizer

Преобразует списки сопоставлений признак-значение в векторы.

FeatureHasher

Реализует хеширование признаков, также известное как трюк с хешированием.

Из изображений#

Утилиты для извлечения признаков из изображений.

image.PatchExtractor

Извлекает патчи из коллекции изображений.

image.extract_patches_2d

Преобразование 2D изображения в набор патчей.

image.grid_to_graph

Граф соединений пиксель-к-пикселю.

image.img_to_graph

Граф связей градиента от пикселя к пикселю.

image.reconstruct_from_patches_2d

Восстановить изображение из всех его патчей.

Из текста#

Утилиты для построения векторов признаков из текстовых документов.

text.CountVectorizer

Преобразование коллекции текстовых документов в матрицу количества токенов.

text.HashingVectorizer

Преобразовать коллекцию текстовых документов в матрицу встречаемости токенов.

text.TfidfTransformer

Преобразовать матрицу частот в нормализованное представление tf или tf-idf.

text.TfidfVectorizer

Преобразовать коллекцию необработанных документов в матрицу признаков TF-IDF.