sklearn.datasets#

Утилиты для загрузки популярных наборов данных и генераторов искусственных данных.

Руководство пользователя. См. Утилиты загрузки наборов данных раздел для дальнейших деталей.

Загрузчики#

clear_data_home

Удалить все содержимое кэша домашней директории данных.

dump_svmlight_file

Сохранить набор данных в формате файла svmlight / libsvm.

fetch_20newsgroups

Загрузка имён файлов и данных из набора данных 20 новостных групп (классификация).

fetch_20newsgroups_vectorized

Загрузить и векторизовать набор данных 20 newsgroups (классификация).

fetch_california_housing

Загрузить набор данных о жилье в Калифорнии (регрессия).

fetch_covtype

Загрузите набор данных covertype (классификация).

fetch_file

Загрузите файл из интернета, если он еще не присутствует в локальной папке.

fetch_kddcup99

Загрузить набор данных kddcup99 (классификация).

fetch_lfw_pairs

Загрузить набор данных пар Labeled Faces in the Wild (LFW) (классификация).

fetch_lfw_people

Загрузить набор данных Labeled Faces in the Wild (LFW) людей (классификация).

fetch_olivetti_faces

Загрузите набор данных лиц Olivetti от AT&T (классификация).

fetch_openml

Загрузите набор данных из openml по имени или идентификатору набора данных.

fetch_rcv1

Загрузите многометочный набор данных RCV1 (классификация).

fetch_species_distributions

Загрузчик для набора данных о распределении видов от Phillips et al.

get_data_home

Возвращает путь к каталогу данных scikit-learn.

load_breast_cancer

Загрузить и вернуть набор данных о раке молочной железы в Висконсине (классификация).

load_diabetes

Загружает и возвращает набор данных по диабету (регрессия).

load_digits

Загрузить и вернуть набор данных digits (классификация).

load_files

Загрузить текстовые файлы с категориями в качестве имён подпапок.

load_iris

Загружает и возвращает набор данных ирисов (классификация).

load_linnerud

Загружает и возвращает набор данных Linnerud по физическим упражнениям.

load_sample_image

Загрузить массив numpy одного примера изображения.

load_sample_images

Загрузить примеры изображений для манипуляций с изображениями.

load_svmlight_file

Загрузить наборы данных в формате svmlight / libsvm в разреженную CSR-матрицу.

load_svmlight_files

Загрузить набор данных из нескольких файлов в формате SVMlight.

load_wine

Загрузить и вернуть набор данных wine (классификация).

Генераторы выборок#

make_biclusters

Сгенерировать массив структуры постоянного блочного диагоналя для бикластеризации.

make_blobs

Сгенерировать изотропные гауссовы сгустки для кластеризации.

make_checkerboard

Сгенерировать массив с блочной шахматной структурой для бикластеризации.

make_circles

Создать большой круг, содержащий меньший круг в 2D.

make_classification

Сгенерировать случайную задачу классификации на n классов.

make_friedman1

Сгенерировать регрессионную задачу "Friedman #1".

make_friedman2

Сгенерировать регрессионную задачу "Фридмана #2".

make_friedman3

Сгенерировать регрессионную задачу "Фридмана #3".

make_gaussian_quantiles

Генерировать изотропные гауссовы выборки и метки по квантилям.

make_hastie_10_2

Сгенерировать данные для бинарной классификации, использованные в Hastie et al. 2009, Пример 10.2.

make_low_rank_matrix

Сгенерировать в основном низкоранговую матрицу с колоколообразными сингулярными значениями.

make_moons

Создайте два переплетающихся полукруга.

make_multilabel_classification

Сгенерировать случайную многометочную задачу классификации.

make_regression

Сгенерировать случайную регрессионную задачу.

make_s_curve

Сгенерировать набор данных S-кривой.

make_sparse_coded_signal

Сгенерировать сигнал как разреженную комбинацию элементов словаря.

make_sparse_spd_matrix

Сгенерировать разреженную симметричную положительно определённую матрицу.

make_sparse_uncorrelated

Сгенерировать случайную регрессионную задачу с разреженным некоррелированным дизайном.

make_spd_matrix

Генерирует случайную симметричную, положительно определённую матрицу.

make_swiss_roll

Сгенерировать набор данных 'швейцарский рулет'.