Наборы данных (scipy.datasets)#
Методы набора данных#
Вспомогательные методы#
|
Вспомогательный метод для загрузки всех файлов набора данных для |
|
Очищает кэш-директорию наборов данных scipy. |
Использование наборов данных#
Методы наборов данных SciPy можно просто вызывать следующим образом: '
Это загружает файлы набора данных по сети один раз, сохраняет кэш,
а затем возвращает numpy.ndarray объект, представляющий набор данных.
Обратите внимание, что структура возвращаемых данных и тип данных могут различаться для различных методов набора данных. Для более подробного примера использования, пожалуйста, обратитесь к документации конкретного метода набора данных выше.
Как работает получение и хранение наборов данных#
Файлы наборов данных SciPy хранятся в отдельных репозиториях GitHub под
организацией SciPy GitHub, следуя соглашению об именовании, как
'dataset-, например scipy.datasets.face файлы находятся в
scipy/dataset-face. The scipy.datasets подмодуль использует и зависит от Pooch, Python-пакет, созданный для упрощения загрузки файлов данных. Pooch использует эти репозитории для получения соответствующих файлов наборов данных при вызове функции набора данных.
Реестр всех наборов данных, по сути, отображение имён файлов с их хэшем SHA256 и URL репозиториев, который Pooch использует для обработки и проверки загрузок при вызове функции. После однократной загрузки набора данных файлы сохраняются в системном кэш-каталоге под 'scipy-data'.
Расположение кэшей наборов данных может различаться на разных платформах.
Для macOS:
'~/Library/Caches/scipy-data'
Для Linux и других Unix-подобных платформ:
'~/.cache/scipy-data' # or the value of the XDG_CACHE_HOME env var, if defined
Для Windows:
'C:\Users\\AppData\Local\\scipy-data\Cache'
В средах с ограниченным сетевым подключением по различным причинам безопасности или на системах без постоянного подключения к интернету можно вручную загрузить кэш наборов данных, поместив содержимое репозитория набора данных в упомянутый выше кэш-каталог, чтобы избежать ошибок загрузки наборов данных без подключения к интернету.