loadarff#
- scipy.io.arff.loadarff(f)[источник]#
Прочитать файл arff.
Данные возвращаются в виде массива записей, к которому можно обращаться почти как к словарю массивов NumPy. Например, если один из атрибутов называется 'pressure', то его первые 10 точек данных можно получить из
dataмассив записей следующим образом:data['pressure'][0:10]- Параметры:
- fфайлоподобный или str
Файлоподобный объект для чтения или имя файла для открытия.
- Возвращает:
- данныезаписывающий массив
Данные файла arff, доступные по именам атрибутов.
- meta
MetaData Содержит информацию о файле arff, такую как имя и тип атрибутов, отношение (название набора данных) и т.д.
- Вызывает:
- ParseArffError
Возникает, если указанный файл не имеет формат ARFF.
- NotImplementedError
Файл ARFF имеет атрибут, который еще не поддерживается.
Примечания
Эта функция должна уметь читать большинство файлов arff. Не реализованные возможности включают:
атрибуты типа даты
атрибуты строкового типа
Он может читать файлы с числовыми и номинальными атрибутами. Он не может читать файлы с разреженными данными ({} в файле). Однако эта функция может читать файлы с пропущенными данными (? в файле), представляя точки данных как NaN.
Примеры
>>> from scipy.io import arff >>> from io import StringIO >>> content = """ ... @relation foo ... @attribute width numeric ... @attribute height numeric ... @attribute color {red,green,blue,yellow,black} ... @data ... 5.0,3.25,blue ... 4.5,3.75,green ... 3.0,4.00,red ... """ >>> f = StringIO(content) >>> data, meta = arff.loadarff(f) >>> data array([(5.0, 3.25, 'blue'), (4.5, 3.75, 'green'), (3.0, 4.0, 'red')], dtype=[('width', '
>>> meta Dataset: foo width's type is numeric height's type is numeric color's type is nominal, range is ('red', 'green', 'blue', 'yellow', 'black')