scipy.io.arff.

loadarff#

scipy.io.arff.loadarff(f)[источник]#

Прочитать файл arff.

Данные возвращаются в виде массива записей, к которому можно обращаться почти как к словарю массивов NumPy. Например, если один из атрибутов называется 'pressure', то его первые 10 точек данных можно получить из data массив записей следующим образом: data['pressure'][0:10]

Параметры:
fфайлоподобный или str

Файлоподобный объект для чтения или имя файла для открытия.

Возвращает:
данныезаписывающий массив

Данные файла arff, доступные по именам атрибутов.

metaMetaData

Содержит информацию о файле arff, такую как имя и тип атрибутов, отношение (название набора данных) и т.д.

Вызывает:
ParseArffError

Возникает, если указанный файл не имеет формат ARFF.

NotImplementedError

Файл ARFF имеет атрибут, который еще не поддерживается.

Примечания

Эта функция должна уметь читать большинство файлов arff. Не реализованные возможности включают:

  • атрибуты типа даты

  • атрибуты строкового типа

Он может читать файлы с числовыми и номинальными атрибутами. Он не может читать файлы с разреженными данными ({} в файле). Однако эта функция может читать файлы с пропущенными данными (? в файле), представляя точки данных как NaN.

Примеры

>>> from scipy.io import arff
>>> from io import StringIO
>>> content = """
... @relation foo
... @attribute width  numeric
... @attribute height numeric
... @attribute color  {red,green,blue,yellow,black}
... @data
... 5.0,3.25,blue
... 4.5,3.75,green
... 3.0,4.00,red
... """
>>> f = StringIO(content)
>>> data, meta = arff.loadarff(f)
>>> data
array([(5.0, 3.25, 'blue'), (4.5, 3.75, 'green'), (3.0, 4.0, 'red')],
      dtype=[('width', '
>>> meta
Dataset: foo
    width's type is numeric
    height's type is numeric
    color's type is nominal, range is ('red', 'green', 'blue', 'yellow', 'black')