numpy.char.chararray#

класс numpy.char.chararray(shape, itemsize=1, unicode=False, buffer=None, смещение=0, strides=None, порядок=None)[источник]#

Предоставляет удобное представление для массивов строковых и юникодных значений.

Примечание

The chararray класс существует для обратной совместимости с Numarray, он не рекомендуется для новой разработки. Начиная с numpy 1.4, если нужны массивы строк, рекомендуется использовать массивы dtype object_, bytes_ или str_, и используйте свободные функции в numpy.char модуль для быстрых векторизованных строковых операций.

В сравнении с массивом NumPy типа bytes_ или str_, этот класс добавляет следующую функциональность:

значения автоматически имеют удалённые пробелы с конца при индексации
Операторы сравнения автоматически удаляют пробелы в конце при сравнении значений
векторизованные строковые операции предоставляются как методы (например, endswith) и инфиксные операторы (например, "+", "*", "%")

chararrays должны создаваться с использованием numpy.char.array или numpy.char.asarray, а не этот конструктор напрямую.

Этот конструктор создаёт массив, используя buffer (с смещение и strides) если это не None. Если buffer является None, затем создает новый массив с strides в «порядке C», если только оба len(shape) >= 2 и order='F', в этом случае strides находится в «порядке Fortran».

Параметры:

shapeкортеж: Форма массива.
itemsizeint, необязательный: Длина каждого элемента массива в количестве символов. По умолчанию 1.
unicodebool, необязательно: Являются ли элементы массива типа unicode (True) или string (False). По умолчанию False.
bufferобъект, предоставляющий интерфейс буфера, или str, опционально: Адрес памяти начала данных массива. По умолчанию None, в этом случае создается новый массив.
смещениеint, необязательный: Фиксированное смещение шага от начала оси? По умолчанию 0. Должно быть >=0.
stridesarray_like из целых чисел, необязательно: Шаги для массива (см. strides для полного описания). По умолчанию — None.
порядок{'C', 'F'}, опционально: Порядок хранения данных массива в памяти: 'C' -> порядок «по строкам» (по умолчанию), 'F' -> порядок «по столбцам» (Fortran).

Примеры

>>> import numpy as np
>>> charar = np.char.chararray((3, 3))
>>> charar[:] = 'a'
>>> charar
chararray([[b'a', b'a', b'a'],
           [b'a', b'a', b'a'],
           [b'a', b'a', b'a']], dtype='|S1')

>>> charar = np.char.chararray(charar.shape, itemsize=5)
>>> charar[:] = 'abc'
>>> charar
chararray([[b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc']], dtype='|S5')

Атрибуты:

T: Вид транспонированного массива.
base: Базовый объект, если память взята из другого объекта.
ctypes: Объект для упрощения взаимодействия массива с модулем ctypes.
data: Буферный объект Python, указывающий на начало данных массива.
device
dtype: Тип данных элементов массива.
flags: Информация о расположении памяти массива.
flat: Одномерный итератор по массиву.
imag: Мнимая часть массива.
itemsize: Длина одного элемента массива в байтах.
mT: Представление транспонированного массива матрицы.
nbytes: Общее количество байтов, потребляемых элементами массива.
ndim: Количество измерений массива.
real: Действительная часть массива.
shape: Кортеж размерностей массива.
size: Количество элементов в массиве.
strides: Кортеж байтов для шага в каждом измерении при обходе массива.

Методы

`astype`(dtype[, order, casting, subok, copy])	Копия массива, приведённая к указанному типу.
`argsort`([axis, kind, order, stable])	Возвращает индексы, которые отсортировали бы этот массив.
`copy`([order])	Возвращает копию массива.
`count`(sub[, start, end])	Возвращает массив с количеством неперекрывающихся вхождений подстроки sub в диапазоне [начало, end].
`decode`([encoding, errors])	Вызывает `bytes.decode` поэлементно.
`dump`(файл)	Сохранить pickle массива в указанный файл.
`dumps`()	Возвращает pickle массива в виде строки.
`encode`([encoding, errors])	Вызывает `str.encode` поэлементно.
`endswith`(суффикс[, начало, конец])	Возвращает логический массив, который True где строковый элемент в self заканчивается на суффикс, иначе False.
`expandtabs`([tabsize])	Возвращает копию каждого строкового элемента, где все символы табуляции заменены одним или несколькими пробелами.
`fill`(значение)	Заполнить массив скалярным значением.
`find`(sub[, start, end])	Для каждого элемента возвращает наименьший индекс в строке, где подстрока sub найден.
`flatten`([order])	Возвращает копию массива, сведённую в одно измерение.
`getfield`(dtype[, offset])	Возвращает поле заданного массива как определенный тип.
`index`(sub[, start, end])	Как `find`, но вызывает `ValueError` когда подстрока не найдена.
`isalnum`()	Возвращает true для каждого элемента, если все символы в строке являются буквенно-цифровыми и есть хотя бы один символ, иначе false.
`isalpha`()	Возвращает true для каждого элемента, если все символы в строке являются буквами и есть хотя бы один символ, иначе false.
`isdecimal`()	Для каждого элемента в self, вернуть True, если в элементе есть только десятичные символы.
`isdigit`()	Возвращает true для каждого элемента, если все символы в строке являются цифрами и есть хотя бы один символ, иначе false.
`islower`()	Возвращает true для каждого элемента, если все символы с регистром в строке в нижнем регистре и есть хотя бы один символ с регистром, иначе false.
`isnumeric`()	Для каждого элемента в self, возвращает True, если в элементе есть только цифровые символы.
`isspace`()	Возвращает true для каждого элемента, если в строке есть только пробельные символы и есть хотя бы один символ, иначе false.
`istitle`()	Возвращает true для каждого элемента, если элемент является строкой с заглавными буквами и содержит хотя бы один символ, иначе false.
`isupper`()	Возвращает true для каждого элемента, если все символы в строке в верхнем регистре и есть хотя бы один символ, иначе false.
`item`(*args)	Скопировать элемент массива в стандартный скаляр Python и вернуть его.
`join`(последовательность)	Возвращает строку, которая является конкатенацией строк в последовательности seq.
`ljust`(width[, fillchar])	Возвращает массив с элементами self выровнено по левому краю в строке длиной ширина.
`lower`()	Возвращает массив с элементами self преобразуется в нижний регистр.
`lstrip`([chars])	Для каждого элемента в self, вернуть копию с удалёнными начальными символами.
`nonzero`()	Возвращает индексы элементов, которые не равны нулю.
`put`(indices, values[, mode])	Установить `a.flat[n] = values[n]` для всех `n` в индексах.
`ravel`([order])	Возвращает сглаженный массив.
`repeat`(repeats[, axis])	Повторить элементы массива.
`replace`(old, new[, count])	Для каждого элемента в self, возвращает копию строки со всеми вхождениями подстроки старый заменено на новый.
`reshape`(a.reshape)	Возвращает массив с теми же данными, но новой формой.
`resize`(a.resize)	Изменение формы и размера массива на месте.
`rfind`(sub[, start, end])	Для каждого элемента в self, вернуть наивысший индекс в строке, где подстрока sub найдено, такое что sub содержится в [начало, end].
`rindex`(sub[, start, end])	Как `rfind`, но вызывает `ValueError` когда подстрока sub не найдено.
`rjust`(width[, fillchar])	Возвращает массив с элементами self выровненные по правому краю в строке длиной ширина.
`rsplit`([sep, maxsplit])	Для каждого элемента в self, возвращает список слов в строке, используя sep в качестве строки-разделителя.
`rstrip`([chars])	Для каждого элемента в self, возвращает копию с удалёнными завершающими символами.
`searchsorted`(v[, side, sorter])	Найти индексы, где элементы v должен быть вставлен в a для сохранения порядка.
`setfield`(val, dtype[, offset])	Поместить значение в указанное место в поле, определённом типом данных.
`setflags`([write, align, uic])	Установить флаги массива WRITEABLE, ALIGNED, WRITEBACKIFCOPY соответственно.
`sort`([axis, kind, order, stable])	Сортировать массив на месте.
`split`([sep, maxsplit])	Для каждого элемента в self, возвращает список слов в строке, используя sep в качестве строки-разделителя.
`splitlines`([keepends])	Для каждого элемента в self, возвращает список строк в элементе, разбивая по границам строк.
`squeeze`([axis])	Удалить оси длиной один из a.
`startswith`(prefix[, start, end])	Возвращает логический массив, который True где строковый элемент в self начинается с префикс, иначе False.
`strip`([chars])	Для каждого элемента в self, возвращает копию с удаленными начальными и конечными символами.
`swapaxes`(axis1, axis2, /)	Вернуть представление массива с axis1 и axis2 поменяны местами.
`swapcase`()	Для каждого элемента в self, вернуть копию строки с преобразованием символов верхнего регистра в нижний и наоборот.
`take`(indices[, axis, out, mode])	Возвращает массив, сформированный из элементов a по заданным индексам.
`title`()	Для каждого элемента в self, возвращает версию строки с заглавными буквами: слова начинаются с заглавных символов, все остальные символы в нижнем регистре.
`tofile`(fid, /[, sep, format])	Запись массива в файл как текст или двоичный (по умолчанию).
`tolist`()	Вернуть массив как `a.ndim`-уровневый вложенный список скаляров Python.
`translate`(table[, deletechars])	Для каждого элемента в self, верните копию строки, где все символы, встречающиеся в необязательном аргументе deletechars удаляются, а оставшиеся символы были отображены через заданную таблицу перевода.
`transpose`(*axes)	Возвращает представление массива с переставленными осями.
`upper`()	Возвращает массив с элементами self преобразован в верхний регистр.
`view`([dtype][, type])	Новое представление массива с теми же данными.
`zfill`(ширина)	Возвращает числовую строку, заполненную слева нулями, в строке длиной ширина.