numpy.char.chararray#

класс numpy.char.chararray(shape, itemsize=1, unicode=False, buffer=None, смещение=0, strides=None, порядок=None)[источник]#

Предоставляет удобное представление для массивов строковых и юникодных значений.

Примечание

The chararray класс существует для обратной совместимости с Numarray, он не рекомендуется для новой разработки. Начиная с numpy 1.4, если нужны массивы строк, рекомендуется использовать массивы dtype object_, bytes_ или str_, и используйте свободные функции в numpy.char модуль для быстрых векторизованных строковых операций.

В сравнении с массивом NumPy типа bytes_ или str_, этот класс добавляет следующую функциональность:

  1. значения автоматически имеют удалённые пробелы с конца при индексации

  2. Операторы сравнения автоматически удаляют пробелы в конце при сравнении значений

  3. векторизованные строковые операции предоставляются как методы (например, endswith) и инфиксные операторы (например, "+", "*", "%")

chararrays должны создаваться с использованием numpy.char.array или numpy.char.asarray, а не этот конструктор напрямую.

Этот конструктор создаёт массив, используя bufferсмещение и strides) если это не None. Если buffer является None, затем создает новый массив с strides в «порядке C», если только оба len(shape) >= 2 и order='F', в этом случае strides находится в «порядке Fortran».

Параметры:
shapeкортеж

Форма массива.

itemsizeint, необязательный

Длина каждого элемента массива в количестве символов. По умолчанию 1.

unicodebool, необязательно

Являются ли элементы массива типа unicode (True) или string (False). По умолчанию False.

bufferобъект, предоставляющий интерфейс буфера, или str, опционально

Адрес памяти начала данных массива. По умолчанию None, в этом случае создается новый массив.

смещениеint, необязательный

Фиксированное смещение шага от начала оси? По умолчанию 0. Должно быть >=0.

stridesarray_like из целых чисел, необязательно

Шаги для массива (см. strides для полного описания). По умолчанию — None.

порядок{'C', 'F'}, опционально

Порядок хранения данных массива в памяти: 'C' -> порядок «по строкам» (по умолчанию), 'F' -> порядок «по столбцам» (Fortran).

Примеры

>>> import numpy as np
>>> charar = np.char.chararray((3, 3))
>>> charar[:] = 'a'
>>> charar
chararray([[b'a', b'a', b'a'],
           [b'a', b'a', b'a'],
           [b'a', b'a', b'a']], dtype='|S1')
>>> charar = np.char.chararray(charar.shape, itemsize=5)
>>> charar[:] = 'abc'
>>> charar
chararray([[b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc']], dtype='|S5')
Атрибуты:
T

Вид транспонированного массива.

base

Базовый объект, если память взята из другого объекта.

ctypes

Объект для упрощения взаимодействия массива с модулем ctypes.

data

Буферный объект Python, указывающий на начало данных массива.

device
dtype

Тип данных элементов массива.

flags

Информация о расположении памяти массива.

flat

Одномерный итератор по массиву.

imag

Мнимая часть массива.

itemsize

Длина одного элемента массива в байтах.

mT

Представление транспонированного массива матрицы.

nbytes

Общее количество байтов, потребляемых элементами массива.

ndim

Количество измерений массива.

real

Действительная часть массива.

shape

Кортеж размерностей массива.

size

Количество элементов в массиве.

strides

Кортеж байтов для шага в каждом измерении при обходе массива.

Методы

astype(dtype[, order, casting, subok, copy])

Копия массива, приведённая к указанному типу.

argsort([axis, kind, order, stable])

Возвращает индексы, которые отсортировали бы этот массив.

copy([order])

Возвращает копию массива.

count(sub[, start, end])

Возвращает массив с количеством неперекрывающихся вхождений подстроки sub в диапазоне [начало, end].

decode([encoding, errors])

Вызывает bytes.decode поэлементно.

dump(файл)

Сохранить pickle массива в указанный файл.

dumps()

Возвращает pickle массива в виде строки.

encode([encoding, errors])

Вызывает str.encode поэлементно.

endswith(суффикс[, начало, конец])

Возвращает логический массив, который True где строковый элемент в self заканчивается на суффикс, иначе False.

expandtabs([tabsize])

Возвращает копию каждого строкового элемента, где все символы табуляции заменены одним или несколькими пробелами.

fill(значение)

Заполнить массив скалярным значением.

find(sub[, start, end])

Для каждого элемента возвращает наименьший индекс в строке, где подстрока sub найден.

flatten([order])

Возвращает копию массива, сведённую в одно измерение.

getfield(dtype[, offset])

Возвращает поле заданного массива как определенный тип.

index(sub[, start, end])

Как find, но вызывает ValueError когда подстрока не найдена.

isalnum()

Возвращает true для каждого элемента, если все символы в строке являются буквенно-цифровыми и есть хотя бы один символ, иначе false.

isalpha()

Возвращает true для каждого элемента, если все символы в строке являются буквами и есть хотя бы один символ, иначе false.

isdecimal()

Для каждого элемента в self, вернуть True, если в элементе есть только десятичные символы.

isdigit()

Возвращает true для каждого элемента, если все символы в строке являются цифрами и есть хотя бы один символ, иначе false.

islower()

Возвращает true для каждого элемента, если все символы с регистром в строке в нижнем регистре и есть хотя бы один символ с регистром, иначе false.

isnumeric()

Для каждого элемента в self, возвращает True, если в элементе есть только цифровые символы.

isspace()

Возвращает true для каждого элемента, если в строке есть только пробельные символы и есть хотя бы один символ, иначе false.

istitle()

Возвращает true для каждого элемента, если элемент является строкой с заглавными буквами и содержит хотя бы один символ, иначе false.

isupper()

Возвращает true для каждого элемента, если все символы в строке в верхнем регистре и есть хотя бы один символ, иначе false.

item(*args)

Скопировать элемент массива в стандартный скаляр Python и вернуть его.

join(последовательность)

Возвращает строку, которая является конкатенацией строк в последовательности seq.

ljust(width[, fillchar])

Возвращает массив с элементами self выровнено по левому краю в строке длиной ширина.

lower()

Возвращает массив с элементами self преобразуется в нижний регистр.

lstrip([chars])

Для каждого элемента в self, вернуть копию с удалёнными начальными символами.

nonzero()

Возвращает индексы элементов, которые не равны нулю.

put(indices, values[, mode])

Установить a.flat[n] = values[n] для всех n в индексах.

ravel([order])

Возвращает сглаженный массив.

repeat(repeats[, axis])

Повторить элементы массива.

replace(old, new[, count])

Для каждого элемента в self, возвращает копию строки со всеми вхождениями подстроки старый заменено на новый.

reshape(a.reshape)

Возвращает массив с теми же данными, но новой формой.

resize(a.resize)

Изменение формы и размера массива на месте.

rfind(sub[, start, end])

Для каждого элемента в self, вернуть наивысший индекс в строке, где подстрока sub найдено, такое что sub содержится в [начало, end].

rindex(sub[, start, end])

Как rfind, но вызывает ValueError когда подстрока sub не найдено.

rjust(width[, fillchar])

Возвращает массив с элементами self выровненные по правому краю в строке длиной ширина.

rsplit([sep, maxsplit])

Для каждого элемента в self, возвращает список слов в строке, используя sep в качестве строки-разделителя.

rstrip([chars])

Для каждого элемента в self, возвращает копию с удалёнными завершающими символами.

searchsorted(v[, side, sorter])

Найти индексы, где элементы v должен быть вставлен в a для сохранения порядка.

setfield(val, dtype[, offset])

Поместить значение в указанное место в поле, определённом типом данных.

setflags([write, align, uic])

Установить флаги массива WRITEABLE, ALIGNED, WRITEBACKIFCOPY соответственно.

sort([axis, kind, order, stable])

Сортировать массив на месте.

split([sep, maxsplit])

Для каждого элемента в self, возвращает список слов в строке, используя sep в качестве строки-разделителя.

splitlines([keepends])

Для каждого элемента в self, возвращает список строк в элементе, разбивая по границам строк.

squeeze([axis])

Удалить оси длиной один из a.

startswith(prefix[, start, end])

Возвращает логический массив, который True где строковый элемент в self начинается с префикс, иначе False.

strip([chars])

Для каждого элемента в self, возвращает копию с удаленными начальными и конечными символами.

swapaxes(axis1, axis2, /)

Вернуть представление массива с axis1 и axis2 поменяны местами.

swapcase()

Для каждого элемента в self, вернуть копию строки с преобразованием символов верхнего регистра в нижний и наоборот.

take(indices[, axis, out, mode])

Возвращает массив, сформированный из элементов a по заданным индексам.

title()

Для каждого элемента в self, возвращает версию строки с заглавными буквами: слова начинаются с заглавных символов, все остальные символы в нижнем регистре.

tofile(fid, /[, sep, format])

Запись массива в файл как текст или двоичный (по умолчанию).

tolist()

Вернуть массив как a.ndim-уровневый вложенный список скаляров Python.

translate(table[, deletechars])

Для каждого элемента в self, верните копию строки, где все символы, встречающиеся в необязательном аргументе deletechars удаляются, а оставшиеся символы были отображены через заданную таблицу перевода.

transpose(*axes)

Возвращает представление массива с переставленными осями.

upper()

Возвращает массив с элементами self преобразован в верхний регистр.

view([dtype][, type])

Новое представление массива с теми же данными.

zfill(ширина)

Возвращает числовую строку, заполненную слева нулями, в строке длиной ширина.