pandas.util.hash_array#

pandas.util.hash_array(vals, кодировка='utf8', hash_key='0123456789123456', категоризировать=True)[источник]#

Для одномерного массива возвращает массив детерминированных целых чисел.

Параметры:
valsndarray или ExtensionArray
кодировкаstr, по умолчанию ‘utf8’

Кодировка для данных и ключа, когда строки.

hash_keystr, по умолчанию _default_hash_key

Hash_key для строкового ключа для кодирования.

категоризироватьbool, по умолчанию True

Сначала ли категоризировать массивы объектов перед хешированием. Это более эффективно, когда массив содержит повторяющиеся значения.

Возвращает:
ndarray[np.uint64, ndim=1]

Хешированные значения, той же длины, что и vals.

Примеры

>>> pd.util.hash_array(np.array([1, 2, 3]))
array([ 6238072747940578789, 15839785061582574730,  2185194620014831856],
  dtype=uint64)