pandas.util.hash_array#
- pandas.util.hash_array(vals, кодировка='utf8', hash_key='0123456789123456', категоризировать=True)[источник]#
Для одномерного массива возвращает массив детерминированных целых чисел.
- Параметры:
- valsndarray или ExtensionArray
- кодировкаstr, по умолчанию ‘utf8’
Кодировка для данных и ключа, когда строки.
- hash_keystr, по умолчанию _default_hash_key
Hash_key для строкового ключа для кодирования.
- категоризироватьbool, по умолчанию True
Сначала ли категоризировать массивы объектов перед хешированием. Это более эффективно, когда массив содержит повторяющиеся значения.
- Возвращает:
- ndarray[np.uint64, ndim=1]
Хешированные значения, той же длины, что и vals.
Примеры
>>> pd.util.hash_array(np.array([1, 2, 3])) array([ 6238072747940578789, 15839785061582574730, 2185194620014831856], dtype=uint64)