numpy.random.RandomState.dirichlet#

метод

random.RandomState.dirichlet(alpha, размер=None)#

Извлечь выборки из распределения Дирихле.

Генерировать size выборки размерности k из распределения Дирихле. Случайная величина, распределенная по Дирихле, может рассматриваться как многомерное обобщение бета-распределения. Распределение Дирихле является сопряженным априорным распределением для мультиномиального распределения в байесовском выводе.

Примечание

Новый код должен использовать dirichlet метод Generator экземпляр вместо; пожалуйста, смотрите Быстрый старт.

Параметры:
alphaпоследовательность чисел с плавающей точкой, длина k

Параметр распределения (длина k для выборки длины k).

размерint или кортеж ints, опционально

Форма вывода. Если заданная форма, например, (m, n), затем m * n * k выбираются образцы. По умолчанию None, в этом случае создается вектор длины k возвращается.

Возвращает:
образцыndarray,

Нарисованные выборки, формы (size, k).

Вызывает:
ValueError

Если любое значение в alpha меньше или равно нулю

Смотрите также

random.Generator.dirichlet

который следует использовать для нового кода.

Примечания

Распределение Дирихле — это распределение над векторами \(x\) которые удовлетворяют условиям \(x_i>0\) и \(\sum_{i=1}^k x_i = 1\).

Функция плотности вероятности \(p\) случайного вектора с распределением Дирихле \(X\) пропорционально

\[p(x) \propto \prod_{i=1}^{k}{x^{\alpha_i-1}_i},\]

где \(\alpha\) является вектором, содержащим положительные параметры концентрации.

Метод использует следующее свойство для вычисления: пусть \(Y\) будет случайным вектором, компоненты которого следуют стандартному гамма-распределению, тогда \(X = \frac{1}{\sum_{i=1}^k{Y_i}} Y\) распределено по Дирихле

Ссылки

[1]

Дэвид МакКей, «Теория информации, логический вывод и алгоритмы обучения», глава 23, https://www.inference.org.uk/mackay/itila/

[2]

Википедия, «Распределение Дирихле», https://en.wikipedia.org/wiki/Dirichlet_distribution

Примеры

Взяв пример, приведенный в Википедии, это распределение можно использовать, если нужно разрезать строки (каждая начальной длины 1.0) на K частей с разными длинами, где каждая часть имеет, в среднем, заданную среднюю длину, но допуская некоторую вариацию в относительных размерах частей.

>>> s = np.random.dirichlet((10, 5, 3), 20).transpose()
>>> import matplotlib.pyplot as plt
>>> plt.barh(range(20), s[0])
>>> plt.barh(range(20), s[1], left=s[0], color='g')
>>> plt.barh(range(20), s[2], left=s[0]+s[1], color='r')
>>> plt.title("Lengths of Strings")
../../../_images/numpy-random-RandomState-dirichlet-1.png