numpy.random.RandomState.dirichlet#
метод
- random.RandomState.dirichlet(alpha, размер=None)#
Извлечь выборки из распределения Дирихле.
Генерировать
sizeвыборки размерности k из распределения Дирихле. Случайная величина, распределенная по Дирихле, может рассматриваться как многомерное обобщение бета-распределения. Распределение Дирихле является сопряженным априорным распределением для мультиномиального распределения в байесовском выводе.Примечание
Новый код должен использовать
dirichletметодGeneratorэкземпляр вместо; пожалуйста, смотрите Быстрый старт.- Параметры:
- alphaпоследовательность чисел с плавающей точкой, длина k
Параметр распределения (длина
kдля выборки длиныk).- размерint или кортеж ints, опционально
Форма вывода. Если заданная форма, например,
(m, n), затемm * n * kвыбираются образцы. По умолчанию None, в этом случае создается вектор длиныkвозвращается.
- Возвращает:
- образцыndarray,
Нарисованные выборки, формы
(size, k).
- Вызывает:
- ValueError
Если любое значение в
alphaменьше или равно нулю
Смотрите также
random.Generator.dirichletкоторый следует использовать для нового кода.
Примечания
Распределение Дирихле — это распределение над векторами \(x\) которые удовлетворяют условиям \(x_i>0\) и \(\sum_{i=1}^k x_i = 1\).
Функция плотности вероятности \(p\) случайного вектора с распределением Дирихле \(X\) пропорционально
\[p(x) \propto \prod_{i=1}^{k}{x^{\alpha_i-1}_i},\]где \(\alpha\) является вектором, содержащим положительные параметры концентрации.
Метод использует следующее свойство для вычисления: пусть \(Y\) будет случайным вектором, компоненты которого следуют стандартному гамма-распределению, тогда \(X = \frac{1}{\sum_{i=1}^k{Y_i}} Y\) распределено по Дирихле
Ссылки
[1]Дэвид МакКей, «Теория информации, логический вывод и алгоритмы обучения», глава 23, https://www.inference.org.uk/mackay/itila/
[2]Википедия, «Распределение Дирихле», https://en.wikipedia.org/wiki/Dirichlet_distribution
Примеры
Взяв пример, приведенный в Википедии, это распределение можно использовать, если нужно разрезать строки (каждая начальной длины 1.0) на K частей с разными длинами, где каждая часть имеет, в среднем, заданную среднюю длину, но допуская некоторую вариацию в относительных размерах частей.
>>> s = np.random.dirichlet((10, 5, 3), 20).transpose()
>>> import matplotlib.pyplot as plt >>> plt.barh(range(20), s[0]) >>> plt.barh(range(20), s[1], left=s[0], color='g') >>> plt.barh(range(20), s[2], left=s[0]+s[1], color='r') >>> plt.title("Lengths of Strings")