cosine_similarity#

sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)[источник]#

Вычисление косинусного сходства между образцами в X и Y.

Косинусное сходство, или косинусное ядро, вычисляет сходство как нормализованное скалярное произведение X и Y:

K(X, Y) =  / (||X||*||Y||)

На L2-нормированных данных эта функция эквивалентна linear_kernel.

Подробнее в Руководство пользователя.

Параметры:
X{array-like, sparse matrix} формы (n_samples_X, n_features)

Входные данные.

Y{array-like, sparse matrix} формы (n_samples_Y, n_features), default=None

Входные данные. Если None, выходом будут попарные сходства между всеми образцами в X.

dense_outputbool, по умолчанию=True

Возвращать ли плотный вывод, даже если вход разреженный. Если False, выход является разреженным, если оба входных массива разреженные.

Добавлено в версии 0.17: параметр dense_output для плотного вывода.

Возвращает:
сходстваndarray или разреженная матрица формы (n_samples_X, n_samples_Y)

Возвращает косинусное сходство между образцами в X и Y.

Примеры

>>> from sklearn.metrics.pairwise import cosine_similarity
>>> X = [[0, 0, 0], [1, 1, 1]]
>>> Y = [[1, 0, 0], [1, 1, 0]]
>>> cosine_similarity(X, Y)
array([[0.   , 0.   ],
       [0.577, 0.816]])