Библиотеки для векторного поиска текста

8 октября, 2022
1 минута чтения

Векторный поиск текста представляет собой более релевантный поиск по тексту, использующий сходство данных вместо посимвольного совпадения в словах. Ключевым отличием SPTAG (Space Partition Tree and Graph) от полнотекстового поиска является то, что в своей основе, входной запрос преобразуется в вектор, который, в свою очередь, производит поиск через глубину дерева, посредствам алгоритма ANN (approximate nearest neighbors).

Такой поиск Microsoft использует в своем движке Bing. Библиотека SPTAG написана на C++ и выложена в открыты доступ — https://github.com/Microsoft/SPTAG

К сожалению, SPTAG не работает на маке. Но есть аналогичный вариант похожего алгоритма NGT, который так же выложен в открытый доступ — https://github.com/yahoojapan/NGT

Денис Сергеевич Басковский

Философ, изобретатель и поэт.

Добавить комментарий Отменить ответ

binlog
Предыдущая статья

Что делать если логи binlog в MySQL стали весить слишком много

Случайный анекдот API
Следующая статья

Отображаем случайный анекдот

Exit mobile version