Словари Embeddings (векторы слов)
Словарь Embeddings (векторы слов) – это специальный словарь, который представляет собой список слов и показатели связи этих слов с другими словами. Данные показатели основаны на представлении слов в виде ряда векторов в n-мерном пространстве.
Связь слов показана в колонке Схожесть, значение которой уникально для каждого слова.

Векторное представление слов основано на их контекстуальной близости: слова, которые встречаются в тексте рядом с одними и теми же словами, имеют высокое косинусное сходство (cosine similarity) в векторном представлении.
Косинусное сходство (cosine similarity) показывает меру сходства между последовательностью чисел, где каждое слово в числовом представлении имеет свою собственную координату, а анализируемый текст представлен вектором чисел, которые показывают вхождения слова в данном документе.

Редактирование словарей Embeddings
Окно редактора словаря Embeddings разделено на две части: слева представлен список слов и их частей речи, справа – карточка выбранного слова. Щелкните на любое слово в списке, чтобы увидеть его ближайшие лексемы и их сходство.

Чтобы изменить настройки внешнего вида словарной статьи, нажмите кнопку Настройки отображения .

Вы можете установить максимальное количество отображаемых лексем, а также расстояние между ближайшими лексемами. Установите чекбокс Использовать фильтрацию по одной и той же части речи, чтобы отфильтровать записи по выбранной части речи.
Нажмите на кнопку кнопка-переключатель, чтобы перейти в расширенный режим просмотра словаря.

В этом режиме вы можете отфильтровать список лексем, установить минимальное расстояние между лексемами, а также указать количество загружаемых лексем.

Генерация словаря Embeddings
Словарь Embeddings может быть сгенерирован через узел Индекс.
Откройте окно просмотра результатов узла и выберите вкладку Лексемы

Откройте выпадающее меню Сгенерировать и выберите опцию Словарь векторов слов (Embeddings).

Заполните необходимые поля и нажмите OK.

Созданный словарь появится в Менеджере словарей.

Генерация словаря Синонимов из словаря Embeddings
Вы можете создать словарь синонимов из словаря Embeddings. Для этого нажмите кнопку Создание синонимов на панели инструментов.

Введите название словаря, установите расстояние между записями и максимальное количество соседей. Выберите хотя бы одну часть речи. Если часть речи не выбрана, будет создан пустой словарь.
Установите чекбокс Использовать заранее рассчитанные расстояния, чтобы объединить записи нового словаря на предварительно рассчитанной основе.
Как только операция будет завершена, перейдите в словарь Синонимов и проверьте наличие сгенерированного словаря.

Дважды щелкните на созданный словарь, чтобы просмотреть извлеченные синонимы.

Работа со словарем синонимов описана здесь.