Настройка узла Сравнение текстов
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Окно Настройки узла Сравнение текстов включает три вкладки: Колонки, Настройки и Общие.

Сначала необходимо выбрать две колонки из исходной таблицы данных на вкладке Колонки. В поле справа представлены методы сравнения текстов:

  • Сравнение записей из двух колонок

  • Сравнение записей с одинаковым ключом

  • Сравнение записей одной колонки

Выберите метод сравнения, затем перетащите колонку из списка Доступные колонки в поле справа (таких полей может быть несколько в зависимости от выбранного метода сравнения).

Сравнение записей из двух колонок

Для сравнения записей из двух колонок укажите данные колонки в полях Оригинальная колонка и Измененная колонка. Записи из этих двух колонок сравниваются попарно.

text compare columns.rus
Сравнение записей с одинаковым ключом

Документы сравниваются на основе совпадающего ключа для записей. Ключом выступает колонка, выбранная в качестве Дополнительной колонки для выбранного метода сравнения; эта колонка может быть любого типа данных.

text compare columns key.rus

Все получившиеся пары будут включать первую найденную запись с указанным значением ключа. Эта запись будет считаться основной.

Чтобы указать, будет ли первая запись сравниваться с одной последующей ил со всеми последующими записями, отметьте галочкой опцию Сравнить первую запись с одной последующей записью или Сравнить первую запись со всеми последующими записями.

Сравнение записей одной колонки

Документы сравниваются в последовательном порядке, т.е. первая запись (строка) колонки сравнивается со второй, вторая запись сравнивается с третьей и т.д.

text compare columns order.rus
Параметры сравнения

На вкладке Настройки в поле Игнорировать, чтобы не учитывать заглавные, пунктуацию и цифры при сравнении документов.

text compare options.rus

Вы также можете не учитывать формы слова или определенную часть речи.

text compare options words.rus

Или указать определенные классы слов, записи из которых не будут браться для сравнения.

text compare options keywords.rus

Подробнее о классах слов см. здесь.

В поле Точность сравнения выберите критерий, по которому будут сравниваться тексты. По умолчанию узел сравнивает тексты по токенам. При выборе значения Предложения узел будет сравнивать тексты по предложениям: отчет узла будет содержать информацию о предложениях, в которых были найдены различия (вне зависимости от количества отличающихся токенов).

text compare accuracy.rus