Настройка узла Сравнение текстов
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
Сначала необходимо выбрать две колонки из исходной таблицы данных на вкладке Колонки. В поле справа представлены методы сравнения текстов:
-
Сравнение записей из двух колонок
-
Сравнение записей с одинаковым ключом
-
Сравнение записей одной колонки
Выберите метод сравнения, затем перетащите колонку из списка Доступные колонки в поле справа (таких полей может быть несколько в зависимости от выбранного метода сравнения).
Сравнение записей из двух колонок
Для сравнения записей из двух колонок укажите данные колонки в полях Оригинальная колонка и Измененная колонка. Записи из этих двух колонок сравниваются попарно.

Сравнение записей с одинаковым ключом
Документы сравниваются на основе совпадающего ключа для записей. Ключом выступает колонка, выбранная в качестве Дополнительной колонки для выбранного метода сравнения; эта колонка может быть любого типа данных.

Все получившиеся пары будут включать первую найденную запись с указанным значением ключа. Эта запись будет считаться основной.
Чтобы указать, будет ли первая запись сравниваться с одной последующей ил со всеми последующими записями, отметьте галочкой опцию Сравнить первую запись с одной последующей записью или Сравнить первую запись со всеми последующими записями.
Сравнение записей одной колонки
Документы сравниваются в последовательном порядке, т.е. первая запись (строка) колонки сравнивается со второй, вторая запись сравнивается с третьей и т.д.

Параметры сравнения
На вкладке Настройки в поле Игнорировать, чтобы не учитывать заглавные, пунктуацию и цифры при сравнении документов.

Вы также можете не учитывать формы слова или определенную часть речи.

Или указать определенные классы слов, записи из которых не будут браться для сравнения.

Подробнее о классах слов см. здесь.
В поле Точность сравнения выберите критерий, по которому будут сравниваться тексты. По умолчанию узел сравнивает тексты по токенам. При выборе значения Предложения узел будет сравнивать тексты по предложениям: отчет узла будет содержать информацию о предложениях, в которых были найдены различия (вне зависимости от количества отличающихся токенов).
