Просмотр результатов узла Оптическое распознавание символов
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Окно просмотра результатов узла Оптическое распознавание символов включает две вкладки: Результаты и Настройки.

Вкладка Результаты разделена на три раздела:

window view results.rus
  • панель предварительного просмотра (в левой части);

  • текстовая панель (в правой части);

  • результирующая таблица (в нижней части).

На панели предварительного просмотра пользователи могут:

  • Приблизить/отдалить изображение, удерживая клавишу Ctrl и поворачивая колесо прокрутки мыши или нажав Увеличить/Уменьшить на панели инструментов;

  • Переместить документ в пределах панели предварительного просмотра путем перетаскивания в необходимом направлении;

  • Прокручивать изображение сверху вниз, повернув колесико мыши к себе или снизу вверх – от себя;

  • Переместить изображение влево или вправо, удерживая клавишу Shift и поворачивая колесо прокрутки мыши;

  • Сбросить текущий вид, нажав Сбросить на панели инструментов;

  • Нажать на область для того, чтобы подсветить соответствующий распознанный фрагмент на текстовой панели. Цвет рамки выбранной области распознавания меняется на зеленый.

  • Перейти к другим страницам документа, используя панель навигации над панелью просмотра.

На текстовой панели:

  • Нажмите на фрагмент текста для выделения соответствующей области на панели предварительного просмотра;

  • Слова, характеризующиеся низкой достоверностью, выделяются синим цветом (при условии, что опция Сохранять информацию о словах с низким уровнем достоверности включена в окне настроек узла).

  • Нажмите ? на панели инструментов для подсвечивания голубым цветом неуверенно распознанного текста.

  • Кнопка Найти на панели инструментов позволяет выполнить поиск слов, фраз, выражений. При необходимости укажите дополнительные условия поиска (чувствительность к регистру, слово целиком, регулярные выражения).

Независимо от выбранных значений в окне настроек узла, результирующая таблица всегда будет содержать следующий минимальный набор колонок:

  • File – содержит сведения о бинарных данных.

  • Recognized – содержит распознанный текст.

  • Нестандартные ситуации и некритические ошибки регистрируются в колонке OCR warning.

  • Колонка OCR message содержит дополнительную информацию, как, например, уведомление об использовании кэша.

  • В колонке OCR confidence отображается метрика достоверности, которая позволяет оценить качество распознавания. Чем ближе значение к 1, тем лучше результаты. Значение 0,9 указывает на то, что алгоритм имел определенные трудности при обработке некоторых фрагментов, а значит, и качество распознавания может быть ниже среднего.

    Показатель достоверности рассчитывается только на основании результатов распознавания текста в обозначенных областях. Как можно заметить на скриншоте выше, некоторые текстовые фрагменты изначально могут быть не отмечены для распознавания. По этой причине показатель достоверности считается относительной мерой.