Просмотр результатов узла Оптическое распознавание символов
| Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
Окно просмотра результатов узла Оптическое распознавание символов включает две вкладки: Результаты и Настройки.
Вкладка Результаты разделена на три раздела:
-
панель предварительного просмотра (в левой части);
-
текстовая панель (в правой части);
-
результирующая таблица (в нижней части).
На панели предварительного просмотра пользователи могут:
-
Приблизить/отдалить изображение, удерживая клавишу Ctrl и поворачивая колесо прокрутки мыши или нажав Увеличить/Уменьшить на панели инструментов;
-
Переместить документ в пределах панели предварительного просмотра путем перетаскивания в необходимом направлении;
-
Прокручивать изображение сверху вниз, повернув колесико мыши к себе или снизу вверх – от себя;
-
Переместить изображение влево или вправо, удерживая клавишу Shift и поворачивая колесо прокрутки мыши;
-
Сбросить текущий вид, нажав Сбросить на панели инструментов;
-
Нажать на область для того, чтобы подсветить соответствующий распознанный фрагмент на текстовой панели. Цвет рамки выбранной области распознавания меняется на зеленый.
-
Перейти к другим страницам документа, используя панель навигации над панелью просмотра.
На текстовой панели:
-
Нажмите на фрагмент текста для выделения соответствующей области на панели предварительного просмотра;
-
Слова, характеризующиеся низкой достоверностью, выделяются синим цветом (при условии, что опция Сохранять информацию о словах с низким уровнем достоверности включена в окне настроек узла).
-
Нажмите ? на панели инструментов для подсвечивания голубым цветом неуверенно распознанного текста.
-
Кнопка Найти на панели инструментов позволяет выполнить поиск слов, фраз, выражений. При необходимости укажите дополнительные условия поиска (чувствительность к регистру, слово целиком, регулярные выражения).
Независимо от выбранных значений в окне настроек узла, результирующая таблица всегда будет содержать следующий минимальный набор колонок:
-
File – содержит сведения о бинарных данных.
-
Recognized – содержит распознанный текст.
-
Нестандартные ситуации и некритические ошибки регистрируются в колонке OCR warning.
-
Колонка OCR message содержит дополнительную информацию, как, например, уведомление об использовании кэша.
-
В колонке OCR confidence отображается метрика достоверности, которая позволяет оценить качество распознавания. Чем ближе значение к 1, тем лучше результаты. Значение 0,9 указывает на то, что алгоритм имел определенные трудности при обработке некоторых фрагментов, а значит, и качество распознавания может быть ниже среднего.
Показатель достоверности рассчитывается только на основании результатов распознавания текста в обозначенных областях. Как можно заметить на скриншоте выше, некоторые текстовые фрагменты изначально могут быть не отмечены для распознавания. По этой причине показатель достоверности считается относительной мерой.