Извлечение метаинформации о документе
Функция todocmeta() позволяет извлекать метаинформацию о документе, например, название, имя автора, ключевые слова, тема, время создания, время последнего изменения и количество страниц документа.
Синтаксис
Аргументы
Функция принимает следующие обязательные неименованные параметры:
Параметр |
Пояснение |
title |
Название |
author |
Автор документа |
keyword |
Ключевые слова |
subject |
Тема документа |
time_created |
Время создания |
time_modified |
Время последнего изменения |
num_pages |
Количество страниц |
Возвращаемое значение — текст, для параметра num_pages — целое число, а для параметров time_created и time_modified — Date/Time.
Пример
Следующее правило извлекает ключевые слова-существительные и выводит метаинформацию о документе в качестве атрибутов результата.
Фрагмент правила
rule: метаинформация
{
query: {keyword(noun)}:m
result: Ключевое слово = $m
attribute: Название = todocmeta(title)
attribute: Автор = todocmeta(author)
attribute: Ключевые слова = todocmeta(keyword)
attribute: TeMa = todocmeta(subject)
attribute: Время создания = todocmeta(time_created)
attribute: Время последнего изменения = todocmeta(time_modified)
attribute: Количество страниц = todocmeta(num_pages)
}
На изображении ниже показано, как полученные результаты выглядят в отчете узла «Извлечение сущностей».