Извлечение метаинформации о документе

Функция todocmeta() позволяет извлекать метаинформацию о документе, например, название, имя автора, ключевые слова, тема, время создания, время последнего изменения и количество страниц документа.

Синтаксис

todocmeta(метаинформация)

Аргументы

Функция принимает следующие обязательные неименованные параметры:

Параметр

Пояснение

title

Название

author

Автор документа

keyword

Ключевые слова

subject

Тема документа

time_created

Время создания

time_modified

Время последнего изменения

num_pages

Количество страниц

Возвращаемое значение — текст, для параметра num_pages — целое число, а для параметров time_created и time_modified — Date/Time.

Пример

Следующее правило извлекает ключевые слова-существительные и выводит метаинформацию о документе в качестве атрибутов результата.

xpdl format func docmeta rule rus
Фрагмент правила
 rule: метаинформация
 {
 query: {keyword(noun)}:m

 result: Ключевое слово = $m
 attribute: Название = todocmeta(title)
 attribute: Автор = todocmeta(author)
 attribute: Ключевые слова = todocmeta(keyword)
 attribute: TeMa = todocmeta(subject)
 attribute: Время создания = todocmeta(time_created)
 attribute: Время последнего изменения = todocmeta(time_modified)
 attribute: Количество страниц = todocmeta(num_pages)
 }

На изображении ниже показано, как полученные результаты выглядят в отчете узла «Извлечение сущностей».

xpdl format func docmeta output rus