document

Назначение

Функция используется для поиска документов внутри датасета.

Синтаксис

document([минимальный_номер,] [максимальный_номер,] [аргумент_1,] [аргумент_2,…​])

Аргументы

У функции document() нет обязательных аргументов. При их отсутствии функция извлечет все слова документа. Опциональные параметры минимальный_номер и максимальный_номер определяют минимальный и максимальный номер документа в пределах датасета. В их отсутствие функция ищет документы в пределах всего датасета. При этом все значимые аргументы должны находиться в пределах одного документа. Если первый или второй аргумент функции является числом, то он будет трактоваться как минимальный_номер и максимальный_номер соответственно.

Если указаны как первые числовые аргументы минимальный_номер и максимальный_номер, так и именованные аргументы, то приоритет будет отдаваться последним.

Функция поддерживает следующие опциональные именованные параметры:

Параметр

Пояснение

match:=range

Предложения, содержащие найденные аргументы, будут извлечены целиком.

match:=arguments

Будут извлечены только аргументы, перечисленные в функции.

match:=first/last/shortest/longest

Извлекает первый/последний/самый короткий/самый длинный документ.

whole:=yes

Будут извлечены документы, состоящие только из аргументов, указанных в запросе.

allow_punct:=yes/no

Знаки пунктуации между аргументами последовательности допускаются или запрещаются (по умолчанию allow_punct:=yes).

allow_space:=yes/no

Пробелы между аргументами последовательности допускаются или запрещаются (по умолчанию allow_space:=yes).

min_doc:=<numeral>

Задает минимальный номер документа в датасете.

max_doc:=<numeral>

Задает максимальный номер документа в датасете.

mode:=forward/backward

Указывает позицию от начала/конца датасета.

Примечание
  • Если первый и/или второй аргумент функции является числом, то он будет трактоваться как минимальный_номер и максимальный_номер соответственно.

  • Если указаны как первые числовые аргументы минимальный_номер и максимальный_номер, так и именованные параметры min_doc и max_doc, то приоритет будет отдаваться последним.

Возвращаемое значение

Документы, соответствующие запросу.

Примеры

document(1, 2) найдет первые два документа в датасете.

document(1, 2, mode:=backward) найдет последние два документа в датасете.

document(not аренда) найдет документы, где нет слова «аренда».

Функция document() может использоваться совместно с функциями типа case(), length(), lemma().

case(upper, document()) найдет все документы, написанные в верхнем регистре.

case(upper, document(abc)) найдет те документы, где есть ABC в верхнем регистре.

length(2, document(), count:=word) найдет все документы, содержащие от двух слов.

lemma(noun, document()) найдет документы, состоящие только из существительных.