knownword
Назначение
Находит документы, содержащие слова из указанного словаря. Данная функция является аналогом функции dictword().
Аргументы
Функция принимает несколько аргументов.
Аргумент dict_category позволяет указать категорию словаря. Данный аргумент является обязательным и может принимать одно из нижеперечисленных значений:
-
Companies
-
GeoAdministrative
-
HumanNames
-
Morphology
-
Organizations
-
Phrases
-
Statistics
-
Synonyms
-
StopLists
-
WordClasses
-
UserDictionary
Аргумент dict_name является опциональным и позволяет указать имя словаря. При отсутствии данного аргумента учитываются все словари в указанной категории. Вместо этого опционального аргумента можно использовать именованный параметр dict.
Таким образом, knownword(Morphology, Default) = knownword(Morphology, dict:=Default).
Кроме того, knownword(WordClasses) поддерживает опциональный именованный параметр сlass. Он задает имя класса или нескольких классов через вертикальную черту. Например, knownword(WordClasses, сlass:=positive|negaive).
Функция также поддерживает произвольное число опциональных именованных параметров, позволяющих устанавливать ограничения для полей словарной статьи. Значение ограничения должно быть заключено в кавычки. Список полей, для которых можно указывать ограничения, зависит от категории словаря и приведен в таблице ниже:
категория словаря |
колонка |
допустимые значения |
примеры |
Companies/Organizations |
Type |
см. редактор словарей |
knownword(companies, "type=ООО|ОАО") |
Country |
см. редактор словарей |
knownword(companies, "country=россия|германия") |
|
Industry |
см. редактор словарей |
knownword(companies, "industry!=страхование") |
|
Geoadministrative |
Category |
continent, country, region, city |
knownword(geoadministrative, "category=country") |
World part |
см. редактор словарей |
knownword(geoadministrative, "category=country", "world part!=азия") |
|
Country |
см. редактор словарей |
knownword(geoadministrative, "category=city", "country=германия|франция") |
|
Region |
см. редактор словарей |
knownword(geoadministrative, "category=city", "region=ханты-мансийский ао|ямало-ненецкий ао") |
|
Population |
числовое значение |
knownword(geoadministrative, "category=country", "population > 100000") |
|
HumanNames |
Type |
first name, surname |
knownword(humannames, "type=first name") |
Gender |
male, female |
knownword(humannames, "gender=female") |
|
Statistics |
Support |
числовое значение |
knownword(statistics, "support<100") |
Frequency |
числовое значение |
knownword(statistics, "frequency>10000") |
При указании ограничения на значение поля можно использовать следующие операторы:
-
=
-
<
-
>
-
!=
-
<=
-
>=
Функция также поддерживает следующие опциональные именованные параметры:
-
allow_punct:=yes/no: допускает или запрещает наличие пунктуации между аргументами (значение по умолчанию - "yes");
-
allow_space:=yes/no допускает или запрещает наличие пробела между аргументами (значение по умолчанию - "yes");
-
match:=range извлекает словарное вхождение полностью, включая знаки пунктуации.