Введение в анализ тональности текста

Анализ тональности текста отвечает на вопрос "Какие чувства испытывал говорящий или автор текста в отношении определенного объекта или ситуации?". С появлением социальных сетей анализ тональности стал популярным способом сбора мнений и оценок того или иного объекта, особенно в таких сферах, где важно знать мнение покупателей о продуктах или услугах. Результаты анализа тональности текста позволяют аналитикам определить достоинства и недостатки продуктов, что, в свою очередь, позволит исправить последние и повысить качество продукции.

В системе PolyAnalyst анализ тональности текста выполняется с помощью специальных правил на языке XPDL и словарей. Домен текста (его тематическая область) определяет выбор правил, используемых для извлечения тональностей. Правила, используемые для извлечения тональностей в рамках одного домена, не могут быть использованы для другого.

Слово мало само по себе не является ни положительным, ни отрицательным.

В модели ["очень" + "мало" + название продукта] в домене Рестораны слово мало имеет отрицательную тональность: "очень мало бекона в сэндвиче".

В домене Техника фраза "мало памяти" имеет отрицательную коннотацию, а вот фраза "принтер использует мало чернил" — положительную.

После того, как в зависимости от указанного домена будут определены объекты оценки, PolyAnalyst классифицирует их по аспектам.

Аспекты позволяют учитывать разные способы описания свойств одной и той же сущности в пределах одного тематического домена. Например, следующие слова составляют аспект "Персонал": специалист, член коллектива, сотрудник, коллега.

Предложение "Бургер был классный, но официант грубил" имеет два аспекта "Еда" (бургер) и "Персонал" (официант), и оба они принадлежат к домену "Рестораны".

Система аспектов основана на выделении головных объектов.