Невербальные маркеры эмоций для сентимент-анализа русскоязычных интернет-текстовНевербальные маркеры эмоций для сентимент-анализа русскоязычных интернет-текстов Статья посвящена описанию начальных этапов проекта по разработке классификатора интернеттекстов на русском языке по критерию эмоциональной тональности. Целью проекта является создание алгоритма сентимент-анализа, атрибутирующего тексты к одному из 8 классов эмоций по модели «куб Лёвхейма». Необходимыми этапами проекта выступают тщательный отбор языкового материала для обучающей выборки, его независимая экспертная разметка, экспертный лингвистический анализ полученных данных для выделения маркеров эмоций, их валидация инструментами корпусной лингвистики и – при условии подтверждения значимости их показателей в корпусах эмоций – валидация в работе прототипа классификатора. Автор исследует возможность использования невербальных маркеров эмоций в качестве параметров классификации: в результате лингвистического анализа обнаруживаются два потенциальных параметра – фиксация лексем заглавными буквами и цифровой формат числительных. Двойная валидация выявленных маркеров позволяет определить, какой из данных маркеров вызывает положительную динамику точности классификации. Маркер графической передачи числительных приводит к увеличению общей точности работы алгоритма сентимент-анализа на 2 %, а также к приросту точности классификации для классов Интерес на 7 %, классов Удивление и Радость – на 3 %. Отмечается, что тип невербальных маркеров по своей эффективности для сентимент-анализа текстов незначительно отстает от лексико-семантических и пунктуационных вербальных маркеров и находится на одном уровне с синтаксическими вербальными маркерами. Результаты исследования указывают на необходимость рассмотрения данного типа маркеров наряду с вербальными маркерами эмоций и более подробного изучения конкретных маркеров для их использования в качестве параметров классификатора. Итого: 90.00руб. Купить Вы можете купить электронную версию издания «Невербальные маркеры эмоций для сентимент-анализа русскоязычных интернет-текстов». После оплаты (для архивов) оно будет доступно в Личном Кабинете в разделе «Электронные издания». В случае оформления подписки, издание будет доступно по мере поступления от издателя. Формат PDF/HTML. Стоимость — от 90.00 руб. |