Статья: ПРИМЕНЕНИЕ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ИРОНИИ В РУССКОЯЗЫЧНЫХ ТЕКСТАХ

Скачать

В работе исследуются автоматические методы классификации русскоязычных предложений на два класса: содержащие и не содержащие ироничный посыл. Рассматриваемые методы могут быть разделены на три категории: классификаторы на основе эмбеддингов языковых моделей, классификаторы с использованием информации о тональности и классификаторы с обучением эмбеддингов обнаружению иронии. Составными элементами классификаторов являются нейронные сети, такие как BERT, RoBERTa, BiLSTM, CNN, а также механизм внимания и полносвязные слои. Эксперименты по обнаружению иронии проводились с использованием двух корпусов русскоязычных предложений: первый корпус составлен из публицистических текстов из открытого корпуса OpenCorpora, второй корпус является расширением первого и дополнен ироничными предложениями с ресурса Wiktionary. Лучшие результаты продемонстрировала группа классификаторов на основе чистых эмбеддингов языковых моделей с максимальным значением F-меры 0.84, достигнутым связкой из RoBERTa, BiLSTM, механизма внимания и пары полносвязных слоев в ходе экспериментов на расширенном корпусе. В целом использование расширенного корпуса давало результаты на 2-5% выше результатов на базовом корпусе. Достигнутые результаты являются лучшими для рассматриваемой задачи в случае русского языка и сравнимы с лучшими для английского.

Информация о документе

Формат документа: PDF
Кол-во страниц: 1 страница
Загрузил(а): Костерин Максим
Лицензия: —
Доступ: Всем

Информация о статье

ISSN: 1818-1015
EISSN: 2313-5417
Журнал: МОДЕЛИРОВАНИЕ И АНАЛИЗ ИНФОРМАЦИОННЫХ СИСТЕМ
Год публикации: 2024
Автор(ы): Костерин М. А., Парамонов И. В.
Ключевые фразы: ОБНАРУЖЕНИЕ ИРОНИИ, ОБНАРУЖЕНИЕ САРКАЗМА, НЕЙРОСЕТЕВОЙ КЛАССИФИКАТОР, глубокое обучение, обработка естественного языка, BERT
УДК: 004.912. Обработка текста

Статистика просмотров

Статистика просмотров статьи за 2025 год.

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – Сайт) представляет собой платформу, на которой пользователи самостоятельно добавляют и публикуют метаинформацию о материалах разных видов (названия, обложки, аннотации, данные об авторах и т.п.). Администрация Сайта не занимается самостоятельным сбором или первоначальной публикацией этих сведений.

Модерация контента

На Сайте действует постмодерация. Это означает, что материалы, добавляемые пользователями, становятся общедоступными сразу после публикации и проверяются Администрацией Сайта постфактум в разумные сроки.

Использование информации

Администрация Сайта не использует метаданные и обложки документов в коммерческих или рекламных целях для продвижения товаров или услуг и не заявляет о каких-либо правах на представленные объекты интеллектуальной собственности. Все права на документы и сопутствующие материалы принадлежат их законным правообладателям.

Отказ от гарантий

Администрация Сайта не гарантирует точность, полноту и достоверность метаинформации, размещенной пользователями, поскольку не осуществляет ее предварительную проверку.

Ответственность

Сайт носит исключительно информационно-справочный характер. Администрация Сайта не несет ответственности за содержание и достоверность информации, добавленной пользователями, а также за любые убытки, возникшие в связи с использованием или невозможностью использования Сайта и размещенной на нем информации.