Введение. Цель статьи состоит в определении и сопоставлении лингвистических характеристик коротких русскоязычных текстов разных жанров, сгенерированных в языковых нейросетях GigaChat, ChatGPT Марти и Яндекс Алиса. Актуальность исследования состоит в том, что изучение лингвистических характеристик сгенерированных текстов позволило сделать выводы о таких характеристиках названных языковых нейросетей, как способность к построению микротестов по заданным в промпте семантическим параметрам, способность избирать контекстуально релевантные значения слов в тематическом наборе дефиниций, способность к построению текста критической интерпретации высказывания.
Материалы и методы. В качестве материала исследования избраны порожденные названными выше нейросетями языковые выражения и короткие тексты разной функциональной принадлежности – от предложения и семантической дефиниции слова до текста-обоснования собственного ответа нейросети. В качестве основных использовались метод макроструктурного анализа, метод лексико-семантического анализа, метод грамматического анализа, метод стилистического анализа, метод семантико-прагматического анализа.
Анализ. Исследование проводилось по следующему плану: 1) анализ сгенерированных дефиниций слов и предложений, построенных нейросетями из этих дефиниций, 2) анализ сгенерированных контекстуальных дефиниций, 3) анализ сгенерированных коротких текстов на предмет их функционально-семантической адекватности.
Результаты. Работа с тематически связанными дефинициями, сгенерированными названными нейросетями, позволила установить, что данные языковые модели в состоянии согласовывать определения слов с контекстом, не являющимся собственно текстом, то есть могут без специального задания в промте, но исходя из перечня слов в нём, определять тему и давать дефиниции по этой теме. В ходе изучения способности языковых нейросетей давать оценку категориальной и референциальной достоверности высказываний установлено, что все три нейросети оказались в состоянии дать правильные мотивированные ответы, за одним исключением, когда нейросеть указала нехватку информации. В ходе изучения текстов, сгенерированных названными языковыми нейросетями, были выявлены пять основных типов нарушений (дефектов) в них, которые могут квалифицироваться как типичные для этих нейросетей: 1) нарушения логико-семантических связей в тексте, выполнение ложных семантических операций; 2) нарушения бытийных прагматических пресуппозиций (знания о мире, о свойствах предметов); 3) нарушения коммуникативно-прагматических правил речевого поведения; 4) грамматические отклонения в управлении и согласовании; 5) макроструктурные нарушения.
Введение. Актуальность выполненного исследования состоит прежде всего в том, что все более активное обращение самых широких кругов пользователей к генерации текстов разных жанров, свойств и объёмов с помощью так называемых LLM (Large Language Model, Большая Языковая Модель, БЯМ) порождает необходимость изучения собственно лингвистических возможностей этих генеративных моделей, в том числе необходимость лингвистического исследования порождаемых ими текстов. Немаловажным также представляется тот факт, что большое количество специалистов из разных областей деятельности активно используют генеративные возможности языковых нейросетей в своих сугубо профессиональных целях, из чего следует, что качество генерируемых текстов приобрело статус производственного фактора и непосредственным образом влияет на успех в профессиональной деятельности, что также указывает на актуальность предпринятого нами исследования.
Материалы и методы. В качестве объекта исследования были избраны тексты коротких рассказов, поскольку в определенном отношении такого рода тексты могут рассматриваться как архетипические структуры, лежащие в основе текстов некоторых функциональных типов (сценарии, рекламные тексты, рассказы).
Анализ. Такое положение дел потребовало изучения сгенерированных рассказов в том числе в аспекте репрезентации в нём фреймовых структур, поскольку это позволяет составить представление о том, как устроены тексты этого типа с точки зрения стандартной языковой семантики, включая синтаксическую семантику.
Результаты. Установлено, что при всей грамматической, структурно-семантической и композиционной адекватности, сгенерированные в GigaChatPro тексты коротких рассказов, созданные сетью на определенную тему или по определенному фрейму, могут содержать нарушения в глобально-семантической организации, порожденные как пресуппозициональнопрагматическими нарушениями, так и нарушениями текстовой референции. Отмечены также нарушения в общей функциональной прагматике сгенерированных рассказов: выраженная назидательность, длина предложений в них – 5-7 слов свойственны рассказам для детей младшего школьного возраста, при том, что темы этих рассказов изначально не соответствуют их возрастным интересам.