Статьи в выпуске: 5
Russian is a language widely spoken worldwide. While it is one of the official languages of the United Nations, it is still predominantly spoken in Russia and the countries of the former Soviet Union, although about 30 million speakers abroad have a near-native proficiency in Russian, and about 70 million speak it as a foreign language. However, there are efforts to diversify the use of Russian as a world language and promote its use in other regions and contexts. Russian is a pluricentric language, meaning that it has multiple centers of use and standardisation. In addition to Russia, where it is the official language, Russian is also widely spoken in several other countries, including Belarus, Kazakhstan, and Kyrgyzstan. As a result, there is a great deal of linguistic diversity within the Russian-speaking world, which creates a stronger potential to increase linguistic diversity even further and promote the use of a wider range of linguistic varieties and dialects. By recognising the different varieties of Russian and promoting their use in different contexts, it may be possible to improve communication between Russian speakers from different regions and countries. By maintaining the use of Russian in different cultural contexts, it may be possible to facilitate greater cultural exchange and understanding between different parts of the world. Russian as a language of commerce and trade facilitates greater economic cooperation between different countries and regions.
Статья содержит анализ принципов, на которых базируется современная русская орфография, и отдельных правил, основанных на том или ином орфографическом принципе. Рассматриваются этапы корректировки свода правил русской орфографии (1956 г., 2006 г., 1999 г., 2006 г., 2021 г.) и анализируется структура различных орфографических сводов. Приводятся критические замечания к своду, созданному группой авторов в 2021 г.
В ходе онтогенеза дети учатся не только формулировать высказывания, но и самостоятельно исправлять свою речь, как это обычно делают взрослые во время разговора. Это помогает детям с течением времени стать более уверенными в себе и эффективными коммуникаторами. В статье представлены результаты изучения того, как дети самостоятельно корректируют свою речь в ходе телевизионного ток-шоу «Лучше всех!» Первого канала российского телевидения. Спонтанная речь в такой ситуации предполагает достаточно быстрый обмен репликами исходя из контекста и цели общения. Частью программы является интервью ведущего с ребенком, которое позволяет охарактеризовать личность героя передачи, создать связь с аудиторией и вызвать больший интерес к способностям ребенка. В исследовании, построенном на основе конверсационного анализа, рассматриваются различные виды самокоррекции (замены, повторы, добавления, обрывы), их функции, контекст и роль в диалоге. Полученные результаты свидетельствуют о том, что самоисправления являются как следствием трудностей при подборе лексики, так и отражением процесса поиска ребенком наиболее эффективного способа выражения мыслей. Кроме того, исследование показало, что различные проявления самокоррекции свойственны детям начиная с двух лет и сохраняются в дошкольном и младшем школьном возрасте.
In this research paper, I investigate the controlled text generation capabilities of ruGPT3Large through fine-tuning, specifically focusing on generating movie reviews based on a designated sentiment attribute. Controlled text generation is an active area of inquiry within the domain of Natural Language Processing, particularly for the Russian language. This study exemplifies a simple approach to controllable text generation by training ruGPT3 on a textual dataset containing sentiment-marked prompts, enabling the model to recognize patterns and generate analogous texts. The research provides a comprehensive analysis of the limitations, shortcomings and merits of fine-tuning a large language model using prompts embedded in a dataset. The generated texts exhibit coherence, logical structure, abundant coreferential links, and narratives and vocabularies characteristic of film reviews. Nevertheless, ruGPT3-generated reviews exhibit certain linguistic errors. I classify the most prevalent errors, such as named entity confusion, grammatical gender inconsistencies and sentiment fluctuations. Given that the primary objective is to evaluate the efficacy of basic fine-tuning with respect to the specified attribute, both automatic sentiment analysis and human evaluation are employed for output assessment. In comparing the outputs of the fine-tuned model and the baseline ruGPT3Large, I observe that positive sentiment generation is the most successful, while neutral and negative sentiments are produced by the models less accurately.
В статье рассматривается словарное представление пласта устаревшей лексики, известной в современном русском языке, в «Словаре русского языка XXI в.», на основе чего делаются выводы о месте лексико-семантических единиц прошлого в языке другой эпохи, семантических и стилистических процессах, характерных для функционирования устаревшей лексики в современном языке. Реализуется методика изучения лексики по лексикографическим данным, при которой толковый словарь современного языка, создаваемый по принципам антропоцентрической лексикографии, выступает и как итог описания национального языка, и как источник его изучения. Была подтверждена принципиальная неоднородность пласта устаревшей лексики в современном языке, по разным принципам строится лексикографическое описание историзмов и архаизмов разного типа. Обязательным элементом толкования историзмов является указание на время бытования обозначаемой ими реалии, толкование содержит элементы энциклопедизма. Ряд историзмов в современном употреблении развивает переносную семантику. Эти значения по возможности фиксируются Словарем, хотя естественно запаздывание лексикографической фиксации. Активным процессом современного этапа развития языка является актуализация историзмов, таким образом, в языке происходит регулярное перераспределение лексики между активным и пассивным запасом. В антропоцентрически ориентированном словаре актуализированные значения историзмов помещаются выше генетически первичных, но устаревших в современном языке. В словарных статьях, описывающих архаизмы, специальные пометы и подтолкования демонстрируют роль архаизмов как мощного стилистического ресурса. Отмечается использование архаизмов в стилизованной речи, в функции поэтизмов, с особой эмоционально-экспрессивной окраской, очень подробно описываются семантические нюансы и стилистические особенности таких употреблений. Подробная лексикографическая интерпретация устаревшей лексики в Словаре дает читателям словарей важную информацию о грамотном использовании этого пласта лексики и показывает преемственность языка разных эпох, являющуюся важнейшим свойством живой языковой системы.