Архив статей журнала

ПРИЕМЫ И СПОСОБЫ ЛЕКСИКОГРАФИРОВАНИЯ УСТАРЕВШЕЙ ЛЕКСИКИ В "СЛОВАРЕ РУССКОГО ЯЗЫКА XXI В." КАК ПОКАЗ СВЯЗИ РАЗНЫХ ЭПОХ (2022)
Выпуск: Т. 4 № 1 (2022)
Авторы: Генералова Елена Владимировна

В статье рассматривается словарное представление пласта устаревшей лексики, известной в современном русском языке, в «Словаре русского языка XXI в.», на основе чего делаются выводы о месте лексико-семантических единиц прошлого в языке другой эпохи, семантических и стилистических процессах, характерных для функционирования устаревшей лексики в современном языке. Реализуется методика изучения лексики по лексикографическим данным, при которой толковый словарь современного языка, создаваемый по принципам антропоцентрической лексикографии, выступает и как итог описания национального языка, и как источник его изучения. Была подтверждена принципиальная неоднородность пласта устаревшей лексики в современном языке, по разным принципам строится лексикографическое описание историзмов и архаизмов разного типа. Обязательным элементом толкования историзмов является указание на время бытования обозначаемой ими реалии, толкование содержит элементы энциклопедизма. Ряд историзмов в современном употреблении развивает переносную семантику. Эти значения по возможности фиксируются Словарем, хотя естественно запаздывание лексикографической фиксации. Активным процессом современного этапа развития языка является актуализация историзмов, таким образом, в языке происходит регулярное перераспределение лексики между активным и пассивным запасом. В антропоцентрически ориентированном словаре актуализированные значения историзмов помещаются выше генетически первичных, но устаревших в современном языке. В словарных статьях, описывающих архаизмы, специальные пометы и подтолкования демонстрируют роль архаизмов как мощного стилистического ресурса. Отмечается использование архаизмов в стилизованной речи, в функции поэтизмов, с особой эмоционально-экспрессивной окраской, очень подробно описываются семантические нюансы и стилистические особенности таких употреблений. Подробная лексикографическая интерпретация устаревшей лексики в Словаре дает читателям словарей важную информацию о грамотном использовании этого пласта лексики и показывает преемственность языка разных эпох, являющуюся важнейшим свойством живой языковой системы.

Сохранить в закладках
КАК ЯЗЫК PYTHON ПОМОГАЕТ ЛЕКСИКОГРАФАМ (2022)
Выпуск: Т. 4 № 2 (2022)
Авторы: Ладушина Мария Игоревна

Современные средства компьютерной обработки текста позволили автоматизировать многие рутинные задачи лексикографов и терминологов. Помимо привычных программных средств, применяемых для вспомогательных задач прикладной лексикографии специалистами по составлению терминологических и других словарей, в решении таких задач может помочь язык программирования Python и его библиотеки, такие как NLTK (Natural Language Toolkit), pymorphy2, mystem и др. Python - один из самых распространенных и доступных в изучении языков программирования, который все шире применяется в прикладной лингвистике. Статья продолжает цикл публикаций, знакомящих практикующих лингвистов и лексикографов с Python и его возможностями для обработки текстов на естественном языке (natural language processing). Описываются техники, которые можно использовать для предварительной обработки текстов с целью последующего извлечения из них терминологии и составления терминологических словарей, в том числе для нужд письменного перевода. В настоящее время эта задача пересекается с использованием систем машинного перевода, в ряде которых реализована функция приоритетного использования пользовательского терминологического двуязычного словаря. Кроме того, некоторые из описанных приемов помогут извлечь информацию из больших корпусов текстов и проанализировать их содержание. В статье описывается порядок выполнения токенизации и лемматизации текста или корпуса текстов, приемы для выделения наиболее частотных лемм, рассматриваются разные подходы к поиску в тексте частотных словосочетаний методом нахождения n-грамм. Техники для автоматического нахождения потенциальных узкоспециальных терминов проиллюстрированы примерами из научно-технического текста. На материале художественного текста показаны методы анализа содержания, например, подсчет частотности определенных лемм в корпусе. Все приведенные примеры кода можно скопировать и запустить в облачной среде Google Colab без установки каких-либо программ на компьютер. Надеемся, что эти приемы облегчат повседневную работу лексикографов, а может быть, и побудят лингвистов к изучению языка Python.

Сохранить в закладках