Команда Анастасии Быстровой, сотрудницы ANR-Lab, выступила на конференции Диалог-2023
Исследователи выступили с докладом в основной программе Диалога-2023 – ведущей конференции по компьютерной лингвистике в России. Их статья Parameter-Efficient Tuning of Transformer Models for Anglicism Detection and Substitution in Russian была опубликована в сборнике конференции.
Даниил Лукичёв, Дарья Крянина, Анастасия Быстрова, Алёна Феногенова и Мария Тихонова создали датасет из >1000 пар параллельных предложений: одно из предложений в паре – с актуальным англицизмом, второе – с русскоязычным аналогом. Данный датасет был скачан уже более 100 раз.
При помощи данного датасета были обучены две модели:
- модель для детекции англицизмов
- модель для перефразирования англицизмов
Эти модели особенно актуальны в свете недавнего изменения Федерального закона "О государственном языке Российской Федерации", ограничивающего использование англицизмов.
В своём исследовании Анастасия и её коллеги опиралась на публикации, в написании которых участвовал научный сотрудник ANR-Lab Илья Карпов: Comparative Analysis of Anglicism Distribution in Russian Social Network Texts и A General Method Applicable to the Search for Anglicisms in Russian Social Network Texts.