• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Команда Анастасии Быстровой, сотрудницы ANR-Lab, выступила на конференции Диалог-2023

Команда Анастасии Быстровой, сотрудницы ANR-Lab, выступила на конференции Диалог-2023

Исследователи выступили с докладом в основной программе Диалога-2023 – ведущей конференции по компьютерной лингвистике в России. Их статья Parameter-Efficient Tuning of Transformer Models for Anglicism Detection and Substitution in Russian была опубликована в сборнике конференции

Даниил Лукичёв, Дарья Крянина, Анастасия Быстрова, Алёна Феногенова и Мария Тихонова создали датасет из >1000 пар параллельных предложений: одно из предложений в паре – с актуальным англицизмом, второе – с русскоязычным аналогом. Данный датасет был скачан уже более 100 раз.

При помощи данного датасета были обучены две модели:

  • модель для детекции англицизмов
  • модель для перефразирования англицизмов  

Эти модели особенно актуальны в свете недавнего изменения Федерального закона "О государственном языке Российской Федерации", ограничивающего использование англицизмов.

В своём исследовании Анастасия и её коллеги опиралась на публикации, в написании которых участвовал научный сотрудник ANR-Lab Илья Карпов: Comparative Analysis of Anglicism Distribution in Russian Social Network Texts и A General Method Applicable to the Search for Anglicisms in Russian Social Network Texts.