• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Летняя школа ANR-Lab «Web-scraping and API for social scientific research»

Мероприятие завершено

Международная лаборатория прикладного сетевого анализа объявляет набор на летнюю школу «Web-scraping and API for social scientific research» и ждет заявки от внешних слушателей!


Школа пройдет с 10 июня по 17 июля в гибридном синхронном формате: в аудитории на Покровском бульваре и онлайн в Zoom.

Какие навыки получат участники: участники научатся самостоятельно собирать и обрабатывать данные с веб-страниц и через API с помощью Python. Курс максимально практикоориентированный: в рамках курса каждое занятие представляет из себя небольшой проект по сбору и обработке данных. Данные из открытых источников и получаемые через API могут понадобиться в самых разных сферах и задачах, поэтому после прохождения курса вы сможете использовать полученные навыки для сбора данных для исследовательских проектов и бизнес-целей. Курс имеет и методологическую ориентацию – помимо практики на Python, на каждом занятии мы также обсуждаем, какие социально-научные исследования могут быть реализованы с данными, которые мы соберем на занятии.

Язык проведения: русский.

Формат аттестации: представление замысла и защита финального проекта.

Занятия проводит сотрудница Лаборатории, Лика КапустинаЛика присоединилась к лаборатории в 2022 году и сразу начала работать над задачами сбора и обработки данных через API, а также успела в коллективе с другими сотрудниками написать и опубликовать несколько статей и зарегистрировать РИД по методологии обработки данных eLibrary «Bib-Elib». Она специализируется на сборе и обработке данных, преподает курсы по программированию на Python, успешно самостоятельно разработала и реализовала (этот) авторский курс в 2023-2024 году на Факультете социальных наук. В 2023 году Лика заняла 2 место в конкурсе НИРС НИУ ВШЭ по политологии со своей ВКР, основанной на самостоятельно собранных и обработанных данных Московского городского суда.

Пререквизиты для участия, формат отбора и участия внешних слушателей: внешние слушатели должны обладать навыками Python на уровне курсов «Введение в программирование на Python»: уметь работать с основными типами данных и коллекций в Python, писать собственные функции. Формат отбора – по резюме и мотивационному письму. В мотивационном письме опишите, как вы оцениваете ваши навыки Python и как вы использовали этот язык программирования в течение последнего года для рабочих и исследовательских задач, как вы могли бы применить полученные навыки в будущем. Внешние слушатели будут реализовывать проект с данными и/или в исследовательских целях Международной лаборатории прикладного сетевого анализа. Если вы давно хотели попробовать себя в работе с реальными научными задачами, это отличная возможность. Мотивационные письма (300-600 слов) и резюме с темой письма «Мотивационное_письмо_школа» направляйте на почту lkapustina@hse.ru до 7 июня. Количество мест ограничено, отбор происходит на конкурсной основе.

Расписание занятий*:
  1. 10 июня, пн,  18:30-21:30 – введение в web-scraping, работа с html;
  2. 19 июня, ср, 18:30-21:30 – введение в requests, BeautifulSoup;
  3. 21 июня, пт, 18:30-21:30 – продолжение работы с requests, BeautfiulSoup;
  4. 24 июня, пн, 18:30-21:30 – введение в API. Работа с API ВКонтакте;
  5. 26 июня, ср, 18:30-21:30 – введение в работу со сторонними библиотеками. Получение данных Telegram через Pyrogram;
  6. 1 июля, пн, 18:30-21:30 – введение в Selenium. Открытые судебные данные в России;
  7. 3 июля, ср, 18:30-21:30 – продолжение работы с Selenium;
  8. 8 июля, пн, 18:30-21:30 – работа со Scrapy и другие фреймворки для сбора данных;
  9. 10 июля, ср, 18:30-20:00 – этика и регулирование работы с открытыми данными. Презентация замыслов проектов;
  10. 17 июля, ср, 18:30-21:30 – презентация проектов по группам.

*Расписание занятий может незначительно корректироваться. Все занятия проходят в вечернее время по будням.