Искусствоведы, историки, антропологи, социологи редко представляют себе современные технологические возможности, еще реже — применяют их в работе. Аналитики данных не знакомы с задачами, которые стоят в искусстве, культуре, гуманитарной и социальной науке. Современные программы по анализу данных учат решать задачи, поставленные кем-то другим. В результате аналитиков много, но мало кто способен видеть и формулировать проблемы.

ПАНДАН предлагает преодолеть этот разрыв. Мы объединяем академических ученых из ЕУ и программистов из Яндекса, чтобы выработать новый язык, создать возможность для диалога между этими мирами.
Чего мы хотим добиться?
Мы хотим научить слушателей работать над проектами в различных сферах, используя методы классической статистики, обработки естественных языков, компьютерного зрения. Мы планируем выпускать специалистов, которые могут работать и в музее, и в Счетной палате, и в антропологической экспедиции, используя современные технологии.
Зачем это нужно?
В общественных и гуманитарных областях есть много ценных данных, например, Госкаталог с информацией о всех музейных фондах страны, оцифрованные данные архивов, рукописи, дневники, письма, базы государственных ведомств. Кроме того, постоянно появляются и накапливаются цифровые следы, например, данные о маршрутах, репосты, новости.

Вся эта информация, если уметь поставить к ней вопросы, может послужить основой для неожиданных выводов об устройстве повседневной жизни, о реальном положении дел в разных сферах, от криминологии до атрибуции картин.
Как устроено обучение?
Мы предлагаем две программы:

‣ Программа дополнительного профессионального образования (ДПО) – 1 год
‣ Магистерская программа – 2 года

Мы разработали программы таким образом, чтобы учить на реальных примерах. Наши проекты и курсы интегрированы с реальной научной работой. Домашние работы построены на социальных и общественных данных — от сведений о преступности до речей политиков. Во многих курсах зачет — это мини-исследование.

ДПО
Программа длится 5 модулей (2 семестра)

1 модуль
: математический и технический минимумы, программирование на языке Python
2 модуль: основы статистики, программирование в R и различные типы данных (административно-правовые, опросные)
3 модуль: машинное обучение, разметка данных и текстовые данные
4 модуль: обработка естественного языка и компьютерное зрение
5 модуль: геоданные и программирование в QGIS, визуализация данных

‣ Проект:
начинается с 3 модуля
‣ Не все курсы обязательны, достаточно выбрать 11 из 14

Магистратура
Программа длится 10 модулей (4 семестра)

Первый курс:
1-5 модули
магистранты учатся вместе со слушателями ДПО, также посещают занятия по иностранному языку

Второй курс:
6 - 7 модуль: статистика, алгоритмы и структуры данных, базы данных, язык программирования С/С++
8 - 9 модуль: методология и проектирование информационных систем
10 модуль: работа над магистерской диссертацией

Проект: магистранты будут выполнять 2 проекта: на 1 и 2 курсе
Факультативы: мы отобрали 25 курсов, которые читают на разных факультетах Европейского университета. В течение всей программы слушатели могут посещать любые из этих дисциплин: они будут засчитаны как факультативы
Наши проекты
Проектная деятельность — важнейшая часть обучения на ПАНДАНе.
Проектные команды состоят из двух кураторов (технического из Яндекса и научного из ЕУ) и 4−5 слушателей.
Мы разрабатываем концепции проектов совместно с исследователями Европейского и ожидаем продукт, обладающий научной и общественной ценностью.

Кого мы ждем?
Абитуриентами мы видим людей с гуманитарным или социально-экономическим бэкграундом, которые хотят развиваться в сторону аналитики данных, узнать больше о количественном повороте в своих и смежных областях.

Требования к образованию

ДПО:
любой уровень образования начиная с бакалавриата.
Если у абитуриента нет высшего образования, то в конце мы дадим справку о прослушанных курсах.
Магистратура: оконченное высшее образование

Если у вас совсем другое образование, но хочется полностью сменить сферу — напишите нам, обсудим.
Как поступить?
Заполнить форму на сайте
Пройти конкурс портфолио
Пройти собеседование

Портфолио включает в себя CV, мотивационное письмо и два эссе на выбранные темы из рубрики #ПАНДАН_на завтрак_21.

Мотивационное письмо предоставляется на русском языке в объеме от 3 000 до 5 000 знаков (включая знаки препинания, цифры и пробелы).

Эссе предоставляются на русском языке в объеме от 5 000 до 10 000 знаков каждое (включая знаки препинания, цифры и пробелы).

Портфолио необходимо выслать на два адреса: admissions.pandan@eu.spb.ru и pandan.eu@yandex.ru.

График вступительных испытаний
До 5 августа 2021
До 5 августа 2021
приём заявлений и портфолио
9 августа 2021
9 августа 2021
результаты конкурса портфолио
С 11-го по 24-е августа 2021
С 11-го по 24-е августа 2021
собеседования
25 августа 2021
25 августа 2021
результаты собеседований
Сентябрь 2021
Сентябрь 2021
начало занятий
Преподаватели ПАНДАНа
Иван Бибилов
Администратор ШАД Яндекса, со-директор программы
Павел Браславский
Уральский федеральный университет, Екатеринбург
Высшая школа экономики, Москва
Анна Булина
Научный центр «Институт междисциплинарных медицинских исследований» (НЦ ИММИ), исследователь-ассистент
Эмиль Камалов
Младший научный сотрудник Лаборатории сравнительных социальных исследований НИУ ВШЭ, аспирант факультета политических наук ЕУСПб
Ника Костенко
Доцент факультета социологии ЕУСПб, декан факультета, со-директор программы
Анастасия Кузнецова
Аспирант НИУ ВШЭ, аналитик, автор Telegram-канала «настенька и графики» (https://t.me/nastengraph)
Дмитрий Скугаревский
Ассоциированный профессор ПАО «МТС» по эмпирико-правовым исследованиям ЕУСПб
Борис Соколов
Старший научный сотрудник Лаборатории сравнительных социальных исследований им. Рональда Франклина Инглхарта НИУ ВШЭ
Кирилл Титаев
Ассоциированный профессор социологии права им. С.А. Муромцева, директор по исследованиям Института проблем правоприменения ЕУСПб
Алексей Шпильман
Заведующий центром анализа данных и машинного обучения, НИУ ВШЭ (СПб)
Четвертый модуль
Введение в анализ изображений и видео
Курс знакомит с основными практическими задачами и методами в области анализа изображений и видео.

Слушатели изучают:
  • библиотеку OpenCV для Python
  • классические алгоритмы пространственной и частотной обработки изображений: сглаживание изображений, повышение резкости, выделение контуров и т.д.
  • нейросетевые алгоритмы и их применение для задач классификации и сегментации
Первый модуль
Практический минимум
Курс посвящен основным видам серверного ПО и серверных ОС на примере Linux, их архитектуре и основным принципам работы.

Слушатели приобретают навыки:
  • работы с командной оболочкой bash и набором базовых утилит, доступных в ОС
  • написания скриптов автоматизации
  • работы с основными протоколами передачи информации в информационных системах
  • выстраивания взаимодействий клиент-сервер, взаимодействия через API, межпроцессного взаимодействия
  • развертывания ПО как на одиночный сервер, так и на вычислительный кластер
Первый модуль
Язык программирования Python
Курс направлен на освоение основ алгоритмизации, а также прикладного программирования с упором на последующую сферу анализа данных.

Слушатели приобретают навыки:
  • работы с основными элементами структурного программирования
  • декомпозиции задач и структурирования кода
  • объектно-ориентированного и функционального программирования
  • работы со стандартной библиотекой языка и внешними модулями, формирования своего инструментария для задач автоматизации
  • практического применения основных пакетов обработки данных
Четвертый модуль
Введение в обработку естественного языка
Курс знакомит с основными методами и приложениями автоматической обработки естественного языка (NLP).

Слушатели учатся:
  • основным методам и подходам к NLP
  • принципам оценки качества методов NLP
  • практическим навыкам обработки больших коллекций текстов
Пятый модуль
Разметка данных
Курс нацелен на формирование навыков работы с краудсорсинговой платформой Я.Толока и встраивания краудсорсинга в проекты с машинным обучением.

Слушатели курса:
  • знакомятся с концепциями краудсорсинга, его роли в бизнес-процессах и исследованиях
  • получают навыки декомпозиции исследовательской задачи и превращение её в задачу разметки
  • учатся составлять инструкции для краудсорсингового задания
  • осваивают основные приемы контроля качества асессоров
  • получают навыки работы с сервисом сервиса «ТОЛОКА»
Второй модуль
Введение в статистику
Курс знакомит с базовыми статистическими методами и терминологией, учит практически применять освоенные методы.

Слушатели изучают:
  • базовые статистические концепции и категории: переменная, распределение, статистическая значимость, p-value, гипотеза, регрессия
  • способы формулирования научных задач и гипотез в количественной парадигме
  • области применимости и ограничения статистических методов
  • способы применения освоенных методов в R или Python
Второй модуль
Опросные данные
Курс нацелен не только на разбор основных понятий опросных данных, но и на формирование практических навыков работы с ними.

Слушатели курса:
  • знакомятся с основными понятиями: выборка, ошибка выборки, генеральная совокупность, валидность, репрезентативность, шкалы, коррекция (взвешивание, эффект интервьюера)
  • разбирают ограничения и преимущества опросных данных
  • осваивают основные инструменты работы с опросными данными в R
  • проводят практическую работу с опросными данными высокого и низкого качества
  • осуществляют анализ полученных опросных данных
Третий модуль
Визуализация данных
Курс знакомит с основным принципам визуализации разных типов данных, а также формирует практические навыки визуализации.

Слушатели изучают:
  • основы визуального восприятия человека
  • способы коммуникации данных
  • типы визуализации в зависимости от используемых данных
  • практические инструменты работы с сервисами визуализации данных
Второй модуль
Программирование в R
Курс направлен на освоение основ программирования на языке R с упором на последующую сферу анализа данных.

Слушатели изучают:
  • основные способы манипуляции и обработки данных в R
  • инструменты data.table и dplyr
  • способы визуализации данных в R
  • основные принципы tidy data
  • инструменты статистических методов в программной среде R-Studio
  • создание документов при помощи R Markdown
Третий модуль
Текстовые данные
Цель курса – изучить подходы к количественному анализу текстов в общественных науках.
На занятиях разбираются общие вопросы корпусных исследований и проблемы вычислительной лингвистики.

Слушатели получают навыки:
  • работы ключевыми источниками текстовых данных в общественных науках
  • по созданию массивов структурированных текстов из неструктурированных данных
Пятый модуль
Причинно-следственные связи в неэкспериментальных данных
Курс знакомит слушателей с фундаментальными положениями и основными методами современной теории статистического причинно-следственного вывода (англ. causal inference).

Слушатели изучают:
  • основные понятия теории контрфактуального вывода и теории каузальных диаграмм
  • прикладные методы статистического причинно-следственного вывода: экспериментальная методология и квазиэкспериментальные методы, инструментальные переменные, разность разностей, разрывный дизайн
  • способы реализации изученных методов в R
Второй модуль
Административные данные
Курс посвящён специфике производства данных государственными органами РФ.
Результат занятий – сформированное представление об аналитическом потенциале административных данных.

Слушатели изучают:
  • существующие государственные системы сбора данных
  • специфику административных (государственных) данных, агрегированную и неаграгированную информации, ГИС и системы ведомственного статистического наблюдения
  • приемы контроля качества государственных данных
Третий модуль
Машинное обучение
Курс посвящён теоретическим основам алгоритмов машинного обучения с фокусом на основные методы и типы задач анализа данных в гуманитарных и социальных науках.

Слушатели учатся:
  • применять алгоритмы машинного обучения в соответствии с поставленной задачей анализа данных
  • решать задачи классификации, кластеризации, регрессии
  • работать с нейронными сетями
  • использовать современные методы и библиотеки машинного обучения для анализа данных в социо-гуманитарных областях
Цифры и факты
Продолжительность обучения
ДПО: 9,5 месяцев, с 6 сентября 2021 по 24 июня 2022
Магистратура: 2 года, с 6 сентября 2021 по 23 июня 2023
Стоимость полного курса
ДПО: 250 тыс. рублей
Магистратура: 220 тыс. рублей в год
• 3 места со скидкой 95% и стипендией 15 000 + 10 000 рублей доплата для иногородних
• 2 места со скидкой 95% и без стипендии
• 5 мест c полной оплатой
Сколько слушателей наберем
ДПО: 20 мест
Магистратура: 10 мест
Документы по окончании
ДПО:
Сертификат о прохождении обучения по программе дополнительного профессионального образования АНООВО «ЕУСПб»
Если у слушателя нет высшего образования, выдается справка о прослушанных курсах
Магистратура:
Диплом государственного образца по направлению 09.04.03 Прикладная информатика

Программа ПАНДАН сделана совместными усилиями Европейского университета и Яндекса. Европейский университет (АНООВО «ЕУСПб») оказывает образовательные услуги на основании Лицензии № 2770 от 10 августа 2018 года
Время занятий
с 18:30 4 дня в неделю
Место обучения
Очно в Европейском университете в Санкт-Петербурге
КОНТАКТЫ ПРИЕМНОЙ КОМИССИИ
Адрес: Гагаринская ул., д.6/1, литер, А (вход со Шпалерной, дом 1); кабинет 308
Время работы приемной комиссии: пн.-пт. с 11:00 до 17:00
Телефон: +7 812 539−25−81 (после звонка набрать добавочный #308)
E-mail: admissions.pandan@eu.spb.ru, pandan.eu@yandex.ru.