#ПАНДАН_на_завтрак_21
Шесть интерактивных заданий для поступления на программу
«Прикладной анализ данных» (ПАНДАН)
Европейского университета совместно с Яндекс
Выберете два задания из шести и по каждому напишите эссе на русском языке в объеме от 5 000 до 10 000 знаков (включая знаки препинания, цифры и пробелы).
Первое задание
Исследователи в общественных науках давно изучают экономическое развитие c помощью спутниковых снимков ночной Земли.

На рисунках ниже мы изобразили динамику ночных огней в Санкт-Петербурге и Ленинградской области и Москве и Московской области: апрель 2020 г. к апрелю 2019 г. Зеленым цветом обозначены места растущего света, красным — угасающего (данные NOAA/VIIRS/DNB/MONTHLY_V1/VCMSLCFG).

Апрель прошлого года известен в мире как месяц глобального локдауна. Как карантинные меры отразились на ночных огнях в Петербурге и Москве, судя по этим изображениям? В чем возможности и ограничения таких данных для изучения влияния локдауна на развитие территорий?

Второе задание

В 2017 году был объявлен национальный проект «Безопасные и качественные автомобильные дороги». В проекте участвуют 84 субъекта РФ, на его реализацию было выделено 4,78 трлн рублей. С результатами проекта можно ознакомиться на сайте: https://bkdrf.ru

Нам интересно оценить взаимосвязь между финансированием дорог по данной национальной программе и аварийностью на участках дорог.

Какие можно выделить основные показатели, отражающие безопасность дорог? Почему одного показателя может быть недостаточно? Какие факторы влияют на качество и безопасность дорог? Как и при помощи каких данных их можно измерить?

Перечислите показатели и факторы с пояснением, как именно они могут повлиять на аварийность и безопасность дорог. Ответ может быть основан на реальных данных, или на тех, которые было бы полезно использовать.

Третье задание от слушателей ПАНДАНа из проекта «Еврейские надгробия»
Текущая задача проекта — автоматизировать процесс распознавания текста с фотографий еврейских надгробий.

Корпус фотографий насчитывает до 7000 снимков разного качества. Материалы предоставили центры «Петербургская иудаика» ЕУСПб (черно-белое фото) и центр «Сэфер» (цветное фото). Фотографии были сделаны в разное время на еврейских кладбищах Восточной Европы, в пределах черты оседлости (Украина, Молдавия, Беларусь, Латвия, Литва, пограничные регионы России). Некоторые надгробия, отснятые в 1950-е, уже физически не существуют.

Автоматизация процесса распознавания позволит собрать объемный корпус текстов надгробий, с которым смогут работать ученые.

Мы просим вас подумать, какие еще данные, помимо текста надгробий, вы бы стали собирать на еврейском кладбище? Какие исследовательские вопросы можно поставить к такому корпусу данных? В чем будут его ограничения?
Четвертое задание от команды проекта «Бомбардировки Ленинграда»

Этот проект посвящен серии авианалётов на Ленинград, совершённых во время Великой Отечественной войны с 1941 по 1943 год. Андрей Рябков, исследователь Факультета истории ЕУСПб, собрал данные оперативных сводок штаба МПВО — сводки составлялись ежедневно для информирования руководства города о масштабах жертв и разрушений.

В данных сводок содержится следующая информация:

— дата
— район города
— адрес (улица и дом)
— объект
— тип снаряда
— количество снарядов
— причиненный ущерб
— количество убитых
— количество раненых
— время обнаружения

ПРИМЕРЫ ДАННЫХ

Запись 1: 17 октября 1941 года, Фрунзенский район, Лиговская ул. д.62, завод им. 2-й Пятилетки, 1 ФАБ (фугасная авиабомба), ущерб: воронка между корпусами цехов, частично выбиты стекла в цехах, убит 1 человек, ранено 4 человека, время обнаружения: 0:55

Запись 2. 17 октября 1941 года, Октябрьский район, Маклина пр., д. 40, Снаряд: 1, ущерб: в булочной выбиты рамы и частично повреждены стены, время обнаружения: 18:15−19:20

Запись 3. 9 августа 1941 года, Московский район, Тарный комбинат, ЗАБ (зажигательная авиабомба): 30, ущерб: горела тара, время обнаружения: 19:00

Какие исследовательские вопросы можно поставить к таким данным?
Какие внешние данные могли бы обогатить эти данные?
Как можно визуализировать данные оперативных сводок штаба МПВО для представления их в научных публикациях и на открытых ресурсах?
С какими сложностями, как Вы полагаете, может столкнуться исследователь в работе с данными штаба МПВО (на примере записи, которую мы привели)?

Визуализация содержания сводок, сделанная участниками проекта:
размер слова указывает на частоту употребления

Пятое задание от команды проекта «Госкаталог»

Государственный каталог — проект министерства культуры — это база данных о предметах, хранящихся в в музейном фонде России. Сейчас в нем представлены более 24 миллионов экспонатов, а к 2025 году в каталог планируется внести информацию о всех предметах во всех государственных музеях.

Такой онлайн-каталог с изображениями может быть полезен огромному числу интернет-пользователей: школьникам и студентам, искусствоведам, художникам, дизайнерам, сотрудникам музеев и просто интересующимся культурой и искусством.

Зайдите на сайт Госкаталога, воспользуйтесь обычным и расширенным поиском. Попробуйте найти конкретного автора, предмет из музейной коллекции и несколько произведений, сгруппированных по какому-либо признаку (эпоха, направление и тд).

Как устроены данные Госкаталога? Какие сильные и слабые стороны можно отметить в архитектуре каталога? Какие вы видите ограничения при работе с текущей поисковой системой и описями экспонатов? Что можно было бы улучшить?

Какие примеры удачных ресурсов такого рода вы знаете? В чем их преимущества?
Шестое задание от команды проекта «Дневники подростков» (совместно с центром «Прожито» ЕУСПб)
На предлагаемых графиках показано распределение личных дневников «Прожито» по десятилетиям количества записей, количеству их авторов и «эмоциональных» записей в дневниках людей в возрасте от 13 до 21 года («эмоциональность» записи определялась алгоритмом библиотеки Dostoevsky; показатель может принимать значение от 0 до 1, где 0 — нейтральная запись, а 1 — эмоциональная запись).

Взятые вместе, эти графики обнаруживают парадоксальную ситуацию 1940-х годов: с одной стороны, в это время максимальное количество авторов-подростков произвели самое большое количество дневниковых записей, с другой — «эмоциональность» этих записей не отличается сильно от «эмоциональности» записей, сделанных в другие десятилетия.

В эссе предложите объяснение этому парадоксу.
Что еще интересного Вы видите на этих графиках?
Как Вы могли бы это объяснить?
КОНТАКТЫ ПРИЕМНОЙ КОМИССИИ
Адрес: Гагаринская ул., д.6/1, литер, А (вход со Шпалерной, дом 1); кабинет 308
Время работы приемной комиссии: пн.-пт. с 11:00 до 17:00
Телефон: +7 812 539−25−81 (после звонка набрать добавочный #308)
E-mail: admissions.pandan@eu.spb.ru, pandan.eu@yandex.ru.