#ПАНДАН_на_завтрак_25
Шесть интерактивных заданий для поступления на программу
«Прикладной анализ данных и искусственный интеллект» (ПАНДАН)
Европейского университета и Яндекса
Задания для поступления на ПАНДАН в 2025 году публикуются на этом сайте еженедельно. Все шесть заданий будут опубликованы до начала приема документов 21 июня.
Выберите два задания из шести и по каждому напишите эссе на русском языке в объеме от 5 000 до 10 000 знаков (включая знаки препинания, цифры и пробелы)
Первое задание
от команды центра "Прожито"

Зачем люди ведут личные дневники? По мнению большинства, это помогает выразить мысли и чувства, понять себя, сохранить воспоминания и справиться с переживаниями. Такие представления о дневнике крепко укоренились в культуре, и проверить истинность этого убеждения без анализа большого количества дневниковых текстов долгое время не представлялось возможным из-за отсутствия нужного объема данных. Сегодня такие исследования можно провести на данных корпуса дневников «Прожито», в котором хранится 660 тысяч дневниковых записей от 2900 авторов.

В эссе мы не предлагаем размышлять о мотивах ведения дневников, а просим подумать о возможностях их выявления с помощью современных инструментов обработки естественного языка.  Для этого возьмите любые дневниковые записи из корпуса «Прожито»  (например, такие, такие или такие) и попробуйте провести ряд экспериментов по выявлению мотивов авторов с помощью больших языковых моделей (например, ChatGPT, DeepSeek, Hugging Face или любые другие). Каковы преимущества и недостатки использования больших языковых моделей для извлечения информации, почему автор ведёт дневник? Как вы выбирали языковую модель? Как можно проверить результаты работы больших языковых моделей? Какие еще инструменты кроме больших языковых моделей можно использовать для выполнения поставленной задачи?

Также подумайте о методах дальнейшего анализа полученных вами мотивов ведения дневника. Ответы больших языковых моделей не всегда бывают одинаковыми, поэтому предположите, как полученную от моделей информацию можно разделить на группы? Какие признаки, связанные с авторами, могут влиять на мотивы ведения дневниковых записей? Какие возможны ограничения при анализе со стороны имеющихся данных?

Мы ожидаем, что написанное вами эссе может содержать примеры промтов и ответов LLM, однако просим вынести их в приложения. Основой эссе должны стать ваши рассуждения и описание проведенных экспериментов, текст также должен быть подкреплен источниками и дополнительными примерами.


Второе задание
от команды проекта "Narod и цифровое наследие"

Уже второй год на ПАНДАНе развивается проект по изучению сайтов, созданных в 2000-2013 годах на хостинге Narod.ru (Яндекс Народ). Эти сайты - артефакты цифрового наследия, которые нуждаются в сохранении, так как многое могут рассказать о технологиях, людях и сложившихся тогда практиках.

В рамках этого задания мы предлагаем вам представить себя в роли исследователей, которые на материалах "народных" сайтов хотят узнать, как изменились практики образовательного альтруизма и peer-to-peer обучения в интернете. В эту область могут включаться инструкции, написанные пользователями для пользователей, уроки и гайдлайны, форумы с обсуждениями как сделать, пройти или, например, починить что-то, а также сообщества по обучению и изготовлению разных цифровых артефактов - аватарок, баннеров, гифок, игр и многое другое. В качестве примера, вы можете рассмотреть эту подборку сайтов. Какие еще форматы и источники было бы полезно изучить в рамках подобного исследования? Можно ли сохранить исследуемые нами практики с современными аналогами? Какой смысл был для людей в том, чтобы создавать такие сайты и пользоваться ими?

Предположите, как из более чем миллиона сайтов можно отыскать те, которые соответствуют тематике исследования? Какие инструменты вам могли бы пригодиться? Какие преимущества и ограничения существуют у этих инструментов? Как бы вы валидировали полученные таким образом результаты? Что еще можно было бы узнать из этих данных, проведя количественное исследования и какими качественными методами вы могли бы обогатить его?

Результатом вашей работы должно стать эссе, содержащее предложения по сбору данных по предложенной нами тематике, ответы на вопросы, описанные выше, а также описание хода исследования на примере одного из поставленных вами исследовательских вопросов. Вы также можете использовать любые интересующие вас страницы, созданные на хостинге Narod.ru. Если вам удастся собрать и проанализировать некоторые данные, вы также можете приложить сами данные и полученные результаты. Мы ожидаем, что в работе будут отражены критические подходы к изучению сайтов как вида цифрового наследия.
КОНТАКТЫ ПРИЕМНОЙ КОМИССИИ
Адрес: ул. Шпалерная, дом 2/4, литера А

E-mail: admissions.pandan@eu.spb.ru, pandan.eu@yandex.ru.
Присоединяйтесь к нам социальных сетях: