Первое заданиеот мастерской Анализа Текстовых Данных (ТекстАН) Летней ШколыПроект
Летняя Школа каждый год собирает под своим крылом очень разные мастерские. В одной участники пишут код и работают с данными (как, например, наша), в другой — читают тексты и спорят об интерпретациях, в третьей — танцуют, поют и строят архитектурные макеты. На первый взгляд все они находятся внутри одного образовательного проекта. Но если внимательно прочитать их описания, становится видно, что каждая мастерская по-своему отвечает на вопросы: чему здесь учатся, каким должен быть участник, что считается хорошим результатом, как устроена работа и зачем вообще приходить именно сюда.
В этом задании мы предлагаем посмотреть на проекты и организации как на набор текстов. Описания мастерских, вступительные задания, программы занятий и публичные материалы не просто сообщают факты. Они создают образ мастерской, формируют ожидания, объясняют ценности и обращаются к будущему участнику определенным языком. Одни тексты подчеркивают исследовательскую свободу, другие — практический результат, третьи — командную работу, четвертые — сложность и профессиональность, пятые — атмосферу совместного поиска.
Выберите несколько мастерских Летней Школы — например, мастерские одного года или мастерские разных лет — и предложите способ сравнить их с помощью методов анализа текстовых данных.
В эссе попробуйте ответить на вопрос: как по текстовым описаниям можно понять, чем организации или направления внутри организаций отличаются друг от друга? Какие признаки этих различий можно извлечь автоматически, а какие требуют внимательного чтения и ручной разметки? Как можно это отобразить? Используя карту, определяя категории по текстовым признакам или каким-то иным образом?
Опишите, какие данные вы бы использовали. Это могут быть описания мастерских на сайте, вступительные задания, программы, новости, отзывы участников или другие открытые материалы.
Объясните, как вы превратили бы эти тексты в корпус для анализа: что стало бы единицей наблюдения, какие тексты вы бы включили, что пришлось бы исключить, какие ограничения есть у таких данных.
Предположите как такой подход можно перенести за пределы Летней Школы. Ведь мастерские — это только один пример более общей задачи: сравнивать объекты по тому, как они описаны в текстах. Но как эту логику можно перенести на иные ситуации?