memo.data

Хакатон по материалам баз данных «Мемориала»

За годы своей работы «Мемориал» накопил множество разнообразных данных: списки жертв политических репрессий и списки работников органов госбезопасности, адреса и описания репрессивных институций в Москве, Московской области и на территории бывшего СССР, письменные свидетельства пострадавших от репрессий.

Большинство этих данных опубликовано «Мемориалом» в виде книг, меньшая часть – в виде веб-сайтов и компьютерных приложений. Наши данные используются в таких проектах, как Открытый список, gulag.online, october30.name. Мы хотим, чтобы таких проектов становилось больше.

Поэтому – пригласили программистов и георграфов, историков и дизайнеров на хакатон «memo.data»

Данные для хакатона

lists.memo.ru 
список жертв политических репрессий. Основная на сегодняшний день база данных по жертвам политических репрессий: включает более 2,6 миллионов человек. Данные взяты из региональных книг памяти, авторских баз данных, материалов государственных архивов и архива «Мемориала».
Данные в табличном виде (.csv) на Github
Данные в формате .json

mos.memo.ru 
расстрелянные в Москве – выборка москвичей из базы lists.memo.ru, сгруппированная по последним адресам проживания. Существует в формате MySQL.
Данные в табличном виде (.csv) на Github 

stalin.memo.ru 
сталинские расстрельные списки. База данных с возможностью просмотра по региональным спискам основана на 383 списках людей, приговоренных к расстрелу прямым решением членов Политбюро в 1937-1938 годах и включает 44,5 тысячи имен. Существует в формате MySQL.
Образ диска с приложением для Windows

nkvd.memo.ru
Кадровый состав органов государственной безопасности СССР. 1935–1939. Включает имена и биографии более 41 тысячи сотрудников НКВД, собранные при анализе наградных приказов этого периода. Позволяет просматривать людей по местам службы, званиям, наградам. Отдельно выделены репрессированные сотрудники органов госбезопасности. База данных опубликована в формате MediaWiki, необработанные данные можно получить, написав авторам указателя.
Описание полей таблиц
Таблица designations.cvs
Таблица ranks.cvs
Таблица prizes.cvs

Справочник «Система исправительно-трудовых лагерей в СССР»
основные сведения о более чем 470 лагерных управлений, существовавших в СССР: название, подчиненность, дислокация, время существования, численность, производственная деятельность, начальники и т. п.
Таблица с данными на Github

topos.memo.ru 
«Топография террора. Москва»: адреса и описания объектов, связанных с историей политических репрессий в Москве и Московской области. Содержит описания более 740 локаций, организованных по тематическим слоям. 
Геоданные «Топографии» (.json)

tastorona.su
воспоминания остарбайтеров «Та сторона». Архив устной истории остарбайтеров и военнопленных представляет около 300 интервью, хранящихся в Центре устной истории «Мемориала». Архив снабжен именным, тематическим и географическим указателями.

ost-db.tastorona.su
база данных принудительного труда советских граждан в Германии. Охватывает сведения из более чем 320 тысяч писем бывших остарбайтеров, пришедших на адрес «Мемориала». Информацию проверяют волонтеры.
Список топонимов и их синонимов

Wiki-версия «Хроники текущих событий»
Веб-публикация самиздатского правозащитного бюллетеня «Хроника текущих событий» с массивом указателей. Тексты «Хроники» без привязки к указателям: hts.memo.ru

Список баз данных «Мемориала» 

Проекты участников

«Автоматическая идентификация репрессированных семей»
(Илья Воронцов, Глеб Суворов)
Как в базе данных lists.memo.ru найти детей и родителей?
Презентация
Код

«Рубрикация профессий репрессированных»
(Денис Кирьянов, Юлия Зиновьева, Майя Жигалова, Полина Широкшина, Самер Фатайри)
Как в базе данных lists.memo.ru объединить в группы все 500 тысяч упомянутых в ней профессий?
Презентация
Код

«Дома на расстрел»
(Николай Ворошилов, Анна Коваленко, Юлия Лукьянова)
Что объединяет расстрелянных жильцов десяти домов из базы mos.memo.ru?
Презентация

«Квест/тест: если бы вы жили в 1937»
(Борис Клюс, Никита Сафонов, Никита Кряжев, Ольга Хохрякова)
Тест, ответы на вопросы которого расскажут о вашей возможной судьбе в годы Большого террора.
Презентация

«Свои-чужие»
(Юлия Корчагина)
Попытка показать на интерактивной карте данные о депортациях народов с 1939 по 1945 год.
Презентация

«Исследуем тексты писем из лагерей»
(Андрей Калмыков, Маргарита Кожекина, Александра Малафеева, Тимур Сурхаев)
Анализ по ключевым словам 5 тысяч расшифрованных писем узников ГУЛАГа, хранящихся в архиве «Мемориала».
Презентация

«Странные/продуктивные вопросы по поиску в БД репрессированных»
(Сергей Бондаренко, Анна Львова, Юлия Тувалева, Влад Лавриченко)
Разные типы запросов к данным по 2.8 млн человек. Что можно узнать даже из неполных и неровно распределенных данных? Как увидеть в них не только статистику репрессий, но и уровень проработки этой темы (по периодизации, по регионам и т. д.)?
Презентация

Александр Петухов работал над инструментами для обработки данных lists.memo.ru.
Код

Если вас заинтересовали какие-то из перечисленных данных или проектов участников и вы хотели бы с ними ознакомиться детальнее, пишите: [email protected]

 

Партнёры
Факультет коммуникаций, медиа и дизайна НИУ ВШЭ Теплица социальных технологий