

Герои и злодеи комиксов DC.
В качестве основы для анализа был использован датасет DC Wikia Characters, опубликованный FiveThirtyEight и основанный на данных DC Wikia. Датасет содержит информацию о тысячах персонажей вселенной DC, включая год первого появления, пол, моральную принадлежность и количество появлений в комиксах.
Формат данных — CSV, что позволило эффективно обрабатывать и анализировать их с помощью библиотеки Pandas.
Вселенная DC — это не просто набор персонажей, а сложная нарративная система, в которой важную роль играют моральные категории.

Герои комиксов DC.
Мне было интересно посмотреть, как эта моральная структура выглядит в количественном выражении, а также как менялась репрезентация персонажей со временем, какие персонажи оказываются наиболее «значимыми» внутри нарратива, как распределяются роли между героями и злодеями.
Таким образом, проект объединяет культурный анализ и количественные методы работы с данными.
Содержание датасета
Найтвинг / Дик Грейсон из комикса DC.
- name — имя персонажа; - SEX — пол; - ALIGN — моральная принадлежность (good/bad/neutral); - APPEARANCES — количество появлений в комиксах; - YEAR, MONTH — дата первого появления; - ALIVE — жив/мёртв; - дополнительные категориальные признаки.
Эти данные интересны, так как отражают эволюцию репрезентации во вселенной DC, позволяют анализировать популярность и выживаемость персонажей, а также соединяют культуру, индустрию и количественные методы.
Как менялась структура персонажей DC со временем — по полу, моральной роли и значимости?


Слева — бэт-семья, справа — злодеи из комиксов DC.
Очистка и подготовка данных
На первом этапе данные были очищены и подготовлены с помощью библиотеки Pandas:
- столбцы YEAR и ARANCES приведены к числовому формату; - строки без года первого появления удалены; - значения пола и моральной принадлежности приведены к укрупнённым категориям (Male, Female, Good, Bad, Neutral); - для персонажей без указанной моральной принадлежности была введена категория Unknown.
Визуальный стиль


Для визуализации был выбран стиль, вдохновлённый эстетикой комиксов DC.
Цвета, сетка, обводки и типографика задавались не постобработкой, а напрямую в коде.
1. Кольцевая диаграмма «Моральная структура вселенной DC»
Красный колпак / Джейсон Тодд — один из популярных линчевателей в комиксах DC.
Кольцевая диаграмма «Моральная структура вселенной DC».
Визуализация подчёркивает доминирование героев и злодеев, а также сравнительно небольшую долю персонажей с неопределённым статусом.
Наглядно видно, как нарратив DC строится вокруг чёткой оппозиции «герой-злодей», при этом нейтральные и переосмысленные персонажи чаще всего играют вторичную роль.
Часть кода с кольцевой диаграммой.
2. Линейная диаграмма «Динамика появления персонажей по полу»
Линейная диаграмма «Персонажи DC в разбивке по полу (1940-2010)».
График показывает динамику появления новых персонажей мужского и женского пола с течением времени.
Мужские персонажи в комиксах DC.
Женские персонажи начинают появляться заметно активнее во второй половине 20 века, однако разрыв между полами сохраняется на протяжении всего периода.
Женские персонажи в комиксах DC.
Часть кода с линейным графиком.
3. Гистограмма «Значимость персонажей»
Гистограмма «Значимость персонажа (по логарифму 10 появлений)».
Для анализа использовано логарифмическое преобразование количества появлений (log10(1 + APPEARANCES)), так как распределение имеет длинный хвост.
Красный Колпак / Джейсон Тодд и Найтвинг / Дик Грейсон из комикса DC.
Для анализа использовано логарифмическое преобразование количества появлений (log10(1 + APPEARANCES)), так как распределение имеет длинный хвост.
Большинство персонажей появляются в комиксах крайне редко, в то время как небольшое число героев и злодеев концентрирует на себе основное внимание.
4. Столбчатая диаграмма «Медианное количество появлений по категориям»
Столбчатая диаграмма «Медианное количество появлений по категориям».
Герои в среднем получают больше сюжетного времени, чем злодеи, что подчёркивает их центральную роль в повествовании DC.
Используемые статистические методы
В проекте применялись следующие методы анализа данных: - описательная статистика (медиана, распределения); - группировка и агрегация данных (groupby); - анализ временных рядов; - логарифмическое преобразование данных; - сравнение категориальных распределений.
Найтвинг / Дик Грейсон из комикса DC.
Заключение
Бэтмобиль и Готэм из комикса DC.
Проект показывает, как данные могут использоваться для анализа культурных и нарративных систем, а визуализация позволила по-новому взглянуть на структуру вселенной DC и выявить закономерности, которые неочевидны при поверхностном рассмотрении.
Описание применения генеративной модели
В ходе работы использовалась генеративная модель ChatGPT 5.2 (OpenAI).
ИИ применялся как консультативный инструмент — для обсуждения визуального стиля и его корректной реализации в коде.