Original size 730x1028

Кто населяет вселенную DC: анализ персонажей через данные

PROTECT STATUS: not protected
big
Original size 2400x1216

Герои и злодеи комиксов DC.

В качестве основы для анализа был использован датасет DC Wikia Characters, опубликованный FiveThirtyEight и основанный на данных DC Wikia. Датасет содержит информацию о тысячах персонажей вселенной DC, включая год первого появления, пол, моральную принадлежность и количество появлений в комиксах.

Формат данных — CSV, что позволило эффективно обрабатывать и анализировать их с помощью библиотеки Pandas.

Вселенная DC — это не просто набор персонажей, а сложная нарративная система, в которой важную роль играют моральные категории.

big
Original size 3304x1727

Герои комиксов DC.

Мне было интересно посмотреть, как эта моральная структура выглядит в количественном выражении, а также как менялась репрезентация персонажей со временем, какие персонажи оказываются наиболее «значимыми» внутри нарратива, как распределяются роли между героями и злодеями.

Таким образом, проект объединяет культурный анализ и количественные методы работы с данными.

Содержание датасета

Original size 2400x776

Найтвинг / Дик Грейсон из комикса DC.

- name — имя персонажа; - SEX — пол; - ALIGN — моральная принадлежность (good/bad/neutral); - APPEARANCES — количество появлений в комиксах; - YEAR, MONTH — дата первого появления; - ALIVE — жив/мёртв; - дополнительные категориальные признаки.

Эти данные интересны, так как отражают эволюцию репрезентации во вселенной DC, позволяют анализировать популярность и выживаемость персонажей, а также соединяют культуру, индустрию и количественные методы.

Как менялась структура персонажей DC со временем — по полу, моральной роли и значимости?

Слева — бэт-семья, справа — злодеи из комиксов DC.

Очистка и подготовка данных

На первом этапе данные были очищены и подготовлены с помощью библиотеки Pandas:

- столбцы YEAR и ARANCES приведены к числовому формату; - строки без года первого появления удалены; - значения пола и моральной принадлежности приведены к укрупнённым категориям (Male, Female, Good, Bad, Neutral); - для персонажей без указанной моральной принадлежности была введена категория Unknown.

Original size 707x458

Визуальный стиль

Для визуализации был выбран стиль, вдохновлённый эстетикой комиксов DC.

Цвета, сетка, обводки и типографика задавались не постобработкой, а напрямую в коде.

Original size 767x758

1. Кольцевая диаграмма «Моральная структура вселенной DC»

Original size 1788x1194

Красный колпак / Джейсон Тодд — один из популярных линчевателей в комиксах DC.

Original size 690x464

Кольцевая диаграмма «Моральная структура вселенной DC».

Визуализация подчёркивает доминирование героев и злодеев, а также сравнительно небольшую долю персонажей с неопределённым статусом.

Наглядно видно, как нарратив DC строится вокруг чёткой оппозиции «герой-злодей», при этом нейтральные и переосмысленные персонажи чаще всего играют вторичную роль.

0

Часть кода с кольцевой диаграммой.

2. Линейная диаграмма «Динамика появления персонажей по полу»

Original size 854x472

Линейная диаграмма «Персонажи DC в разбивке по полу (1940-2010)».

График показывает динамику появления новых персонажей мужского и женского пола с течением времени.

0

Мужские персонажи в комиксах DC.

Женские персонажи начинают появляться заметно активнее во второй половине 20 века, однако разрыв между полами сохраняется на протяжении всего периода.

0

Женские персонажи в комиксах DC.

Original size 1589x803

Часть кода с линейным графиком.

3. Гистограмма «Значимость персонажей»

Original size 854x472

Гистограмма «Значимость персонажа (по логарифму 10 появлений)».

Для анализа использовано логарифмическое преобразование количества появлений (log10(1 + APPEARANCES)), так как распределение имеет длинный хвост.

Original size 1472x828

Красный Колпак / Джейсон Тодд и Найтвинг / Дик Грейсон из комикса DC.

Для анализа использовано логарифмическое преобразование количества появлений (log10(1 + APPEARANCES)), так как распределение имеет длинный хвост.

Большинство персонажей появляются в комиксах крайне редко, в то время как небольшое число героев и злодеев концентрирует на себе основное внимание.

Original size 1509x659

4. Столбчатая диаграмма «Медианное количество появлений по категориям»

Original size 837x506

Столбчатая диаграмма «Медианное количество появлений по категориям».

Герои в среднем получают больше сюжетного времени, чем злодеи, что подчёркивает их центральную роль в повествовании DC.

Original size 1532x804

Используемые статистические методы

В проекте применялись следующие методы анализа данных: - описательная статистика (медиана, распределения); - группировка и агрегация данных (groupby); - анализ временных рядов; - логарифмическое преобразование данных; - сравнение категориальных распределений.

Original size 4096x2304

Найтвинг / Дик Грейсон из комикса DC.

Заключение

Original size 1472x884

Бэтмобиль и Готэм из комикса DC.

Проект показывает, как данные могут использоваться для анализа культурных и нарративных систем, а визуализация позволила по-новому взглянуть на структуру вселенной DC и выявить закономерности, которые неочевидны при поверхностном рассмотрении.

Описание применения генеративной модели

В ходе работы использовалась генеративная модель ChatGPT 5.2 (OpenAI).

ИИ применялся как консультативный инструмент — для обсуждения визуального стиля и его корректной реализации в коде.