Original size 1140x1600

Как анализ данных мне помог понять аниме

PROTECT STATUS: not protected
The project is taking part in the competition

«Я смотрю аниме или просто позер?»

big
Original size 2567x1288

Анализ жанров, рейтингов и популярности аниме

Мне всегда было интересно аниме, особенно старые работы: эстетика 90-х, ручная анимация, драматургия без спешки, странные паузы и несовершенные персонажи. При этом я долгое время ощущала внутреннее сомнение: разбираюсь ли я в аниме на самом деле, или моя любовь — это лишь насмотренность и визуальная симпатия?

Этот проект стал для меня способом честно ответить себе на вопрос: я действительно понимаю аниме как медиум — или просто воспроизвожу образ «человека, который его любит»?

Чтобы разобраться в этом, я решила обратиться не к рецензиям и личным ощущениям, а к данным.

Стилизация графиков

палитра

шрифт

Моя стилизация вдохновлялась: • интерфейсами старых медиа-архивов, • спокойной инфографикой, • ощущением «аналитической тетради», а не маркетингового отчёта. Мне было важно, чтобы графики не кричали, а приглашали к вдумчивому просмотру — как старое аниме, которое раскрывается не сразу. Цвета и шрифт отсылают к кибер-панк стилистике.

Популярность жанров (Столбчатая диаграмма)

big
Original size 1389x690

Топ-15 жанров по своей популярности

Original size 1284x1010

Этапы работы:

Предобработка и очистка данных Работа началась с технического этапа: • удаление строк с отсутствующими рейтингами и жанрами, • преобразование количества эпизодов в числовой формат, • подготовка данных для дальнейшего анализа. Этот этап был для меня важен как дизайнеру: я увидела, насколько грязные данные искажают любую визуальную форму, если не привести их в порядок.

Популярность Movie vs TV по годам (Гистограмма)

Original size 1690x790
Original size 1284x1076

Какие данные я выбрала и где я их нашла

Для анализа я использовала Kaggle Anime Dataset — открытый датасет, содержащий информацию о более чем 12 000 аниме-работ. В датасете представлены: • названия аниме, • жанры, • тип (TV, Movie, OVA и др.), • количество эпизодов, • пользовательский рейтинг, • количество участников (members) — как показатель популярности. Также я опиралась на пример аналитического ноутбука Anime Ratings Analysis & Recommender System, написанного на Python.

Топ-25 самых популярных аниме

Original size 1390x1089
Original size 1070x740

Аниме — это огромный медиум, в котором легко потеряться. Зритель может часами листать каталоги стриминговых сервисов, ориентируясь на обложки, жанровые теги и чужие рейтинги. Для меня ценность этих данных заключалась в трёх вещах: 1. Они коллективные — это не мнение критика, а срез вкусов тысяч зрителей. 2. Они противоречат интуиции — популярность не всегда равна качеству. 3. Они помогают увидеть старые работы вне ностальгии, через сухие числа. Кроме личной мотивации, я понимаю и более широкую перспективу: стриминговые сервисы используют подобные данные, чтобы удерживать внимание, увеличивать время просмотра и прибыль. Поэтому анализ аниме — это ещё и анализ механизмов рекомендаций.

Круговая диаграмма: распределение по типам

Original size 1089x890
Original size 1284x888

Я сознательно использовала разные типы визуализации, чтобы каждая отвечала своей задаче: • Столбчатые диаграммы — для сравнения популярности жанров. • Горизонтальные бары — для топа самых популярных аниме. • Точечные диаграммы — для выявления корреляций. • Круговая диаграмма — для соотношения форматов (TV / Movie). • Гистограммы — для распределений и динамики. • Сложенные и категориальные графики — для анализа по годам и жанрам.

Мне было важно, чтобы визуализация не просто украшала данные, а объясняла их.

Используемые статистические методы В проекте применялись: • описательная статистика (среднее, медиана, стандартное отклонение), • корреляция Пирсона, • агрегация данных по жанрам, годам и типам, • сравнительный анализ категорий, • визуальный анализ распределений.

Корреляция между рейтингом и количеством эпизодов

Original size 1267x790
Original size 1284x912

Точечная диаграмма: Жанр и популярность

Original size 1481x889
Original size 1284x1094

Анализ старых аниме (до 2000 года)

0
Original size 1364x512
Original size 1284x1094

Итоги:

Original size 4096x1538

Личный вывод

Этот проект оказался для меня неожиданно честным. Я поняла, что: • популярность часто не равна художественной ценности, • аниме — это не единый «жанр», а сложная экосистема форматов, эпох и аудиторий.

Теперь я понимаю, куда и зачем хочу углубляться дальше — и как использовать данные не против вкуса, а вместе с ним.

Original size 2567x1288

Применение генеративных нейросетей: Midjourney (для создания обложки и оформления) Chat gpt (для проверки текста) Claude (для проверки кода)