Original size 928x1312

Анализ рейтинга популярных аниме по типу и жанру

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

В последние годы анализ данных и их визуализация стали важным инструментом для изучения массовой культуры и пользовательских предпочтений. Цифровые платформы аккумулируют значительные объёмы информации о контенте и реакции аудитории, что позволяет исследовать не только сами культурные объекты, но и особенности их восприятия пользователями.

В данной работе в качестве объекта анализа была выбрана сфера аниме — одного из наиболее разнообразных и динамично развивающихся направлений современной популярной культуры. Аниме включает различные форматы, жанры и стили повествования и обладает широкой международной аудиторией, что делает его удобным материалом для изучения пользовательских оценок, жанровых предпочтений и форматов контента.

Целью работы является исследование структуры и характеристик аниме-контента на основе пользовательских рейтингов и метаданных, а также демонстрация возможностей визуализации данных как инструмента анализа и интерпретации этих характеристик.

big
Original size 1396x1020

Реализация

Для проведения анализа использовался открытый датасет, содержащий информацию об аниме с платформы Kaggle. В датасете представлены следующие основные параметры:

• название аниме;
• тип аниме (телесериал, фильм, OVA и другие форматы);
• жанры;
• количество эпизодов;
• средний пользовательский рейтинг;
• количество оценивших пользователей.

Ценность данного набора данных заключается в том, что он основан на массовых пользовательских оценках, а не на экспертных рецензиях. Это позволяет анализировать обобщённую реакцию широкой аудитории. Кроме того, объём датасета и разнообразие признаков делают его подходящим для исследования.

Стилизация

Original size 1334x494

Палитра была выбрана исходя из эстетических предпочтений и ассоциаций, связанных с аниме в целом.

Код был реализован в Google Colab

Линейный график

Линейный график использовался для отображения среднего пользовательского рейтинга в зависимости от типа аниме. Данный тип графика был выбран, потому что он позволяет наглядно сравнить различные категории и выявить общие тенденции.

Пай-чарт

post

Круговая диаграмма применялась для визуализации распределения аниме по типам. Она позволяет определить долю каждого формата в общем объёме данных и оценить количественное преобладание отдельных категорий.

Original size 1918x624

Из этих данных можно сделать вывод, что телесериалы преобладают как по общим рейтингам, так и по количеству.

Радиальная диаграмма

Радиальная диаграмма использовалась для представления наиболее распространённых жанров. Такой тип диаграммы облегчает сравнение категорий и наглядно показывает разнообразие рассматриваемых жанров.

Здесь мы можем увидеть, что чаще всего встречаются аниме жанров «комедия» и «экшен». Реже всего — «романтика» и «повседневность».

Boxplot график

На boxplot графике мы можем увидеть соотношение рейтинга и жанров. Из этой диаграммы можно сделать вывод, что несмотря на редкость, «сёнен» и «повседневность» имеют достаточно высокие пользовательские оценки. А вот детский жанр имеет не только низкую популярность, но и рейтинг.

Точечная диаграмма

Original size 984x583

С помощью точечной диаграммы можно увидеть соотношение количества эпизодов и рейтинга у различных типов аниме. Мы можем наблюдать, что самым высоким рейтингом обладают односерийные фильмы, а многосерийные тайтлы с количеством эпизодов превосходящим 500 держатся в среднем на рейтинге 6-7. Места выше занимают многосерийные тайтлы с количеством эпизодов до 250.

Original size 2002x912

Описание применения генеративных моделей

Chat GPT — помощь в анализе данных Gemini 2.5 Flash — помощь в написании кода