
Введение
В последние годы анализ данных и их визуализация стали важным инструментом для изучения массовой культуры и пользовательских предпочтений. Цифровые платформы аккумулируют значительные объёмы информации о контенте и реакции аудитории, что позволяет исследовать не только сами культурные объекты, но и особенности их восприятия пользователями.
В данной работе в качестве объекта анализа была выбрана сфера аниме — одного из наиболее разнообразных и динамично развивающихся направлений современной популярной культуры. Аниме включает различные форматы, жанры и стили повествования и обладает широкой международной аудиторией, что делает его удобным материалом для изучения пользовательских оценок, жанровых предпочтений и форматов контента.
Целью работы является исследование структуры и характеристик аниме-контента на основе пользовательских рейтингов и метаданных, а также демонстрация возможностей визуализации данных как инструмента анализа и интерпретации этих характеристик.

Реализация
Для проведения анализа использовался открытый датасет, содержащий информацию об аниме с платформы Kaggle. В датасете представлены следующие основные параметры:
• название аниме;
• тип аниме (телесериал, фильм, OVA и другие форматы);
• жанры;
• количество эпизодов;
• средний пользовательский рейтинг;
• количество оценивших пользователей.
Ценность данного набора данных заключается в том, что он основан на массовых пользовательских оценках, а не на экспертных рецензиях. Это позволяет анализировать обобщённую реакцию широкой аудитории. Кроме того, объём датасета и разнообразие признаков делают его подходящим для исследования.
Стилизация
Палитра была выбрана исходя из эстетических предпочтений и ассоциаций, связанных с аниме в целом.
Код был реализован в Google Colab
Линейный график


Линейный график использовался для отображения среднего пользовательского рейтинга в зависимости от типа аниме. Данный тип графика был выбран, потому что он позволяет наглядно сравнить различные категории и выявить общие тенденции.
Пай-чарт

Круговая диаграмма применялась для визуализации распределения аниме по типам. Она позволяет определить долю каждого формата в общем объёме данных и оценить количественное преобладание отдельных категорий.
Из этих данных можно сделать вывод, что телесериалы преобладают как по общим рейтингам, так и по количеству.
Радиальная диаграмма


Радиальная диаграмма использовалась для представления наиболее распространённых жанров. Такой тип диаграммы облегчает сравнение категорий и наглядно показывает разнообразие рассматриваемых жанров.
Здесь мы можем увидеть, что чаще всего встречаются аниме жанров «комедия» и «экшен». Реже всего — «романтика» и «повседневность».
Boxplot график


На boxplot графике мы можем увидеть соотношение рейтинга и жанров. Из этой диаграммы можно сделать вывод, что несмотря на редкость, «сёнен» и «повседневность» имеют достаточно высокие пользовательские оценки. А вот детский жанр имеет не только низкую популярность, но и рейтинг.
Точечная диаграмма
С помощью точечной диаграммы можно увидеть соотношение количества эпизодов и рейтинга у различных типов аниме. Мы можем наблюдать, что самым высоким рейтингом обладают односерийные фильмы, а многосерийные тайтлы с количеством эпизодов превосходящим 500 держатся в среднем на рейтинге 6-7. Места выше занимают многосерийные тайтлы с количеством эпизодов до 250.
Описание применения генеративных моделей
Chat GPT — помощь в анализе данных Gemini 2.5 Flash — помощь в написании кода
Код