Original size 1000x1500

Анализ кассовых сборов фильмов Disney

PROTECT STATUS: not protected
The project is taking part in the competition

ВЫБОР ДАННЫХ

Для данного проекта был выбран набор данных о кассовых сборах фильмов Disney (disney_movies_total_gross.csv). Этот датасет был найден на платформе Kaggle.

Выбор этой темы обусловлен несколькими факторами.

Во-первых, Disney является не просто киностудией, а глобальным культурным феноменом, формировавшим и продолжающим формировать поколения зрителей. Лично для меня это возможность взглянуть на знакомые истории под аналитическим углом.

Во-вторых, анализ таких данных позволяет не только выявить финансовые закономерности, но и понять, как менялась контентная стратегия студии, адаптируясь к меняющимся предпочтениям аудитории и общественным запросам.

Для всестороннего анализа и наглядной демонстрации результатов были выбраны следующие виды графиков: - Гистограмма. Для анализа распределения кассовых сборов фильмов — Линейный график. Для демонстрации динамики суммарных кассовых сборов по годам - Горизонтальная столбчатая диаграмма. Для сравнения суммарных кассовых сборов по различным жанрам - Сложенная столбчатая диаграмма. Для анализа эволюции возрастных рейтингов по десятилетиям

Для обработки данных была применена библиотека pandas, обеспечивающая эффективную работу с табличной информацией в CSV-формате. Первоначально проводилось знакомство с датасетом: анализировались его структуры, типы полей и фиксировались пропущенные значения.

ЭТАПЫ РАБОТЫ

big
Original size 573x525
Original size 870x255

А вот тут я начала анализ с загрузки основного набора данных — таблицы с кассовыми сборами мультфильмов Disney. Я импортировала файл CSV и сразу же посмотрела на первые несколько строк, чтобы убедиться, что данные загрузились корректно, и ознакомиться со структурой таблицы: названиями фильмов, датами выхода, жанрами, возрастными рейтингами и двумя показателями сборов.

Original size 406x256

На данном этапе проверила структуру данных и обнаружила пропуски в жанрах и рейтингах, а также необходимость преобразования дат. Это помогло спланировать следующий этап обработки.

Original size 505x60
Original size 232x337
Original size 426x465

Здесь я задала единый стиль для всех графиков проекта, чтобы они выглядели аккуратно и профессионально. Я установила размеры, шрифты, цвета фона и сетку, а также подобрала гармоничную цветовую палитру в сине-фиолетовых тонах.

Original size 605x93

В этом фрагменте я подготовила данные для анализа по временным периодам. Преобразовала текстовые даты выхода в формат, понятный Python, а затем создала два новых столбца: год и десятилетие выпуска. Это позволило мне в дальнейшем строить графики и анализировать тренды как по годам, так и по более крупным временным отрезкам.

ГРАФИК 1

Original size 458x344

Тут я проанализировала, как менялись средние кассовые сборы мультфильмов Disney от года к году. Я сгруппировала фильмы по году выпуска, рассчитала средние сборы с учётом инфляции для каждого года и представила результат в виде линейного графика. Это позволило увидеть долгосрочные тренды и выделить периоды наибольшей финансовой успешности студии.

Original size 1202x557

На этом графике я наглядно увидела, как менялась финансовая успешность Disney с 1940-х годов до 2010-х. Чётко видны периоды взлётов и падений — особенно заметны пики в середине века и устойчивый рост с 1980-х годов. Это подтвердило, что анимационная студия переживала разные эпохи, но в целом её коммерческая эффективность со временем росла.

ГРАФИК 2

Original size 462x344

Этот код строит горизонтальную диаграмму, показывающую 10 самых прибыльных жанров Disney по суммарным кассовым сборам с учётом инфляции. Он группирует фильмы по жанрам, суммирует их сборы и сортирует результаты. Для визуализации используется единый стиль проекта, что делает график наглядным и профессиональным.

Original size 1206x554

На этой диаграмме я наглядно увидела, какие жанры принесли Disney наибольший суммарный доход. Лидерами оказались приключения и комедии, что подтверждает ориентацию студии на развлекательное семейное кино. График также показал значительный разрыв между топовыми жанрами и остальными, что помогло оценить стратегический фокус компании на определённых тематиках.

ГРАФИК 3

Original size 432x238
Original size 1205x549

В этих фрагментах я построила гистограмму, чтобы увидеть, как распределены кассовые сборы мультфильмов. График показывает, что у Disney много фильмов со скромными сборами — они образуют высокий столбик слева. При этом несколько настоящих хитов собрали огромные суммы, создав длинный «хвост» справа — это обычная ситуация в киноиндустрии, где успех часто сосредоточен в единичных проектах.

ГРАФИК 4

Original size 478x272
Original size 1198x550

Здесь я подготовила данные и визуализировала, как менялась возрастная аудитория Disney по десятилетиям. Сначала я определила структуру будущего графика: на оси X — десятилетия, на оси Y — количество фильмов, разбитых по рейтингам MPAA (G, PG, PG-13 и другие). Затем с помощью кросс-таблицы и стекированной столбчатой диаграммы я наглядно показала, как рейтинг G доминировал в ранние десятилетия, а позже начали появляться фильмы с более взрослыми рейтингами PG и PG-13, что отражает эволюцию аудитории студии.

СТИЛИЗАЦИЯ ГРАФИКОВ

Для визуального оформления графиков мы разработали собственный стиль, взяв за основу цветовую палитру и настроение классической анимации Disney. Были подобраны оттенки, которые сразу создают сказочную, тёплую атмосферу: глубокий небесно-голубой. Этот цвет стал основой для всех диаграмм.

Original size 1536x417

ИСПОЛЬЗОВАНИЕ НЕЙРОСЕТЕЙ

При работе над проектом применялись специализированные инструменты, такие как ChatGPT, которые помогали в формулировке текстов, описании визуализаций, структурировании материалов и оформлении итоговых результатов. Их использование способствовало повышению качества и согласованности представления данных.

Проведённый анализ показал, что наибольший кассовый успех Disney обеспечивают фильмы в жанрах приключений и комедий. С течением времени студия постепенно расширяет возрастной диапазон, добавляя рейтинги PG и PG-13, сохраняя при этом основную ориентацию на категорию G. Распределение сборов соответствует отраслевой закономерности, где основную прибыль приносят единичные кассовые хиты.