Original size 1140x1600

Data Analysis of Netflix

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

В рамках проекта был проведён анализ датасета Netflix Movies and TV Shows, содержащего информацию о фильмах и сериалах, доступных на платформе Netflix. Данные включают тип контента, год выпуска, жанры и возрастные рейтинги.

Интерес к данному датасету связан с тем, что Netflix является одной из ключевых платформ, формирующих современную медиасреду. Анализ его контента позволяет проследить, как менялась стратегия платформы и структура медиапредложения со временем.

Цель

Цель исследования — изучить динамику роста контента Netflix и выявить структурные особенности платформы:

изменение объёма контента во времени,

соотношение фильмов и сериалов,

распределение возрастных рейтингов,

различия в жанровой структуре фильмов и сериалов.

Исследование носит описательно-аналитический характер и направлено на выявление общих паттернов.

Визуальный код

big
Original size 2432x1664

Изображение сгенерировано нейросетью SeeDream

промт сгенерирован в чате GPT: cinematic streaming platform style illustration, dark background, black and deep red color palette, dramatic lighting, wide format 3:2 a person analyzing massive amounts of video content on multiple floating screens, screens show different genres: drama, crime, sci-fi, romance, horror, documentary, animation, data dashboards, charts, graphs mixed with movie frames, glowing red accents, dynamic motion trails, immersive composition, modern digital illustration, premium streaming service aesthetic, sharp focus, high contrast, cinematic depth, editorial style, no text, no logos

В качестве основного шрифта была выбрана Helvetica.

Helvetica — нейтральный гротеск, изначально разработанный для информационного дизайна и визуальных систем навигации. Она обладает высокой читаемостью и минимальным визуальным характером, что делает её особенно подходящей для визуализации данных.

Original size 878x119

В проекте используется ограниченная палитра из красного, чёрного и белого цветов.

Красный используется как акцентный цвет для выделения ключевых элементов и важных паттернов в данных.

Такое цветовое решение отсылает к визуальному языку Netflix, но не копирует его напрямую. Цвет используется дозированно и функционально, а не как декоративный элемент.

Этапы анализа и визуализации

Первый график показывает общее количество контента Netflix в разрезе годов выпуска.

Наблюдается резкий рост количества тайтлов после 2010 года, с пиком в период 2016–2019 годов. Это отражает фазу активного масштабирования платформы, когда Netflix начал интенсивно расширять библиотеку контента.

Ранние годы представлены слабо, что связано не с отсутствием контента как такового, а с особенностями формирования библиотеки платформы.

Линейный график является наиболее подходящим инструментом для анализа временных рядов. Он позволяет наглядно показать:

общий рост количества контента,

моменты резкого ускорения или спада,

Original size 988x790
Original size 1233x694

Соотношение фильмов и сериалов.

Данный график сравнивает общее количество фильмов и сериалов на платформе.

Фильмы количественно преобладают над сериалами, однако это соотношение не отражает стратегическую значимость форматов. Несмотря на меньшее количество, сериалы играют ключевую роль в удержании аудитории, что требует дальнейшего анализа их структуры и жанров.

Столбчатая диаграмма оптимальна для сравнения категорий с чёткими границами. В данном случае сравниваются два типа контента — фильмы и сериалы.

Original size 989x790

Возрастные рейтинги во времени

Тепловая карта используется для анализа распределения возрастных рейтингов во времени.

Основная концентрация контента приходится на рейтинги TV-MA и TV-14, особенно в период активного роста платформы. Это указывает на фокус Netflix на подростковую и взрослую аудиторию.

Данный график использовался как инструмент исследовательского анализа и позволяет выявить общие паттерны, однако из-за высокой детализации требует интерпретации в сочетании с другими визуализациями.

Тепловая карта подходит для анализа двухмерных распределений, где важно увидеть:

плотность данных,

концентрации,

изменения структуры во времени.

Original size 936x789
0

Жанровая структура фильмов и сериалов

Кольцевая диаграмма демонстрирует различия в жанровой структуре фильмов и сериалов.

Фильмы представлены более широким жанровым спектром, включая международное кино, драмы, комедии и независимые проекты. Сериалы, в свою очередь, демонстрируют концентрацию вокруг нескольких ключевых форматов: драм, комедий, криминальных и документальных сериалов.

Это подчёркивает различие в стратегиях: фильмы обеспечивают разнообразие библиотеки, тогда как сериалы формируют устойчивые жанровые ядра.

Кольцевая диаграмма позволяет сравнить доли категорий внутри ограниченного множества, а двойное кольцо даёт возможность сопоставить две структуры одновременно.

Original size 1001x790
0

Используемые методы анализа данных

В рамках проекта применялись методы описательной статистики и агрегации данных:

группировка данных по годам, типам контента, жанрам и возрастным рейтингам (groupby);

использование сводных таблиц (pivot_table) для анализа распределений;

подсчёт абсолютных значений и долей;

анализ временных рядов для выявления трендов.

Все вычисления и визуализации были выполнены с использованием библиотеки Pandas и Matplotlib.

Итоги исследования

Анализ показал, что Netflix за последние годы значительно изменил структуру своего контента:

наблюдается экспоненциальный рост объёма контента после 2010 года;

фильмы количественно преобладают, однако сериалы играют ключевую стратегическую роль;

платформа ориентирована преимущественно на подростковую и взрослую аудиторию;

жанровая структура фильмов и сериалов принципиально различается.

Проект демонстрирует, как методы анализа данных и визуализации могут использоваться для исследования медиаплатформ и выявления структурных особенностей контента.

Original size 1536x1024