Original size 855x1280

Анализ самых прослушиваемых треков в Spotify

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

Первая стриминговая музыкальная платформа появилась в начале 2000-х годов. На 2025 год Spotify является самой популярной стриминговой площадкой и одним из крупнейших сервисов дистрибуции музыки в мире. Однако возникает вопрос: какие музыкальные треки стали самыми популярными за всё время существования стриминга?

big
Original size 830x467

Я выбрала подробный датасет с платформы Kaggle, содержащий информацию о всех треках в Spotify

Моя цель узнать какие из треков стали наиболее популярными за все время

Загрузка и подготовка данных На начальном этапе была выполнена загрузка датасета в формате CSV с использованием библиотеки Pandas. В процессе подготовки данных была проведена базовая предобработка, включая преобразование даты релиза треков и извлечение года выпуска, что позволило использовать временной анализ в дальнейшем исследовании.

big
Original size 1280x483

Общая стилизация графиков (единый визуальный стиль) Для обеспечения визуальной консистентности графиков была выполнена настройка глобальных параметров отображения библиотеки Matplotlib. В рамках данного этапа были заданы единый шрифт, цвет фона и параметры оформления, что позволило отойти от стандартного визуального стиля и создать более целостную инфографику.

Original size 1318x324
Original size 1238x962

Для анализа популярности треков была использована гистограмма, позволяющая изучить распределение количественной переменной. Данный метод помогает выявить форму распределения данных, наличие асимметрии и концентрацию значений. По графику можно сделать вывод о том, что большинство треков имеет низкую или среднюю популярность, в то время как очень популярные треки встречаются значительно реже.

График 2 — Danceability vs Energy (scatter plot)

Original size 1198x956
Original size 1400x626

Для исследования взаимосвязи между показателями danceability и energy была использована диаграмма рассеяния. Этот метод применяется для визуального анализа корреляции между двумя числовыми признаками и выявления возможных зависимостей. Распределение точек позволяет оценить характер связи между показателями и наличие областей с высокой плотностью значений.

График 3. Средняя популярность треков по годам (линейный график)

Original size 1170x966
Original size 1496x924

Временной анализ был проведён с использованием агрегации данных по годам и вычисления среднего значения популярности. Линейный график позволяет проследить динамику изменения средней популярности треков во времени и выявить долгосрочные тренды. Данный подход помогает понять, как менялись характеристики музыкального контента Spotify в разные исторические периоды.

График 4 — Топ-10 артистов по количеству треков (bar chart)

Original size 1120x1138
Original size 1382x998

Для анализа активности артистов был применён частотный анализ, основанный на подсчёте количества треков каждого исполнителя. Столбчатая диаграмма используется для сравнения категориальных данных и наглядного представления лидеров по количеству записей. Этот метод позволяет выделить артистов с наибольшим вкладом в датасет и оценить степень их представленности.

Проведённый анализ подтвердил, что популярность музыкальных треков на Spotify является многофакторным показателем и зависит как от временных тенденций, так и от характеристик самой музыки. Использование визуализаций позволило наглядно представить сложные зависимости и упростить интерпретацию данных. Полученные результаты могут быть полезны для дальнейших исследований музыкальных трендов, рекомендационных систем и анализа предпочтений слушателей. В целом, проект демонстрирует эффективность применения инструментов анализа данных и визуализации для изучения больших музыкальных датасетов и выявления актуальных трендов в индустрии стриминга.