
Введение
Первая стриминговая музыкальная платформа появилась в начале 2000-х годов. На 2025 год Spotify является самой популярной стриминговой площадкой и одним из крупнейших сервисов дистрибуции музыки в мире. Однако возникает вопрос: какие музыкальные треки стали самыми популярными за всё время существования стриминга?

Я выбрала подробный датасет с платформы Kaggle, содержащий информацию о всех треках в Spotify
Моя цель узнать какие из треков стали наиболее популярными за все время
Загрузка и подготовка данных На начальном этапе была выполнена загрузка датасета в формате CSV с использованием библиотеки Pandas. В процессе подготовки данных была проведена базовая предобработка, включая преобразование даты релиза треков и извлечение года выпуска, что позволило использовать временной анализ в дальнейшем исследовании.

Общая стилизация графиков (единый визуальный стиль) Для обеспечения визуальной консистентности графиков была выполнена настройка глобальных параметров отображения библиотеки Matplotlib. В рамках данного этапа были заданы единый шрифт, цвет фона и параметры оформления, что позволило отойти от стандартного визуального стиля и создать более целостную инфографику.
Для анализа популярности треков была использована гистограмма, позволяющая изучить распределение количественной переменной. Данный метод помогает выявить форму распределения данных, наличие асимметрии и концентрацию значений. По графику можно сделать вывод о том, что большинство треков имеет низкую или среднюю популярность, в то время как очень популярные треки встречаются значительно реже.
График 2 — Danceability vs Energy (scatter plot)
Для исследования взаимосвязи между показателями danceability и energy была использована диаграмма рассеяния. Этот метод применяется для визуального анализа корреляции между двумя числовыми признаками и выявления возможных зависимостей. Распределение точек позволяет оценить характер связи между показателями и наличие областей с высокой плотностью значений.
График 3. Средняя популярность треков по годам (линейный график)
Временной анализ был проведён с использованием агрегации данных по годам и вычисления среднего значения популярности. Линейный график позволяет проследить динамику изменения средней популярности треков во времени и выявить долгосрочные тренды. Данный подход помогает понять, как менялись характеристики музыкального контента Spotify в разные исторические периоды.
График 4 — Топ-10 артистов по количеству треков (bar chart)
Для анализа активности артистов был применён частотный анализ, основанный на подсчёте количества треков каждого исполнителя. Столбчатая диаграмма используется для сравнения категориальных данных и наглядного представления лидеров по количеству записей. Этот метод позволяет выделить артистов с наибольшим вкладом в датасет и оценить степень их представленности.
Проведённый анализ подтвердил, что популярность музыкальных треков на Spotify является многофакторным показателем и зависит как от временных тенденций, так и от характеристик самой музыки. Использование визуализаций позволило наглядно представить сложные зависимости и упростить интерпретацию данных. Полученные результаты могут быть полезны для дальнейших исследований музыкальных трендов, рекомендационных систем и анализа предпочтений слушателей. В целом, проект демонстрирует эффективность применения инструментов анализа данных и визуализации для изучения больших музыкальных датасетов и выявления актуальных трендов в индустрии стриминга.