
Описание проекта
Для своего проекта я выбрала Spotify Global Music Dataset (2009–2025) — обширную коллекцию музыкальных данных, содержащую информацию о треках, артистах, альбомах и их характеристиках. Этот датасет был найден на платформе Kaggle и представляет собой агрегированные данные из Spotify API, охватывающие 16 лет музыкальной истории
Мой выбор обусловлен несколькими причинами. Во-первых, я испытываю глубокий интерес к музыке. Во-вторых, Spotify является одной из ведущих музыкальных платформ с аудиторией в сотни миллионов пользователей, что делает его данные особенно ценными для анализа музыкальных трендов. В-третьих, этот датасет обладает особой ценностью благодаря своей полноте — он включает не только базовую информацию о треках, но и количественные метрики популярности, которые редко бывают доступны в открытом доступе.
Эти данные и легли в основу большей части моего анализа. В своей работе я рассматриваю популярность различных аспектов индустрии, их взаимосвязь или визуализирую определенную часть данных для наглядности.
Стилизация
Основой стилизации стала айдентика платформы Spotify. Я использовала фирменный шрифт и цвета, немного расширила палитру смежными оттенками для более разнообразной визуализации данных.

Диаграмма рассеяния
Между количеством треков в альбоме и популярностью отдельных песен наблюдается очень слабая отрицательная корреляция (r = −0.047). Это говорит о том, что объём альбома практически не влияет на популярность конкретного трека у слушателей.

Цвет кода изменен через ray.so
Круговая диаграмма
Среди наиболее популярных треков (вошедших в топ-50) наиболее популярными релизами являются полноценные альбомы — они составляют более половины (57.4%) выборки. Это может быть связано с тем, что альбомы чаще усердно продвигают, а мучительное ожидание релиза создаёт больший ажиотаж, что в итоге влияет на высокий уровень прослушиваний.
Цвет кода изменен через ray.so
Ящик с усами
популярность треков сильно варьируется в зависимости от жанра. Такие направления, как pop и edm, показывают стабильно высокую медианную популярность, в то время как grunge и art pop демонстрируют широкий разброс значений. Помимо этого довольно широкий разброс у категории неопределенного жанра.
Цвет кода изменен через ray.so
Столбчатая диаграмма
Абсолютное большинство треков в выборке (75%) имеют маркировку Explicit. Это отражает общую тенденцию в современной музыке, где контент для взрослой аудитории стал преобладающим.
Цвет кода изменен через ray.so
Гистограмма
Самыми популярными артистами на платформе являются Taylor Swift, Drake и Bad Bunny. Все они имеют рейтинг популярности, близкий к максимальному (94-100 баллов), что говорит об их глобальном влиянии и огромной аудитории на Spotify.
Цвет кода изменен через ray.so
Выводы
Анализ данных Spotify выявил ключевые закономерности в современной музыкальной индустрии. Хотя количество треков в альбоме слабо влияет на популярность релиза, слушатели активнее взаимодействуют с материалом из полноценных альбомов, чем с синглами — вероятно, благодаря масштабному продвижению и ажиотажу вокруг продукта.
Популярность треков сильно варьируется в зависимости от жанра: pop и edm демонстрируют стабильно высокую медианную популярность, в то время как grunge и art pop показывают широкий разброс значений. Значительный разброс также наблюдается у релизов с неопределённым жанром, что может указывать на экспериментальный или межжанровый характер таких композиций.
При этом абсолютное большинство треков (75%) имеют маркировку Explicit, что подтверждает доминирование «взрослого» контента на платформе.
Таким образом, успех трека на Spotify формируется под влиянием нескольких факторов: статуса исполнителя, жанровой принадлежности и формата релиза. Альбомы остаются основным драйвером внимания аудитории, а контент с маркировкой Explicit стал новой нормой в современной музыке.
Описание применения генеративной модели
В своем проекта я использовала Deepseek (https://chat.deepseek.com) для улучшения и коррекции кода, а также для повышения качества и лучшей читабельности описаний.