Original size 1140x1600

Анализ мировых данных Spotify (2009–2025)

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

Для своего проекта я выбрала Spotify Global Music Dataset (2009–2025) — обширную коллекцию музыкальных данных, содержащую информацию о треках, артистах, альбомах и их характеристиках. Этот датасет был найден на платформе Kaggle и представляет собой агрегированные данные из Spotify API, охватывающие 16 лет музыкальной истории

Мой выбор обусловлен несколькими причинами. Во-первых, я испытываю глубокий интерес к музыке. Во-вторых, Spotify является одной из ведущих музыкальных платформ с аудиторией в сотни миллионов пользователей, что делает его данные особенно ценными для анализа музыкальных трендов. В-третьих, этот датасет обладает особой ценностью благодаря своей полноте — он включает не только базовую информацию о треках, но и количественные метрики популярности, которые редко бывают доступны в открытом доступе.

Эти данные и легли в основу большей части моего анализа. В своей работе я рассматриваю популярность различных аспектов индустрии, их взаимосвязь или визуализирую определенную часть данных для наглядности.

Датасет

Стилизация

Основой стилизации стала айдентика платформы Spotify. Я использовала фирменный шрифт и цвета, немного расширила палитру смежными оттенками для более разнообразной визуализации данных.

big
Original size 4400x933

Диаграмма рассеяния

Между количеством треков в альбоме и популярностью отдельных песен наблюдается очень слабая отрицательная корреляция (r = −0.047). Это говорит о том, что объём альбома практически не влияет на популярность конкретного трека у слушателей.

big
Original size 3236x1785
0

Цвет кода изменен через ray.so

Круговая диаграмма

Среди наиболее популярных треков (вошедших в топ-50) наиболее популярными релизами являются полноценные альбомы — они составляют более половины (57.4%) выборки. Это может быть связано с тем, что альбомы чаще усердно продвигают, а мучительное ожидание релиза создаёт больший ажиотаж, что в итоге влияет на высокий уровень прослушиваний.

Original size 2095x2141
0

Цвет кода изменен через ray.so

Ящик с усами

популярность треков сильно варьируется в зависимости от жанра. Такие направления, как pop и edm, показывают стабильно высокую медианную популярность, в то время как grunge и art pop демонстрируют широкий разброс значений. Помимо этого довольно широкий разброс у категории неопределенного жанра.

Original size 3708x2025
0

Цвет кода изменен через ray.so

Столбчатая диаграмма

Абсолютное большинство треков в выборке (75%) имеют маркировку Explicit. Это отражает общую тенденцию в современной музыке, где контент для взрослой аудитории стал преобладающим.

Original size 3017x2025
0

Цвет кода изменен через ray.so

Гистограмма

Самыми популярными артистами на платформе являются Taylor Swift, Drake и Bad Bunny. Все они имеют рейтинг популярности, близкий к максимальному (94-100 баллов), что говорит об их глобальном влиянии и огромной аудитории на Spotify.

Original size 3218x2162
0

Цвет кода изменен через ray.so

Выводы

Анализ данных Spotify выявил ключевые закономерности в современной музыкальной индустрии. Хотя количество треков в альбоме слабо влияет на популярность релиза, слушатели активнее взаимодействуют с материалом из полноценных альбомов, чем с синглами — вероятно, благодаря масштабному продвижению и ажиотажу вокруг продукта.

Популярность треков сильно варьируется в зависимости от жанра: pop и edm демонстрируют стабильно высокую медианную популярность, в то время как grunge и art pop показывают широкий разброс значений. Значительный разброс также наблюдается у релизов с неопределённым жанром, что может указывать на экспериментальный или межжанровый характер таких композиций.

При этом абсолютное большинство треков (75%) имеют маркировку Explicit, что подтверждает доминирование «взрослого» контента на платформе.

Таким образом, успех трека на Spotify формируется под влиянием нескольких факторов: статуса исполнителя, жанровой принадлежности и формата релиза. Альбомы остаются основным драйвером внимания аудитории, а контент с маркировкой Explicit стал новой нормой в современной музыке.

Описание применения генеративной модели

В своем проекта я использовала Deepseek (https://chat.deepseek.com) для улучшения и коррекции кода, а также для повышения качества и лучшей читабельности описаний.