Original size 640x840

Анализ музыкальных данных и их визуализация

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

Музыка — один из самых массовых и эмоционально насыщенных культурных продуктов, который постоянно отражает изменения в обществе, технологиях и вкусах аудитории. Современные стриминговые сервисы позволяют не только слушать музыку, но и количественно описывать её звучание с помощью аудиохарактеристик. Это даёт возможность исследовать музыкальные тренды не интуитивно, а через данные.

В своём аналитическом проекте я работала с датасетом, основанным на данных Spotify, который содержит информацию о популярных музыкальных треках и их аудиохарактеристиках. В анализе использовался файл datos_merged_1986_2023.csv, однако основное внимание было сосредоточено на периоде с 2015 по 2023 год — времени активного развития стриминговой культуры и глобальных музыкальных трендов. Датасет включает такие параметры, как энергичность, позитивность, танцевальность, темп, громкость и акустичность треков.

Мне было интересно посмотреть, как меняется «звуковое настроение» популярной музыки со временем и можно ли зафиксировать устойчивые паттерны в аудиохарактеристиках. Музыка в данном случае рассматривается не только как художественный объект, но и как отражение массовых предпочтений и эмоционального фона эпохи.

big
Original size 736x414

Визуальная концепция

Для визуализации данных я выбрала минималистичный стиль, в котором основное внимание уделяется самим данным и их взаимосвязям. При этом мне было важно сохранить ощущение разнообразия и динамики, поэтому минимализм сочетается с яркими акцентными цветами. Такой подход позволяет подчеркнуть многогранность современной музыки и визуально различать аудиохарактеристики, не перегружая графики лишними деталями.

Цветовое решение проекта построено на контрасте тёмного фона и насыщенных оттенков. Каждый цвет используется осознанно и соответствует отдельным параметрам музыкального анализа, отражая разные аспекты звучания — от настроения и энергии до ритма и текстуры. В результате визуализации выглядят цельно, современно и поддерживают общий аналитический нарратив проекта.

Original size 3180x727

Цвета: #FFB86C, #8BE9FD, #BD93F9, #50FA7B, #ADBFDA

Обработка данных

Работа с данными велась с использованием библиотеки Pandas. На первом этапе был загружен CSV-файл с данными, после чего я привела информацию о годе релиза треков к числовому формату. Далее датасет был отфильтрован по диапазону 2015–2023 годов, чтобы сосредоточиться на современной музыкальной сцене.

Original size 1596x414

После фильтрации я оставила только те столбцы, которые были необходимы для анализа аудиохарактеристик. Для части визуализаций данные агрегировались по годам с помощью группировки и вычисления средних значений. Для тепловой карты дополнительно была применена нормализация значений, чтобы разные характеристики можно было корректно сравнивать между собой.

Визуализация данных

0

Линейный график. Динамика позитивности и энергичности

Линейный график демонстрирует динамику средних значений позитивности и энергичности треков по годам. Он позволяет увидеть, насколько стабильны эти характеристики во времени и происходят ли заметные сдвиги в общем настроении популярной музыки.

0

Точечная диаграмма. распределение треком по энергичности и позитивности

Точечная диаграмма показывает распределение треков в пространстве энергичности и позитивности. Такой формат позволяет оценить плотность точек и увидеть, какие сочетания этих характеристик встречаются чаще всего, а какие остаются редкими.

0

Гистограмма. Распределение темпа треков по годам

Гистограмма используется для анализа распределения темпа треков. С её помощью можно понять, в каком диапазоне BPM чаще всего находится популярная музыка и насколько разнообразен ритмический рисунок треков.

0

Тепловая карта. Средние аудиохарактеристики по годам

Тепловая карта объединяет сразу несколько аудиохарактеристик и показывает их средние значения по годам. Этот график помогает сравнивать характеристики между собой и отслеживать общие изменения музыкального звучания во времени.

Описание применения генеративной модели

В процессе работы я использовала генеративную модель ChatGPT в качестве вспомогательного инструмента. Она помогала на этапах подготовки и очистки данных, а также при работе со стилизацией визуализаций и структурированием аналитического текста. Генеративная модель не применялась для генерации самих данных и не влияла на итоговые значения показателей.

Ссылка на модель: https://chatgpt.com/

Выводы

Проведённый анализ показывает, что аудиохарактеристики популярной музыки в период с 2015 по 2023 год демонстрируют относительную стабильность, без резких скачков. При этом внутри этой стабильности можно наблюдать тонкие сдвиги в балансе энергичности, позитивности и ритмики, которые отражают изменения музыкальных трендов и вкусов аудитории.

Проект демонстрирует, что даже такие субъективные категории, как «настроение» и «характер» музыки, могут быть исследованы с помощью данных и визуализации. Использование минималистичного визуального языка позволяет сосредоточиться на самих закономерностях и делает анализ более прозрачным и читаемым.