Original size 1024x1536

Музыкальные тренды 2000–2020: как менялись характеристики популярных треков

PROTECT STATUS: not protected
The project is taking part in the competition

Идея

Сравнительный анализ популярной музыки 2000–2020 годов, выявление тенденции изменения музыки за эти годы.

Обоснование выбора темы

У современной музыки есть много направлений по своему популярных и много артистов популярных в своих направлениях, но какую музыку можно считать глобально «популярной»? Какие ритмы сейчас привлекают к себе больше внимания? Насколько «танцевальная» современная музыка?

Для меня ответы не очевидны, поэтому я решила провести исследование и сравнить популярную музыку за последние 20 лет по показателям Spotify. К сожалению все датасеты, которые мне удалось найти не содержат статистику за 2020–2025 годы, поэтому я рассматриваю только 2000–2020 годы.

Конкретно я буду смотреть на показатели:

  1. danceability (танцевальность)
  2. tempo (темп)
  3. energy (энергичность)
  4. valence (позитивность)
  5. instrumentalness (инструментальность)
  6. loudness (громкость)

Источники данных

Анализ будет выполняться на основе метаданных популярных треков (тех, что попадали в чарты или имеют высокую популярность. Для визуализации я буду пользоваться библиотекой Pandas и программой Processing.

Датасеты которые я использовала:

  1. Датасет на 600 000 + треков, параметры и даты выпуска

Статистические методы:

1. Группировка по годам / декадам, расчёт средних и медианных значений 2. Корреляционный анализ между признаками 3. Стандартизация / нормализация для сравнения характеристик

Стиль

Цветовую палитру я нашла на Pinterest и дополнила одним цветом. Мне нужна была палитра минимум на 6 цветов, не считая фона, чтобы показывать на графиках 6 показателей, по которым я сравниваю музыку. На мой взгляд эта палитра достаточно разнообразна, чтобы цвета легко различались, при этом не слишком рябили.

Original size 1524x109

Ход работы

1. Поиск достаточно объёмного датасета 2. Очистка данных: убрать пропуски, отфильтровать по годам 3. Анализ: посчитать средние значения по годам 4. Визуализация: 4 разных типа графиков

Загрузка, фильтрация, систематизация

Загружаю нужные библиотеки и csv файл. Беру только популярные треки, фильтруя по популярности. Беру колонки только с избранными характеристиками.

Original size 1069x388

Нормализация

Чтобы сравнение было чище нужна нормализация

Original size 1069x112

Графики

Линейная диаграмма

Показывает буквально как сквозь годы росла и падала популярность разных черт в популярной музыке. Каждая черта это отдельная линия, у каждой черты есть степень реализации в песне от 0 до 1 (по системе Spotify).

Original size 1390x790

Для характеристик и годов, указанных в коде раньше, нарисовала линии. Каждая линия это характеристика.

Диаграмма с заполнением

Использовала те же нормализованные данные, использовала stackplot — он складывает значения друг на друга, каждый слой — одна характеристика.

Original size 1390x790

Круговая диаграмма

Выбрала последний доступный год, рассчитала проценты: каждая характеристика / сумма всех × 100%. Использовала plt.pie () для круга.

Original size 989x989

Тепловая карта

Повернула таблицу. Использовала imshow () для показа матрицы цветом, добавила числа в ячейки для точности.

Original size 1103x790

Использование ИИ

Я использовала чат GPT и DeepSeek для поиска ошибок в коде и структурирования кода, потому что текстовый код для меня непривычная среда работы и я часто в нём терялась.

FreePik использовала для генерации обложки.