
Идея
Сравнительный анализ популярной музыки 2000–2020 годов, выявление тенденции изменения музыки за эти годы.
Обоснование выбора темы
У современной музыки есть много направлений по своему популярных и много артистов популярных в своих направлениях, но какую музыку можно считать глобально «популярной»? Какие ритмы сейчас привлекают к себе больше внимания? Насколько «танцевальная» современная музыка?
Для меня ответы не очевидны, поэтому я решила провести исследование и сравнить популярную музыку за последние 20 лет по показателям Spotify. К сожалению все датасеты, которые мне удалось найти не содержат статистику за 2020–2025 годы, поэтому я рассматриваю только 2000–2020 годы.
Конкретно я буду смотреть на показатели:
Источники данных
Анализ будет выполняться на основе метаданных популярных треков (тех, что попадали в чарты или имеют высокую популярность. Для визуализации я буду пользоваться библиотекой Pandas и программой Processing.
Датасеты которые я использовала:
Статистические методы:
1. Группировка по годам / декадам, расчёт средних и медианных значений 2. Корреляционный анализ между признаками 3. Стандартизация / нормализация для сравнения характеристик
Стиль
Цветовую палитру я нашла на Pinterest и дополнила одним цветом. Мне нужна была палитра минимум на 6 цветов, не считая фона, чтобы показывать на графиках 6 показателей, по которым я сравниваю музыку. На мой взгляд эта палитра достаточно разнообразна, чтобы цвета легко различались, при этом не слишком рябили.
Ход работы
1. Поиск достаточно объёмного датасета 2. Очистка данных: убрать пропуски, отфильтровать по годам 3. Анализ: посчитать средние значения по годам 4. Визуализация: 4 разных типа графиков
Загрузка, фильтрация, систематизация
Загружаю нужные библиотеки и csv файл. Беру только популярные треки, фильтруя по популярности. Беру колонки только с избранными характеристиками.
Нормализация
Чтобы сравнение было чище нужна нормализация
Графики
Линейная диаграмма
Показывает буквально как сквозь годы росла и падала популярность разных черт в популярной музыке. Каждая черта это отдельная линия, у каждой черты есть степень реализации в песне от 0 до 1 (по системе Spotify).
Для характеристик и годов, указанных в коде раньше, нарисовала линии. Каждая линия это характеристика.
Диаграмма с заполнением
Использовала те же нормализованные данные, использовала stackplot — он складывает значения друг на друга, каждый слой — одна характеристика.
Круговая диаграмма
Выбрала последний доступный год, рассчитала проценты: каждая характеристика / сумма всех × 100%. Использовала plt.pie () для круга.
Тепловая карта
Повернула таблицу. Использовала imshow () для показа матрицы цветом, добавила числа в ячейки для точности.
Использование ИИ
Я использовала чат GPT и DeepSeek для поиска ошибок в коде и структурирования кода, потому что текстовый код для меня непривычная среда работы и я часто в нём терялась.
FreePik использовала для генерации обложки.