Original size 1737x2451

Анализ данных в музыке. Ритм жизни по плейлистам

PROTECT STATUS: not protected
The project is taking part in the competition

Для анализа я выбрал тему: «Когда мы слушаем музыку: ритм жизни по данным Spotify».

Описание проекта:

В рамках данного проекта я изучаю повседневные музыкальные предпочтения людей на основе данных, предоставленных Spotify. Для анализа был использован набор данных, содержащий информацию о времени прослушивания треков и продолжительности каждого сеанса.

Меня привлекла идея рассматривать музыку не как совокупность треков или жанров, а как индикатор ритма жизни. Интересно узнать, в какие моменты мы обращаемся к музыке, в какие дни и часы она становится частью нашей повседневной активности, и как изменяются наши привычки в течение недели.

Музыкальные предпочтения — это форма повседневного поведения, которую можно визуализировать, почти как «пульс» человека. Поэтому основное внимание в проекте уделено времени, регулярности и распределению активности, а не рейтингам или жанрам.

Этап работы:

Работа над проектом началась с загрузки датасета истории прослушиваний Spotify в Google Colab. Сначала я провёл первичный обзор данных: проверил размер таблицы, названия колонок и наличие пропусков. Поскольку в разных версиях Spotify-датасетов названия столбцов могут отличаться, я реализовал автоматический поиск ключевых колонок — времени прослушивания и длительности — чтобы код работал устойчиво и не зависел от конкретного формата файла.

Далее временные значения были преобразованы в формат datetime, а длительность прослушивания приведена к единой единице измерения — минутам. На этом этапе были удалены пустые строки и нулевые значения, чтобы визуализации не получались пустыми и отражали реальную активность. После очистки данных я создал дополнительные признаки, необходимые для анализа ритма жизни: час суток и день недели.

Затем данные были агрегированы под задачи каждого графика: суммарные минуты по часам, по дням недели, топ артистов по общему времени прослушивания, распределение длительности прослушиваний и матрица «день × час» для тепловой карты. После этого была настроена единая стилизация визуализаций в зелёной палитре: одинаковый фон, сетка, размеры шрифтов и цвета, чтобы все графики выглядели как часть одной инфографики. Финальным этапом стало формулирование выводов по каждому графику и общего вывода по проекту.

Стилистика и оформление графиков

Original size 1000x1500
Original size 1536x1024

Оформление таблиц

В проекте использовалась ограниченная зелёная цветовая палитра, заданная напрямую в коде визуализаций:

Тёмно-зелёный — #1B5E20 Использовался для заголовков, подписей осей, текста и акцентных элементов.

Основной зелёный — #2E7D32 Применялся для основных графических объектов: столбцов, линий и точек.

Светло-зелёный — #A5D6A7 Использовался для вспомогательных элементов и смягчения визуального контраста.

Светло-серый — #DDE6DD Применялся для сетки и второстепенных линий, чтобы не отвлекать внимание от данных.

Белый фон — #FFFFFF Использовался как основной фон всех графиков и слайдов для сохранения чистоты и читаемости.

Original size 1553x1058

Пример кода для настройки стиля

График 1. Музыкальная активность в течение дня

0

Пример кода\график

Первый график показывает, как меняется суммарное время прослушивания музыки в зависимости от часа суток.

По оси X отложены часы дня, по оси Y — общее количество минут прослушивания. Это базовая визуализация, которая задаёт общий ритм исследования.

Вывод: Музыкальная активность неравномерна в течение суток. Видны периоды повышенной активности в дневные и вечерние часы, тогда как ночью прослушивание минимально. Это подтверждает гипотезу о том, что музыка сопровождает активные фазы дня и практически отсутствует во время сна.

График 2. Музыкальная активность по дням недели

0

Пример кода/ график

Второй график показывает распределение времени прослушивания по дням недели. Для корректного сравнения дни были выстроены в логическом порядке — от понедельника к воскресенью.

Вывод: Активность прослушивания меняется в зависимости от дня недели. В рабочие дни музыка, вероятно, сопровождает повседневные задачи и фоновую деятельность, тогда как в выходные структура потребления может быть более свободной и менее регулярной. Музыка становится частью не только работы, но и отдыха.

График 3. Топ-10 артистов по времени прослушивания

Original size 736x981
0

График/пример кода

Третий график — горизонтальная столбчатая диаграмма, показывающая десять артистов, на которых приходится наибольшее суммарное время прослушивания.

В отличие от простого подсчёта количества треков, здесь используется именно время, что позволяет выявить устойчивые музыкальные предпочтения.

Вывод: Небольшое количество артистов формирует основу музыкального потребления. Это говорит о том, что музыкальные привычки часто строятся вокруг «якорных» исполнителей, к которым пользователь регулярно возвращается.

График 4. Распределение длительности прослушиваний

Четвёртый график — гистограмма, показывающая, как часто встречаются короткие и длинные прослушивания треков. Для улучшения читаемости экстремальные значения были ограничены.

Вывод: Основная масса прослушиваний укладывается в диапазон стандартной длины музыкального трека. Однако присутствие большого количества коротких прослушиваний может указывать на переключение между треками или пробное прослушивание, а длинные значения — на подкасты, лайвы или фоновое воспроизведение.

0

График\ пример кода

Original size 793x1200

График 5. Тепловая карта «день недели × час»

Пятый график объединяет два измерения — день недели и время суток — в виде тепловой карты. Интенсивность цвета показывает суммарное время прослушивания.

Вывод: Этот график наглядно демонстрирует индивидуальный ритм жизни. Видны устойчивые временные окна, в которые музыка появляется регулярно, а также различия между буднями и выходными. Музыкальное поведение оказывается тесно связано с расписанием дня.

0

График/ пример кода

Общий вывод по проекту

В ходе проекта было показано, что данные о прослушивании музыки могут быть использованы не только для анализа вкусов, но и для изучения повседневных ритмов жизни.

Музыка в данном контексте выступает как фоновая практика, сопровождающая работу, отдых и рутину. Через временные визуализации становится видно, что музыкальное потребление подчиняется чётким паттернам и повторяется изо дня в день.

Проект демонстрирует, как даже персональные данные небольшого объёма при правильной обработке и визуализации могут превратиться в осмысленное исследование повседневного поведения.

Использованные нейросети: 1. Chat GPT для генерации изображений и для запросов рекомендаций по улучшению кода и его написанию.

Original size 736x981