
Для анализа я выбрал тему: «Когда мы слушаем музыку: ритм жизни по данным Spotify».
Описание проекта:
В рамках данного проекта я изучаю повседневные музыкальные предпочтения людей на основе данных, предоставленных Spotify. Для анализа был использован набор данных, содержащий информацию о времени прослушивания треков и продолжительности каждого сеанса.
Меня привлекла идея рассматривать музыку не как совокупность треков или жанров, а как индикатор ритма жизни. Интересно узнать, в какие моменты мы обращаемся к музыке, в какие дни и часы она становится частью нашей повседневной активности, и как изменяются наши привычки в течение недели.
Музыкальные предпочтения — это форма повседневного поведения, которую можно визуализировать, почти как «пульс» человека. Поэтому основное внимание в проекте уделено времени, регулярности и распределению активности, а не рейтингам или жанрам.


Этап работы:
Работа над проектом началась с загрузки датасета истории прослушиваний Spotify в Google Colab. Сначала я провёл первичный обзор данных: проверил размер таблицы, названия колонок и наличие пропусков. Поскольку в разных версиях Spotify-датасетов названия столбцов могут отличаться, я реализовал автоматический поиск ключевых колонок — времени прослушивания и длительности — чтобы код работал устойчиво и не зависел от конкретного формата файла.
Далее временные значения были преобразованы в формат datetime, а длительность прослушивания приведена к единой единице измерения — минутам. На этом этапе были удалены пустые строки и нулевые значения, чтобы визуализации не получались пустыми и отражали реальную активность. После очистки данных я создал дополнительные признаки, необходимые для анализа ритма жизни: час суток и день недели.
Затем данные были агрегированы под задачи каждого графика: суммарные минуты по часам, по дням недели, топ артистов по общему времени прослушивания, распределение длительности прослушиваний и матрица «день × час» для тепловой карты. После этого была настроена единая стилизация визуализаций в зелёной палитре: одинаковый фон, сетка, размеры шрифтов и цвета, чтобы все графики выглядели как часть одной инфографики. Финальным этапом стало формулирование выводов по каждому графику и общего вывода по проекту.
Стилистика и оформление графиков
Оформление таблиц
В проекте использовалась ограниченная зелёная цветовая палитра, заданная напрямую в коде визуализаций:
Тёмно-зелёный — #1B5E20 Использовался для заголовков, подписей осей, текста и акцентных элементов.
Основной зелёный — #2E7D32 Применялся для основных графических объектов: столбцов, линий и точек.
Светло-зелёный — #A5D6A7 Использовался для вспомогательных элементов и смягчения визуального контраста.
Светло-серый — #DDE6DD Применялся для сетки и второстепенных линий, чтобы не отвлекать внимание от данных.
Белый фон — #FFFFFF Использовался как основной фон всех графиков и слайдов для сохранения чистоты и читаемости.
Пример кода для настройки стиля
График 1. Музыкальная активность в течение дня
Пример кода\график
Первый график показывает, как меняется суммарное время прослушивания музыки в зависимости от часа суток.
По оси X отложены часы дня, по оси Y — общее количество минут прослушивания. Это базовая визуализация, которая задаёт общий ритм исследования.
Вывод: Музыкальная активность неравномерна в течение суток. Видны периоды повышенной активности в дневные и вечерние часы, тогда как ночью прослушивание минимально. Это подтверждает гипотезу о том, что музыка сопровождает активные фазы дня и практически отсутствует во время сна.
График 2. Музыкальная активность по дням недели
Пример кода/ график
Второй график показывает распределение времени прослушивания по дням недели. Для корректного сравнения дни были выстроены в логическом порядке — от понедельника к воскресенью.
Вывод: Активность прослушивания меняется в зависимости от дня недели. В рабочие дни музыка, вероятно, сопровождает повседневные задачи и фоновую деятельность, тогда как в выходные структура потребления может быть более свободной и менее регулярной. Музыка становится частью не только работы, но и отдыха.
График 3. Топ-10 артистов по времени прослушивания
График/пример кода
Третий график — горизонтальная столбчатая диаграмма, показывающая десять артистов, на которых приходится наибольшее суммарное время прослушивания.
В отличие от простого подсчёта количества треков, здесь используется именно время, что позволяет выявить устойчивые музыкальные предпочтения.
Вывод: Небольшое количество артистов формирует основу музыкального потребления. Это говорит о том, что музыкальные привычки часто строятся вокруг «якорных» исполнителей, к которым пользователь регулярно возвращается.
График 4. Распределение длительности прослушиваний
Четвёртый график — гистограмма, показывающая, как часто встречаются короткие и длинные прослушивания треков. Для улучшения читаемости экстремальные значения были ограничены.
Вывод: Основная масса прослушиваний укладывается в диапазон стандартной длины музыкального трека. Однако присутствие большого количества коротких прослушиваний может указывать на переключение между треками или пробное прослушивание, а длинные значения — на подкасты, лайвы или фоновое воспроизведение.
График\ пример кода
График 5. Тепловая карта «день недели × час»
Пятый график объединяет два измерения — день недели и время суток — в виде тепловой карты. Интенсивность цвета показывает суммарное время прослушивания.
Вывод: Этот график наглядно демонстрирует индивидуальный ритм жизни. Видны устойчивые временные окна, в которые музыка появляется регулярно, а также различия между буднями и выходными. Музыкальное поведение оказывается тесно связано с расписанием дня.
График/ пример кода
Общий вывод по проекту
В ходе проекта было показано, что данные о прослушивании музыки могут быть использованы не только для анализа вкусов, но и для изучения повседневных ритмов жизни.
Музыка в данном контексте выступает как фоновая практика, сопровождающая работу, отдых и рутину. Через временные визуализации становится видно, что музыкальное потребление подчиняется чётким паттернам и повторяется изо дня в день.
Проект демонстрирует, как даже персональные данные небольшого объёма при правильной обработке и визуализации могут превратиться в осмысленное исследование повседневного поведения.
Использованные нейросети: 1. Chat GPT для генерации изображений и для запросов рекомендаций по улучшению кода и его написанию.