Original size 848x1280

Анализ данных «Яндекс музыки»

PROTECT STATUS: not protected
The project is taking part in the competition

Цель исследования

Целью данного исследования является анализ характеристик популярных музыкальных треков из топ-100 сервиса Яндекс Музыка с использованием методов анализа данных и визуализации. В рамках проекта исследуется распределение популярности треков, жанровая структура, а также вклад отдельных исполнителей в формирование музыкального чарта. Дополнительной целью является выявление общих закономерностей в данных и наглядная демонстрация того, как с помощью библиотеки Pandas можно изучать и интерпретировать культурные и медиаданные.

Описание признаков

Genre — жанровая принадлежность музыкального трека (категориальная переменная). Danceability — показатель танцевальности композиции, принимающий значения от 0 до 1. Energy — уровень энергичности трека, отражающий его интенсивность и динамику (от 0 до 1). Loudness — средний уровень громкости трека, измеряемый в децибелах (примерно от –35 dB и выше). Speechiness, acousticness, instrumentalness, liveness, valence — дополнительные аудиохарактеристики, описывающие различные аспекты звучания трека; все показатели нормированы и находятся в диапазоне от 0 до 1. Tempo — темп музыкального произведения, измеряемый в ударах в минуту (BPM), обычно варьируется в диапазоне от 60 до 180.

Используемые инструменты

Pandas и NumPy — для загрузки, обработки и анализа табличных данных. Matplotlib и Seaborn — для создания визуализаций и графиков.

Код анализа данных

График 1: распределение жанров

big
Original size 730x414
Original size 575x391

Среди 4 жанров, подверженных анализу, выявлено сильное преобладание русского репа и поп музыки.

График 2: Средняя длина треков по жанрам

Original size 827x465
Original size 551x279

Выявлено, что в панке средняя продолжительность трека составляет около 3,5 минут. В жанре другое — в среднем 3 минуты. В жанрах русская поп музыка и русский реп средняя длина треков составляет 2,5 и 2,3 минуты соответственно.

График 3: Топ-10 артистов по количеству треков в топ-100

Original size 820x749
Original size 542x279

По итогам анализа датасета было выявлено 10 артистов по количеству наиболее прослушиваемых треков.

График 4: Эксплицитный контент по жанрам

Original size 818x500
Original size 1189x590

Выводы

По итогу анализа данных была выявлена подборка по четырем пунктам:

1. Распределение жанров в топ-100 2. Средняя длина треков по жанрам 3. Топ-10 артистов по количеству треков в топ-100 4. Эксплицитный контент по жанрам