Original size 1200x1760

Анализ текстов песен Bob Dylan

PROTECT STATUS: not protected
The project is taking part in the competition

Творчество Боба Дилана занимает особое место в истории популярной музыки XX века. Его песни выходят за рамки привычной песенной формы и часто воспринимаются как самостоятельные литературные высказывания. Певец работает с текстом как с поэтическим материалом, а музыка в его композициях нередко служит средством усиления смысла, а не самоцелью.

На протяжении десятилетий его творчество существенно менялось: от акустического фолка и баллад к электрическому звучанию, блюзу, кантри и более экспериментальным формам. При этом ключевой особенностью певца остаётся внимание к слову, интонации и настроению, что делает его дискографию удобной для анализа не только с культурной, но и с аналитической точки зрения. В отличие от многих других исполнителей, творчество Боба Дилана охватывает длительный временной период и включает большое количество текстов, что позволяет проследить динамику изменений и выявить устойчивые закономерности на основе количественных методов.

big
Original size 618x434

Bob Dylan — Just Like Tom Thumb’s Blues (Official Video).

Мне было интересно обратиться к творчеству Боба Дилана, поскольку его тексты создают ощущение внутреннего диалога с слушателем и они не сводятся к однозначным интерпретациям. Его песни часто оставляют пространство для размышлений и осмысления, что со временем побудило меня внимательнее относиться именно к текстовой стороне его музыки. Такое сочетание личного интереса и выразительной работы со словом стало для меня ключевой причиной выбора данного автора в рамках проекта.

Такой подход позволяет проследить, как менялись темы, настроение и структура песен Боба Дилана на протяжении его карьеры и сопоставить субъективное впечатление с результатами анализа.

Для проведения анализа в работе используется открытый датасет, размещённый на платформе Kaggle, который позволяет рассматривать тексты песен Боба Дилана в структурированном виде и применять к ним количественные методы анализа.

Содержание датасета:

Song Title — название песни, позволяющее идентифицировать отдельные композиции.

Album — альбом, в рамках которого была выпущена песня, что даёт возможность анализировать тексты в контексте отдельных периодов творчества.

Release Year — год релиза, позволяющий проследить изменения тематики и настроений во времени.

Lyrics — полный текст песни, являющийся основным материалом для количественного и смыслового анализа.

post

Цветовая палитра проекта основана на обложке альбома Blonde on Blonde и извлечена с помощью Adobe Color (режим извлечения цветов из изображения). Приглушённые тёплые оттенки отражают эмоциональную неоднозначность и внутреннее напряжение, характерные для альбома. Выбор данного ориентира также связан с моим личным интересом к нему.

Original size 1246x386

Создано с помощью Adobe Color (режим извлечения цветов из изображения).

Первичный анализ датасета

(1) После загрузки файла с данными в среду Google Colab датасет был считан в формат DataFrame с использованием библиотеки pandas. Для первичного знакомства с данными были выведены первые строки таблицы с помощью метода head ().

Original size 1836x170

Данный шаг позволил убедиться в корректности загрузки данных, а также получить общее представление о структуре датасета, названиях столбцов и типе содержащейся информации.

Уже на этом этапе видно, что каждая строка датасета соответствует отдельной песне Боба Дилана и содержит информацию о годе релиза, альбоме, названии композиции и тексте песни.

(2) Далее был проведён анализ размеров и структуры датасета с использованием методов .shape и .info ().

Original size 1308x356

Анализ показал, что датасет содержит 345 записей, каждая из которых соответствует отдельной песне Боба Дилана, и 4 основных признака: год релиза, альбом, название композиции и текст песни.

Корректная структура данных и отсутствие пропусков в сочетании с текстами песен и годами релиза позволяют анализировать изменения лексики и структуры текстов во времени.

Детальный анализ

(1) Как менялась лексика песен со временем

Линейный график

Данный график выбран, поскольку он наглядно показывает изменение среднего числа слов в тексте песен по годам и позволяет проследить динамику усложнения или упрощения структуры текстов со временем.

Original size 1089x490

Линейный график.

Original size 1822x964

График показывает, что в разные годы среднее число слов в тексте песен варьируется примерно от 150–200 до более чем 500 слов. Особенно заметный рост приходится на середину 1980-х годов, тогда как в конце 1960-х и около 2010 года наблюдаются выраженные спады. Эти данные позволяют предположить, что изменения в средней длине текстов связаны с различными этапами творческого пути исполнителя и сменой музыкальных форм.

(2) Тематические мотивы в текстах песен

Столбчатая диаграмма:

Такая диаграмма выбрана, поскольку в данном блоке проводится сравнение частоты различных тематических мотивов, таких как любовь, время, дорога, дом и одиночество. Подобный формат позволяет чётко отразить различия в частоте упоминаний разных тем и сразу увидеть, какие из них встречаются чаще, а какие реже. Диаграмма хорошо подходит для сравнения смысловых категорий и делает структуру тем понятной даже без дополнительного пояснения.

Original size 989x490

Столбчатая диаграмма.

Original size 1638x1194

График показывает, что в текстах песен чаще всего встречаются мотивы любви и времени, тогда как темы дома и одиночества выражены заметно слабее. Это говорит о том, что тексты в большей степени сосредоточены на эмоциональных и внутренних переживаниях, а не на бытовых сюжетах.

(3) Эмоциональная окраска текстов

Накопительная диаграмма с областями:

Данная диаграмма выбрана, потому что она позволяет проследить изменения эмоциональной окраски текстов со временем и сравнить долю положительной и негативной лексики. Такой формат помогает увидеть общий характер эмоциональных изменений по годам.

Original size 1089x490

Накопительная диаграмма с областями.

Original size 1458x946

График показывает, что эмоциональная окраска текстов со временем менялась неравномерно. В разные периоды наблюдаются колебания между преобладанием положительной и негативной лексики, с особенно резкими всплесками негативной окраски в середине 1980-х и середине 1990-х годов. В более поздние годы заметен рост обеих категорий, при этом положительная лексика в целом сохраняет более стабильный характер, тогда как негативная выражена скачкообразно.

(4) Самые длинные песни

Точечный график:

Выбран подобный график, потому что он позволяет наглядно показать длину текстов отдельных песен и сравнить их между собой без объединения в группы. Такой формат делает акцент на различиях между конкретными композициями и не перегружает визуализацию, что особенно важно при работе с небольшим количеством объектов и длинными названиями песен.

Original size 989x490

Точечный график.

Original size 1576x724

График показывает, что самые длинные тексты в дискографии Боба Дилана представлены отдельными композициями и не являются характерной особенностью его творчества в целом. Эти песни значительно выделяются по количеству слов и, как правило, имеют повествовательную структуру, близкую к развернутому рассказу. Такой результат подчёркивает, что в отдельных случаях Дилан использует формат длинного текста как осознанный художественный приём, а не как устойчивую тенденцию.

(5) Облако слов

Облако слов отражает наиболее часто встречающиеся слова в названиях песен. Самыми заметными оказываются слова blue, love, man, baby, one, tonight, gonna, day, dream, talkin.

0

Облако слов.

При этом визуализация показывает, что в названиях доминируют общие и часто повторяющиеся слова, которые сами по себе не дают глубокого представления о тематике песен.

Это делает облако слов скорее иллюстративным элементом, чем полноценным аналитическим инструментом. Такой результат связан с тем, что названия песен являются короткими и содержат ограниченное количество информации, из-за чего данный метод анализа оказывается менее эффективным.

Заключение

Полученные результаты показывают, что тексты песен Боба Дилана значительно различаются по длине и структуре в разные периоды его творчества. Среднее число слов в тексте меняется со временем, что указывает на отсутствие единого устойчивого формата и на постоянный поиск новых выразительных форм. В одни годы Дилан обращается к развернутым, повествовательным композициям, в другие — к более лаконичным и сдержанным по объёму песням.

Тематический анализ демонстрирует преобладание универсальных мотивов, таких как любовь, время и личные переживания, тогда как конкретные бытовые сюжеты встречаются реже. Это позволяет говорить о том, что тексты Дилана чаще направлены на передачу внутреннего состояния и размышлений, а не на описание повседневных событий. При этом эмоциональная окраска песен остаётся неоднородной: соотношение позитивной и негативной лексики меняется, формируя сложное и многослойное настроение.

Анализ самых длинных песен и облако слов по названиям композиций дополняют общее представление о творчестве исполнителя, но одновременно подчёркивают ограничения отдельных методов. В частности, облако слов выполняет скорее иллюстративную функцию, поскольку названия песен не всегда напрямую отражают их содержание и смысловую глубину.

Original size 1196x224

Инструменты

ChatGPT — для корректировки и уточнения кода, а также редактирования и улучшения формулировок текстовой части проекта

Google Colab — для работы с данными и выполнения кода

Kaggle — для поиска и получения исходного датасета

Adobe Photoshop  — для обработки и оформления обложки проекта

Adobe Color — для подбора и формирования цветовой палитры визуализаций