Original size 949x1400

Guns, God and Government: анализ ранних текстов группы Marilyn Manson

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

Для анализа были выбраны тексты песен из первых четырёх альбомов и одного EP группы Marilyn Manson:

Portrait of an American Family

Smells Like Children (EP)

Antichrist Superstar

Mechanical Animals

Holy Wood (In the Shadow of the Valley of Death)

big
Original size 2820x1404

Мне было интересно проанализировать именно ранние тексты песен Marilyn Manson, ведь они насыщены культурными, религиозными и социальными подтекстами. Мэнсон, как провокатор, использует свои текста для обсуждения тем насилия, религии, секса и политических проблем. И многие из этих текстов куда менее прямолинейны, чем можно подумать. Особенно это ощущается начиная с альбома Mechanical Animals. Более поздние альбомы после Holy Wood не брались для исследования, так как они, по-моему мнению, имеют куда более скупую и банальную лирику уходят от того, что делало группу такой интересной.

Визуальный стиль этого проекта вдохновлён альбомом Holy Wood, так как он, по-моему мнению, выдался самый атмосферный и лирически богатый у группы.

Цветовая палитра была получена через Adobe Colors.

big
Original size 1390x137

#262324 #CCBF9D #CC583E #201B1F #83322E

Этапы работы

Для начала я загрузил тексты песен с 94 по 2000 год как данные для таблицы в формате CSV.

Для сбора текстов я использовал сайт AZLyrics

Далее я очистил текст от лишних символов и стоп-слов и привёл все слова к нижнему регистру для унификации. Всё это, используя библиотеки Pandas и NLTK для обработки текста.

импорт библиотек

Далее, на основе текстов, я собрал 4 разных графика.

Original size 2840x1404

Столбчатая диаграмма

Сперва я составил график 25 самых часто используемых в песнях слов. Столбчатая диаграмма — самая подходящая визуализация для этого.

Original size 1005x730

На первом месте ожидаемо слово «I’m». Почти у всех исполнителей это самое часто используемое слово. слово «world» часто используется в песнях, так как многие из них, так раз, как бы и обращены ко всему миру и действительности. Слово «love» на удивление встречается чаще того же слова «fuck».

Original size 550x258

Облако слов

Далее я составил облако 150 самых часто повторяющихся слов. Использую ту же библиотеку слов.

Original size 1570x914

Помимо «i’m» и «world», здесь в центре внимание слово «god», что неудивительно с учётом антирелигиозности группы. Слово «drugs» тоже часто встречается, ведь многие песни описывают ощущение зависимости, не только наркотической, но использующей её образ.

Original size 432x262

График связи слов

После этого стало интересно увидеть, какие слова стыкуются между собой чаще всего. Для этого я построил ещё один график.

Original size 950x658

Интересно, что слово «drugs» встречается в строчках часто, но пересекается с другими редко. Слово «rock» очень интересно встало в центр звезды. С учётом того, как многие песни критикуют рок-индустрию, это не было прямо открытием, но, всё равно, было довольно неожиданно.

Original size 504x742

Круговая диаграмма

В конце я решил составить круговую диаграмму в процентах. Через ChatGPT были отсортированы слова на позитивные и негативные.

beautiful_words = [ 'love', 'world', 'beautiful', 'dream', 'dreams', 'light', 'sun', 'star', 'stars', 'angel', 'angels', 'heaven', 'soul', 'souls', 'heart', 'hearts', 'faith', 'hope', 'flower', 'flowers', 'wind', 'sky', 'eyes', 'pure', 'innocent', 'perfect', 'sweet', 'truth', 'life', 'alone', 'peace', 'home', 'kiss', 'smile' ]

vulgar_words = [ 'fuck', 'fucking', 'shit', 'hell', 'dead', 'kill', 'blood', 'hate', 'pain', 'drugs', 'drug', 'sex', 'sick', 'dirty', 'naked', 'bitch', 'whore', 'die', 'burn', 'slave', 'scars', 'disease', 'gun', 'war', 'evil', 'lie', 'lies', 'control' ]

Original size 758x659

Негативные слова хоть и преобладают с 53.9 процентами, разница не столь велика. Эти 46.1 процентов показывают то, что лирика Marilyn Manson не столь груба и жестока, как многие думают.

Original size 472x303
Original size 1382x1404

Описание применения генеративной модели

ChatGPT был задан промпт — «по этой таблице составь две группы слов-переменных для Python в lyrics — красивые и вульгарные»

Помимо этого, ChatGPT был использован для правок кода.

Original size 1408x1408

Заключение

В ходе анализа ранних текстов группы Marilyn Manson я стремился продемонстрировать глубину и многослойность их творчества, которое часто воспринимается как агрессивное и вульгарное, но на самом деле скрывают гораздо более сложные и поэтичные мотивы.

На самом деле, то же слово «love» звучит чуть ли не чаще всего.

Original size 1430x1408
Original size 2824x1404