
Введение
Для анализа были выбраны тексты песен из первых четырёх альбомов и одного EP группы Marilyn Manson:
Portrait of an American Family
Smells Like Children (EP)
Antichrist Superstar
Mechanical Animals
Holy Wood (In the Shadow of the Valley of Death)

Мне было интересно проанализировать именно ранние тексты песен Marilyn Manson, ведь они насыщены культурными, религиозными и социальными подтекстами. Мэнсон, как провокатор, использует свои текста для обсуждения тем насилия, религии, секса и политических проблем. И многие из этих текстов куда менее прямолинейны, чем можно подумать. Особенно это ощущается начиная с альбома Mechanical Animals. Более поздние альбомы после Holy Wood не брались для исследования, так как они, по-моему мнению, имеют куда более скупую и банальную лирику уходят от того, что делало группу такой интересной.
Визуальный стиль этого проекта вдохновлён альбомом Holy Wood, так как он, по-моему мнению, выдался самый атмосферный и лирически богатый у группы.
Цветовая палитра была получена через Adobe Colors.



#262324 #CCBF9D #CC583E #201B1F #83322E
Этапы работы
Для начала я загрузил тексты песен с 94 по 2000 год как данные для таблицы в формате CSV.
Для сбора текстов я использовал сайт AZLyrics
Далее я очистил текст от лишних символов и стоп-слов и привёл все слова к нижнему регистру для унификации. Всё это, используя библиотеки Pandas и NLTK для обработки текста.
импорт библиотек
Далее, на основе текстов, я собрал 4 разных графика.
Столбчатая диаграмма
Сперва я составил график 25 самых часто используемых в песнях слов. Столбчатая диаграмма — самая подходящая визуализация для этого.
На первом месте ожидаемо слово «I’m». Почти у всех исполнителей это самое часто используемое слово. слово «world» часто используется в песнях, так как многие из них, так раз, как бы и обращены ко всему миру и действительности. Слово «love» на удивление встречается чаще того же слова «fuck».
Облако слов
Далее я составил облако 150 самых часто повторяющихся слов. Использую ту же библиотеку слов.
Помимо «i’m» и «world», здесь в центре внимание слово «god», что неудивительно с учётом антирелигиозности группы. Слово «drugs» тоже часто встречается, ведь многие песни описывают ощущение зависимости, не только наркотической, но использующей её образ.
График связи слов
После этого стало интересно увидеть, какие слова стыкуются между собой чаще всего. Для этого я построил ещё один график.
Интересно, что слово «drugs» встречается в строчках часто, но пересекается с другими редко. Слово «rock» очень интересно встало в центр звезды. С учётом того, как многие песни критикуют рок-индустрию, это не было прямо открытием, но, всё равно, было довольно неожиданно.
Круговая диаграмма
В конце я решил составить круговую диаграмму в процентах. Через ChatGPT были отсортированы слова на позитивные и негативные.
beautiful_words = [ 'love', 'world', 'beautiful', 'dream', 'dreams', 'light', 'sun', 'star', 'stars', 'angel', 'angels', 'heaven', 'soul', 'souls', 'heart', 'hearts', 'faith', 'hope', 'flower', 'flowers', 'wind', 'sky', 'eyes', 'pure', 'innocent', 'perfect', 'sweet', 'truth', 'life', 'alone', 'peace', 'home', 'kiss', 'smile' ]
vulgar_words = [ 'fuck', 'fucking', 'shit', 'hell', 'dead', 'kill', 'blood', 'hate', 'pain', 'drugs', 'drug', 'sex', 'sick', 'dirty', 'naked', 'bitch', 'whore', 'die', 'burn', 'slave', 'scars', 'disease', 'gun', 'war', 'evil', 'lie', 'lies', 'control' ]
Негативные слова хоть и преобладают с 53.9 процентами, разница не столь велика. Эти 46.1 процентов показывают то, что лирика Marilyn Manson не столь груба и жестока, как многие думают.
Описание применения генеративной модели
Заключение
В ходе анализа ранних текстов группы Marilyn Manson я стремился продемонстрировать глубину и многослойность их творчества, которое часто воспринимается как агрессивное и вульгарное, но на самом деле скрывают гораздо более сложные и поэтичные мотивы.
На самом деле, то же слово «love» звучит чуть ли не чаще всего.