Original size 1140x1600

Анализ твитов и текстов песен Канье Уэста

PROTECT STATUS: not protected

Описание проекта

Проект посвящен сравнительному анализу текстов твитов Канье Уэста и текстов его песен с целью выявления сходств и различий в использовании лексики. В рамках исследования были собраны данные о твитах артиста и лирике его композиций, проведена их обработка и количественный анализ. Основная задача проекта — выяснить, совпадают ли основные тематические и лексические элементы, используемые Канье Уэстом в социальных сетях, с теми, что встречаются в его музыкальных текстах.

Вводная часть

Я выбрал два набора данных, относящихся к творчеству и публичным высказываниям Канье Уэста:  — Тексты песен Канье Уэста (данные взяты с kaggle).  — Твиты Канье Уэста (данные также взяты с kaggle).

Эти данные содержат текстовую информацию, которая позволяет исследовать, насколько слова, используемые в песнях и твитах, уникальны для каждого из этих источников.

Данные были загружены из двух CSV-файлов. Далее я применил следующие шаги:

Удаление знаков препинания, приведение текста к нижнему регистру и удаление общеупотребительных слов (из списков слов были введены исключения, состоящие из хэштегов и музыкальных обозначений (куплет, припев, оутро и др.), союзов и артиклей). Это позволило сосредоточиться на значимых словах.

Из каждого источника данных (песни и твиты) были выделены уникальные слова.

Были найдены слова, которые присутствуют только в текстах песен и только в твитах. На их основе вычислены проценты уникальных слов.

Стилизация графиков

post

Графики были стилизованы внутри среды разработки при помощи подбора цветовой градации, которая наиболее бы соответствовала цветовой палитре одной из обложек альбома «My beautiful dark twisted fantasy».

Обоснование выбора темы

Канье Уэст — одна из самых обсуждаемых фигур в музыкальной индустрии и в социальных сетях. Его песни и твиты активно изучаются фанатами и критиками, так как они отражают его творческое и личное мировоззрение. Мне было интересно узнать: насколько его язык в музыке отличается от языка в социальных медиа? Использует ли он уникальные слова для выражения идей в песнях, которые не встречаются в твитах, и наоборот?

Анализ твитов

Original size 2716x1206

анализ 100 самых популярных слов.

Original size 1495x1292

анализ 25 самых популярных слов

Original size 1348x667

Облако частотности слов в твитах

Анализ текстов песен

Original size 2680x1203

анализ 100 самых популярных слов в песнях

Original size 1546x1339

анализ 25 самых популярных слов в песнях

Original size 1348x669

Облако частотности слов в твитах

Пересечение слов в твитах и текстах песен

Original size 1561x1430

топ 25 самых пересекаемых слов в твитах и текстах

Original size 1551x1406

топ 25 самых непересекающихся слов в твитах и песнях

Original size 1320x914

процент уникальности слов в твитах и текстах песен

Ссылка на диск с кодом и базами данных

Анализ твитов и текстов песен Канье Уэста
Confirm your ageProject contains information not suitable for individuals under the age of 18
I am already 18 years old