
Концепция

Серия «Коты-воители» знакома многим людям моего поколения. Эти книги невероятно повлияли на мое восприятие, и я с самого детства очень их люблю. Именно поэтому я выбрала такую тему для визуализации данных. Цель этого проекта — показать определенные закономерности и проследить за тем, как меняются данные с течением времени, в разных книгах.
Исследование построено на основе информации из большого датасета, посвященную персонажам серии, который я нашла на Kaggle. В нем представлены данные об именах и описаниях персонажей, поле, окраске, племени каждого героя, появляющихся с первого по последний циклы (без учета специзданий). Мне стало интересно, например, каково соотношение женских персонажей к мужским, или какие окрасы являются самыми часто встречающимися.

Для визуализации с помощью Adobe Color были выбраны цвета, символизирующие каждое из пяти племен — Речное, Небесное, Грозовое, племя Ветра и племя Теней.
Для редактирования кода и решения каких-либо проблем использовался Deepseek. В коде были использованы библиотеки pandas для обработки CSV-файлов, numpy для математических вычислений, matplotlib.pyplot для визуализации данных.
График 1

Первое, чем я заинтересовалась — гендерный баланс среди героев. Я предполагала, что количество мужских персонажей в каждом цикле превышает количество женских, но оказалась неправа: в разных книгах соотношение полов отличается. Для визуализации соотношения полов персонажей я решила выбрать диаграмму-линию, так как с ее помощью очень удобно показать изменения в динамике.
График 2
На столбчатой диаграмме можно увидеть усредненное количество героев племен в каждом книжном цикле. Выводы напрашиваются сами собой — Грозовое племя всегда было самым многочисленным из всех, и это логично: огромная часть повествования уделена именно ему, а также к нему относится большинство протагонистов. Информация о численности Небесного племени в первых четырех циклах отсутствует, ведь оно даже не упоминалось до определенного момента.
График 3
Третья, круговая диаграмма, показывает топ-5 самых популярных окрасов. Она позволяет понять, что неяркий цвет шерсти, которая поможет коту слиться с окружающей средой (серый, коричневый, табби), встречается чаще, чем яркие цвета (такие как рыжий или белый), из-за которых героев намного легче выследить в лесу или пустоши.
Для того, чтобы представить этот и следующие два графика корректно, данные были очищены от дубликатов имен одних и тех же персонажей в разных книгах.
Графики 4 и 5
Во вселенной «Котов-воителей» почти у каждого персонажа имя состоит из двух частей: префикса и суффикса. Префикс является основой имени, обычно на протяжении жизни кота не меняется и часто представляет собой какую-либо характерную черту (цвет шерсти, характер); суффикс обычно представляет собой какую-либо часть тела («-tail», «-ear», «-foot») и меняется при «переходе на следующую ступень» — прохождении церемонии посвящения в оруженосцы, воители или предводители.
Важно заметить, что суффиксы имен у котят, оруженосцев и предводителей всегда они и те же: «-kit», «-paw», «-star». Учитывая это, я исключила эти суффиксы при написании кода, чтобы правильно посчитать топ-10 самых часто встречающихся префиксов и суффиксов имен; информация представлена на двух линейчатых диаграммах.
Заключение
В заключение хочется сказать, что мне было очень интересно узнать что-то новое и неожиданное о моей любимой серии книг. У меня были свои гипотезы перед началом работы, и некоторые из них оказались правдой — как, например, в случае с популяцией Грозового племени; другие же были развеяны, как мое предположение о соотношении полов.