
Введение
Для анализа я выбрала датасет с популярными книгами для обмена, доступный на платформе Kaggle: The Most Popular Books for Exchanging. Датасет содержит более 1000 книг с различными характеристиками: название, автор, год публикации, жанр, язык, рейтинг, наличие экранизации, возрастная категория, теги и прочее.
Меня заинтересовали именно эти данные, потому что они позволяют изучить культурные предпочтения читателей и закономерности популярности книг. Можно понять, какие жанры и темы чаще всего обмениваются, какие книги получают высокие рейтинги, а также выявить закономерности по языку, году публикации и возрастной категории. Эти данные имеют ценность для визуального анализа культурного контента и позволяют создавать интересные инфографики, отражающие реальные предпочтения пользователей.
Для проекта я решила использовать следующие виды визуализации: Гистограммы: для анализа распределения рейтингов. Горизонтальные столбчатые диаграммы: для топ-5 книг по рейтингу, чтобы выделить конкретные объекты. Круговые диаграммы: для наглядного сравнения распределения популярных годов публикации. Word Cloud: для визуализации самых частых тегов книг и выявления ключевых тем.
Распределение рейтингов популярных книг


Гистограмма показывает распределение средних рейтингов всех книг в датасете. Видно, что большинство популярных книг имеют высокий рейтинг, а крайне низкие оценки встречаются редко. Такой график помогает быстро оценить общую оценку книг и понять, какие произведения наиболее популярны среди читателей.
Топ-5 книг по среднему рейтингу
Горизонтальная столбчатая диаграмма отображает топ-5 книг с наивысшим средним рейтингом. Каждый бар окрашен в отдельный цвет, чтобы выделить конкретные книги, и позволяет сразу увидеть, какие произведения лидируют по популярности и оценкам читателей.
Самые популярные теги книг
Word Cloud визуализирует самые часто встречающиеся теги книг в датасете. Размер слова соответствует частоте его появления, что позволяет быстро увидеть основные темы и интересы читателей, а цвета делают графику наглядной и привлекательной.
Самые популярные годы публикации книг
Круговая диаграмма показывает распределение книг по самым популярным годам публикации. Проценты на графике позволяют оценить, в какие годы выходило наибольшее количество популярных книг, а разные цвета помогают быстро сравнивать доли каждого года.
Заключение
В результате анализа датасета популярных книг удалось выявить ключевые закономерности: какие книги получают высокие рейтинги, какие годы и темы наиболее популярны, какие теги чаще всего встречаются. Визуализации помогли наглядно показать эти тенденции и сделали данные более понятными и информативными. Проект демонстрирует, как с помощью анализа и визуализации можно быстро понять структуру и особенности большого массива информации.