
Концепция
Для анализа я решил использовать 2 датасета из Kaggle:
1. Steam Games Dataset 2. Game Recommendations on Steam
Хотелось получить актуальные данные, поэтому были выбраны свежие датасеты. Первый опубликован 8 месяцев назад, второй — год назад.
В первый датасет включена информация более 100 000 игр. Но в нем отсутствует информация о том, рекомендует ли игрок игру или же нет, поэтому был использован второй датасет, в котором включена эта информация.
Я учусь на профиле «Гейм-дизайн», поэтому мне интересно проанализировать один из самых популярных магазинов игр.
Что именно хочется узнать посредством анализа датасетов:
1. Самые популярные игры и жанры 2. Корреляция между стоимостью игры и отзывами 3. Объем игр, выпущенных под конкретные Операционные системы
Типы графиков:
1. Столбчатая диаграмма 2. Круговая диаграмма 3. Диаграмма рассеяния 4. Диаграмма с линиями
Стиль

В качестве шрифта был выбран M PLUS Rounded 1c, так как мне понравилось как он выглядит на визуализациях. Акцентные цвета — белый и оливковый.
Анализ датасетов

Для начала были импортированы Pandas и другие необходимые библиотеки.
«Оценка популярности» включает в себя объединение таких данных как общий рейтинг игры и количество отзывов от пользователей.
В изучающей визуализации все подробно описывается, но много визуального шума.
В объясняющей визуализации были убраны излишние «Название игры», «Оценка популярности», пунктирные линии, рамки, а также короткие линии после игр. Заголовок графика был сокращен.
Ключевой текст «Топ-10 самых популярных игр» теперь выделен жирным шрифтом.
Counter-Strike — наиболее популярная в Steam игра.


Изучающая визуализация включала в себе слишком много жанров, а также излишнюю легенду в правой части.
Лишние элементы были убраны, чтобы сделать объясняющую визуализацию минималистичной.
Диаграмма показывает высокую популярность инди-игр.
Диаграмма рассеяния показывает, что низкая цена не гарантирует высокую оценку.
У более дорогих игр очень мало или почти нет отрицательных отзывов, но при этом их количество является не особо большим. Это плохо, так как Steam продвигает игры с большим количеством отзывов.
Диаграмма показывает, что залог успеха игры — качественное содержание и адекватная стоимость.
Диаграмма с линиями показывает количество игр, которые были выпущены под определенные Операционные системы.
В изучающей визуализации есть информация, которую можно убрать, чтобы смотрящий на диаграмму человек был сфокусирован только на ключевой информации.
В объясняющей визуализации были убраны все лишние цифры, визуальные элементы и тексты, а заголовок переименован.
Названия Операционных систем теперь находятся в конце своих линий и имеют аналогичный цвет.
Windows продолжает доминировать на игровом рынке. Продукция компании Apple слишком дорогая, а их экосистема закрыта, поэтому у многих разработчиков нет доступных возможностей делать портирование под MacOS. Linux пользуется мало людей и разработчики не видят смысла в трате средств и времени на портирование.
Заключение
Игровая сфера очень разнообразная. Среди самых популярных игр в Steam есть AAA-проекты с миллионными бюджетами, так и инди-игры как Terraria.
Круговая диаграмма показывает популярность инди-игр, а диаграмма рассеяния важность сохранения баланса между качеством и содержанием.
Windows на данный момент остается наиболее популярной ОС для выпуска игр.
Описание применения генеративной модели
ИИ Gemini, встроенный в Google Colab, использовался для генерации графиков и улучшения кода.
Была использована именно эта модель, так как она устроила качеством и удобством.
Блокнот и датасеты