Original size 1140x1600

Что делает приложение успешным в Google Play

PROTECT STATUS: not protected
The project is taking part in the competition

Описание

Мобильные приложения давно стали частью повседневной жизни: мы используем их для общения, работы, развлечений и решения бытовых задач. За внешней простотой и удобством интерфейсов скрывается огромный рынок, где тысячи приложений конкурируют за внимание пользователей. Этот проект посвящён попытке посмотреть на рынок мобильных приложений не со стороны пользователя, а со стороны данных — понять, какие характеристики приложений связаны с их популярностью и оценками.

В качестве источника данных был выбран открытый датасет с платформы Kaggle, включающий информацию о тысячах приложений Google Play Store. В датасете представлены такие параметры, как категория приложения, рейтинг пользователей, количество установок, цена, размер приложения, тип распространения (бесплатное или платное), а также количество пользовательских отзывов.

big
Original size 4096x1521

В ходе работы основной акцент был сделан на анализ успешности мобильных приложений в Google Play и факторов, которые на неё влияют. В рамках проекта рассматривались взаимосвязи между количеством установок, рейтингами и отзывами приложений, а также различия между категориями и типами приложений (бесплатные и платные). Для этого применялись методы предварительной очистки данных, группировки, расчёта долей и медианных значений.

Для визуализации были использованы графики, позволяющие последовательно перейти от общего изучения структуры данных к объяснению выявленных закономерностей. В проекте применяются точечные диаграммы, круговые диаграммы и столбчатые графики. Часть визуализаций носит изучающий характер и помогает понять распределения и концентрацию установок, а часть — объясняющий, подчёркивая факторы, связанные с успешностью приложений.

Этапы работы

На первом этапе были подключены необходимые библиотеки для анализа и визуализации данных. После этого был загружен CSV-файл с данными Google Play Store для дальнейшей обработки и анализа.

Original size 1500x223

Загрузка и первичный обзор данных

Далее данные были приведены к удобному для анализа виду:

1. очищены названия столбцов от лишних пробелов; 2. столбец Reviews преобразован в числовой формат; 3. количество установок (Installs) очищено от символов, и + и преобразовано в числовую переменную; 4. цены приложений переведены в числовой формат (Price_usd); 5. размер приложений приведён к мегабайтам; 6. даты обновления преобразованы в формат даты и выделен год обновления.

Original size 1500x1039

Очистка и приведение данных к числовому формату

После очистки данных были отфильтрованы некорректные значения рейтингов и установок. Дубликаты приложений удалены таким образом, чтобы для каждого приложения сохранялась запись с наибольшими значениями ключевых метрик (отзывы и установки).

Original size 1500x120

Фильтрация и удаление дубликатов

Визуальный стиль графиков вдохновлен фирменной айдентикой Google Play. В качестве основной цветовой палитры используются ключевые цвета бренда: насыщенный синий (4285F4), зелёный (34A853), жёлтый (FBBC05) и красный (EA4335), дополненные нейтральными оттенками серого для вспомогательных элементов.

Original size 2830x1521

Итоговые графики

0

Точечная диаграмма. Связь между количеством отзывов и рейтингом приложений

Эта точечная диаграмма показывает, как связаны между собой два ключевых показателя успешности приложения — количество отзывов и пользовательский рейтинг. График построен в изучающем формате и позволяет без предварительных выводов посмотреть, существует ли заметная зависимость между популярностью приложения и его оценкой. Можно увидеть, что большое количество отзывов чаще встречается у приложений со стабильным высоким рейтингом, однако высокая оценка сама по себе не гарантирует массовой вовлечённости пользователей.

0

Круговая диаграмма. Доля приложений по уровню установок

Круговая диаграмма отражает структуру всего рынка Google Play с точки зрения популярности приложений и относится к изучающему анализу. Приложения разделены на группы по количеству установок, что позволяет ответить на вопрос, какая часть рынка действительно становится массово используемой. График наглядно показывает, что подавляющее большинство приложений остаётся в сегменте с низким числом установок, тогда как лишь небольшая доля достигает миллионов скачиваний. Это помогает понять общую концентрацию успеха в магазине приложений.

0

Горизонтальная столбчатая диаграмма. Категории Google Play: где больше приложений и где больше установок

Эта горизонтальная столбчатая диаграмма уже относится к объясняющему анализу и сравнивает два показателя одновременно: сколько приложений представлено в категории и какую долю всех установок они получают. Такой подход позволяет увидеть несоответствие между конкуренцией и реальным пользовательским спросом. Особое внимание здесь привлекает категория Games, которая выделяется высоким числом установок при относительно умеренной конкуренции. Это позволяет сделать вывод, что именно игровые приложения обладают наибольшим потенциалом массового успеха.

0

Вертикальная столбчатая диаграмма. GAME: Free vs Paid — медианное число установок

Финальный график относится к объясняющему анализу и углубляет выводы, сделанные ранее, уже внутри категории игр. Сравнение медианного числа установок показывает, что бесплатные игры скачиваются на порядки чаще, чем платные. Использование медианы и логарифмической шкалы позволяет избежать искажения из-за экстремально популярных приложений и подчёркивает устойчивую закономерность: в игровом сегменте бесплатная модель значительно успешнее платной. Это подтверждает распространённую модель монетизации через рекламу и внутриигровые покупки: бесплатный вход снижает барьер для пользователя, а доход формируется за счёт масштаба аудитории. Именно этой стратегии придерживаются самые популярные игровые приложения в Google Play.

Заключение

В рамках проекта был проанализирован рынок мобильных приложений Google Play с точки зрения их успешности. Анализ показал, что успех приложений распределён крайне неравномерно: лишь небольшая часть приложений получает основную долю установок. При этом высокий рейтинг не всегда напрямую связан с количеством загрузок, а популярность приложения формируется за счёт совокупности факторов — вовлечённости пользователей, категории, модели распространения и масштаба аудитории.

Отдельное внимание было уделено категории игр, которая выделяется как по количеству установок, так и по потенциалу роста. Исследование показало, что бесплатные игровые приложения в среднем имеют более высокие показатели установок, чем платные, что подтверждает эффективность модели free-to-play. С учётом этого, если бы мне пришлось выбирать стратегию выхода на рынок, я бы сделала бесплатное игровое приложение с системой внутриигровых покупок и рекламы.

Описание применения генеративной модели

ChatGPT использовался как вспомогательный инструмент на этапе анализа и визуализации данных. С его помощью уточнялась логика выбора графиков, формулировались исследовательские и объясняющие вопросы, а также подбирались более наглядные способы представления результатов. Кроме того, ChatGPT помогал оптимизировать код, упростить обработку данных и улучшить интерпретацию полученных выводов.

Ссылка на модель: https://chatgpt.com/