Original size 1024x1536

Ритм города: анализ и визуализация данных городского велопроката

PROTECT STATUS: not protected
The project is taking part in the competition

Вводная часть

В рамках проекта был проанализирован набор данных day.csv, содержащий информацию о ежедневных арендах городских велосипедов за период 2018–2019 годов. Датасет включает сведения о количестве аренд, типах пользователей (casual и registered), сезонных и календарных характеристиках, а также погодных условиях.

Выбор данных обусловлен их социальной и урбанистической значимостью: городской велопрокат является важной частью современной транспортной системы и отражает повседневные поведенческие паттерны горожан. Анализ подобных данных позволяет понять, как меняется ритм города в зависимости от времени, погоды и типа дня.

Для визуализации были выбраны разные типы графиков — линейные, столбчатые, гистограммы, boxplot и точечные диаграммы. Такой набор позволяет одновременно показать общую динамику, распределения значений и взаимосвязи между показателями.

Этапы работы

post

Работа началась с загрузки и первичного анализа данных таблицы Bike Sharing Dataset из Kaggle с помощью библиотеки Pandas. Были изучены структура таблицы, типы данных и базовые статистические показатели. Пропусков в данных обнаружено не было. Для удобства интерпретации был создан дополнительный категориальный признак, разделяющий дни на будние и выходные.

Далее данные были сгруппированы и агрегированы для анализа средних значений, распределений и различий между категориями. Для визуализации использовались библиотеки Matplotlib и Seaborn.

В процессе работы применялся искусственный интеллект (ChatGPT) для консультаций по выбору типов визуализаций, оптимизации кода и формулировке аналитических выводов. Все решения по стилю, структуре и интерпретации данных принимались и дорабатывались автором проекта.

Визуальный стиль и оформление

Все графики выполнены в едином визуальном стиле с использованием авторской цветовой палитры, вдохновлённой городской средой. В палитре используются графитовый чёрный как базовый цвет, холодный синий для основных данных, акцентный оранжевый для ключевых элементов, серо-голубой для второстепенных показателей и приглушённый зелёный как отсылка к экологической составляющей городского транспорта.

Параметры шрифтов, цветов и сетки заданы непосредственно в коде, без дополнительной постобработки в графических редакторах. Это обеспечивает визуальную консистентность и воспроизводимость инфографики.

Цветовая палитра

Original size 2156x415

Итоговые визуализации и выводы

Столбчатые диаграммы

0
0

Сравнение среднего количества аренд в будние и выходные дни показывает, что в будни сервис используется активнее. Это указывает на то, что городской велопрокат выполняет прежде всего транспортную функцию и используется как часть повседневных маршрутов — для поездок на работу, учёбу и по делам.

Анализ структуры пользователей демонстрирует, что основную долю спроса формируют зарегистрированные пользователи. Это говорит о стабильной и лояльной аудитории сервиса, использующей велопрокат регулярно. Casual-пользователи вносят меньший вклад и, вероятно, используют сервис эпизодически.

Boxplot

0

Boxplot, отражающий распределение количества аренд по сезонам, наглядно показывает выраженную сезонность спроса. В тёплые сезоны медианные значения выше, а разброс значений шире, что говорит о большей вариативности поведения пользователей. В холодные сезоны спрос снижается и становится более стабильным, без резких пиков.

Точечная диаграмма

0

Точечная диаграмма демонстрирует положительную зависимость между температурой воздуха и количеством аренд. По мере роста температуры увеличивается и спрос на велопрокат. Это подтверждает, что погодные условия являются одним из ключевых факторов, влияющих на решение пользователей воспользоваться велосипедом.

Регрессионный график

0

Регрессионный график показывает общую отрицательную тенденцию: при увеличении влажности количество аренд снижается. Несмотря на разброс данных, линия тренда указывает на то, что высокая влажность воспринимается пользователями как неблагоприятное условие для поездок, снижая общую активность.

Линейный график

0

Линейный график отражает ритм использования сервиса во времени. Хорошо прослеживаются сезонные волны спроса с постепенным ростом в тёплые периоды и снижением в холодные. Отсутствие резких аномалий указывает на устойчивость сервиса и предсказуемость пользовательского поведения.

Гистограмма

0

Гистограмма распределения общего количества аренд за день показывает, что большинство значений сосредоточено в среднем диапазоне, а экстремально высокие значения встречаются редко. Это говорит о стабильном уровне спроса с отдельными пиковыми днями, вероятно связанными с благоприятной погодой или сезонными факторами.

Заключение

Анализ данных городского велопроката показывает, что за сухими числовыми показателями скрывается живой и устойчивый ритм города. Поведение пользователей формируется не случайно, а в тесной связи с повседневными сценариями жизни мегаполиса: рабочими буднями, сезонными изменениями и погодными условиями. Велопрокат выступает не просто сервисом досуга, а полноценным элементом городской инфраструктуры, встроенным в ежедневные маршруты горожан.

Визуализация данных позволила перевести абстрактные статистические величины в наглядные образы, где каждая диаграмма отражает конкретный аспект городской динамики. Температура, влажность, тип дня и структура аудитории формируют сложную, но читаемую систему взаимосвязей, которая делает поведение пользователей предсказуемым и осмысленным. При этом наибольшую роль играет регулярная аудитория зарегистрированных пользователей, что подчёркивает интеграцию сервиса в повседневную городскую жизнь.