
Описание проекта
Идея этого проекта появилась не из абстрактного интереса к данным, а из раздражения, которое знакомо многим жителям новых высотных домов. В зданиях с большим количеством этажей и квартир ожидание лифта нередко превращается в отдельное испытание: в часы пик можно простоять у дверей не одну и не две минуты, а иногда кажется, что лифт вообще застрял где-то навсегда. В какой-то момент мне стало интересно — это просто ощущение или проблема реально подтверждается цифрами.
Для анализа я использовала набор данных с платформы Kaggle (https://www.kaggle.com/datasets/prince7489/elevator-traffic-analytics-dataset), в котором зафиксированы параметры лифтового трафика: количество вызовов по часам, среднее время ожидания, загрузка кабины, число пассажиров и запрашиваемые этажи. В проекте мне хотелось не просто показать графики, а попытаться понять, какие факторы действительно влияют на задержки и перегрузки.
Чтобы рассмотреть данные с разных сторон, я выбрала несколько типов графиков: 1. Вертикальная столбчатая диаграмма 2. Линейный график 3. Гистограмма с оценкой плотности 4. Диаграмма рассеяния с линейным трендом 5. Корреляционная тепловая карта
Каждый из этих форматов помогает ответить на свой вопрос — от общей динамики лифтового трафика до взаимосвязей между отдельными параметрами.
Визуализация проблемы
Работая над визуальной частью проекта, я решила пойти не от конкретного образа, а от состояния. В процессе ожидания лифта в больших жилых комплексах эмоции часто меняются: сначала это спокойное ожидание, затем раздражение и напряжение, а в конце — сама поездка, которая будто бы завершает этот маленький внутренний конфликт.
Визуальная часть проекта сложилась как серия иллюстраций, каждая из которых отражает отдельный этап этого опыта.
Prompt 1 — ожидание
«Abstract architectural interior inspired by high-rise residential buildings, elevator hall with tall vertical shafts, closed elevator doors, several human figures standing apart, quiet and restrained body language, subtle expressions of waiting and fatigue, vast empty space, soft diffused light, muted blue and green tones, feeling of silence and suspended time, minimal details, calm but slightly tense atmosphere».
Prompt 2 — напряжение и раздражение
«Conceptual interior space centered around an elevator, compressed architectural forms and distorted elevator doors, strong vertical lines, darker shadows, high contrast lighting, deep blue and near-black tones, multiple human figures near the elevator expressing frustration and anger through tense postures, clenched fists, sharp silhouettes and dynamic poses, sense of pressure and impatience, abstract and emotional visual language, no realistic setting».
Prompt 3 — движение и поездка
«Abstract elevator interior in motion, human figures inside the elevator showing mixed emotions of release and exhaustion, upward movement suggested through elongated light streaks and flowing vertical elements, layered architectural space, controlled geometry, balanced dark and light tones, feeling of transition and emotional relief, modern atmospheric style, no literal realistic cabin details».
В результате одна из иллюстраций из этой серии была выбрана в качестве обложки проекта.
Цветовое решение
Для проекта я отдельно продумала цветовую палитру, так как визуальное ощущение здесь играет не меньшую роль, чем сами данные. Мне было важно передать атмосферу напряжённого ожидания и масштаба, характерную для больших многоэтажных пространств, но при этом сохранить визуальную сдержанность и читаемость.
Палитра была собрана в Adobe Color — это позволило подобрать оттенки, которые хорошо сочетаются между собой и работают как единая система.
Цвета: #F5F3DC #274447 #01313C #0C0666 #000000
Шрифт для проекта: UbuntuSansMono
Графики
График 1. Количество вызовов лифта по часам
Первый график показывает распределение вызовов лифта в течение дня. По горизонтали отложены часы, по вертикали — количество обращений к лифту.
На графике отчётливо выделяются периоды максимальной нагрузки — утренние часы и вторая половина дня. Именно в это время лифт используется наиболее интенсивно. После обеда активность ненадолго снижается, но ближе к вечеру снова возрастает. Поздним вечером количество вызовов резко падает, что выглядит вполне логично.
Этот график показывает основу проблемы: лифтовый трафик распределён крайне неравномерно, и в определённые часы система явно работает на пределе.
График 2. Среднее время ожидания лифта по часам
Во втором графике рассматривается среднее время ожидания лифта в зависимости от времени суток. Здесь уже становится понятно, почему ожидание воспринимается таким мучительным.
В часы высокой активности среднее время ожидания увеличивается, но важно, что рост не всегда строго совпадает с количеством вызовов. Это говорит о том, что даже при схожем трафике лифт может работать по-разному — многое зависит от загрузки, маршрутов и очередности вызовов.
В вечерние часы ожидание особенно нестабильно, что хорошо объясняет ощущение «вечного лифта» после рабочего дня.
График 3. Распределение количества людей в поездках лифта
Третий график показывает, сколько человек обычно находится в лифте во время поездок. Это гистограмма с линией плотности, которая помогает увидеть наиболее частые сценарии.
Основная масса поездок приходится на 3–5 пассажиров. Однако заметен длинный хвост распределения — поездки с 7, 8 и более людьми хоть и встречаются реже, но всё же присутствуют. Именно такие перегруженные поездки чаще всего возникают в часы пик и напрямую влияют на скорость работы лифта.
График подчёркивает, что проблема не только в количестве вызовов, но и в перегрузке кабины.
График 4. Связь времени ожидания и количества людей
На четвёртом графике показана связь между количеством людей и временем ожидания. Каждая точка — отдельная поездка, а линия тренда отражает общую зависимость.
Видно, что при увеличении числа пассажиров среднее время ожидания также растёт. Однако разброс значений довольно большой, что указывает на влияние дополнительных факторов. Иногда даже при небольшом количестве людей ожидание может быть высоким — например, если лифт занят длинными маршрутами или обслуживает несколько последовательных вызовов.
Этот график показывает, что проблема ожидания комплексная и не сводится к одному параметру.
График 5. Корреляционная матрица показателей лифтового трафика
Последний график — корреляционная матрица, которая помогает посмотреть на все показатели сразу и понять, что с чем действительно связано.
Самая сильная зависимость наблюдается между загрузкой лифта и количеством людей — это ожидаемо и подтверждается высоким коэффициентом корреляции. При этом связь между временем ожидания и другими параметрами оказывается слабой. Это означает, что ожидание формируется не одним фактором, а их сочетанием.
Запрашиваемый этаж практически не коррелирует с остальными показателями, что говорит о том, что высота поездки сама по себе не является ключевой причиной задержек.
Использованные статистические методы
• Частотный анализ — использовался для подсчёта количества вызовов лифта по часам суток. Это позволило выявить суточные пики нагрузки и периоды наибольшей активности пользователей.
• Агрегационный анализ средних значений — применялся для расчёта среднего времени ожидания лифта по каждому часу дня. Такой подход позволил сопоставить интенсивность использования лифта с качеством обслуживания (временем ожидания).
• Анализ распределений — выполнен с помощью гистограммы количества людей в поездках. Дополнительно использовалась ядерная оценка плотности (KDE), что позволило оценить форму распределения и различить одиночные и групповые поездки.
• Анализ взаимосвязей и трендов — реализован через диаграмму рассеяния времени ожидания и количества людей с построением линейного тренда. Это позволило выявить эффект увеличения времени ожидания при росте числа пассажиров (эффект «толпы»).
• Корреляционный анализ — проведён для оценки силы связей между временем ожидания и ключевыми факторами: загрузкой лифта, количеством людей и запрошенным этажом. Корреляционная матрица позволила дать быстрый сравнительный обзор влияния факторов на время ожидания и выявить наиболее значимые из них.
Вывод
Этот проект помог мне взглянуть на проблему долгого ожидания лифта более осознанно. Оказалось, что ощущение «вечного ожидания» в высотных домах действительно подтверждается данными: в часы пик нагрузка резко возрастает, а время ожидания зависит сразу от нескольких факторов, а не от одной причины. Важной для меня стала и визуальная часть. Через серию иллюстраций получилось передать эмоции, которые возникают в процессе ожидания, раздражения и самой поездки. Это помогло связать сухие цифры с реальным человеческим опытом.
В ходе работы я научилась лучше подбирать типы графиков под конкретные задачи, работать с цветом и выстраивать проект как цельную историю. И, что особенно приятно, я смогла превратить личное раздражение в понятный и наглядный проект, который объясняет, почему ждать лифт иногда так тяжело.
Описание применения генеративной модели и вспомогательных инструментов
1. Kaggle — Платформа была использована для поиска и загрузки датасета.
2. Google Colab — Весь процесс работы: обработка данных и визуализация.
3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения графиков в проекте. numpy — применялась для работы с числовыми данными и расчёта вспомогательных величин при построении графиков. scipy.stats.gaussian_kde — использовалась для оценки плотности распределения данных seaborn — применялся для построения самой корреляционной тепловой карты (heatmap) с аннотациями значений корреляции. matplotlib.colors.LinearSegmentedColormap — использовался для создания кастомной трёхцветной цветовой шкалы, отражающей силу корреляции между показателями.
4. recraft.ai (https://www.recraft.ai/projects) — Использовала для генерации обложки и иллюстраций.
5. Цветовая палитра (Adobe Color)
6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.