Original size 1140x1600

Трассы Формулы 1: анализ данных

PROTECT STATUS: not protected
The project is taking part in the competition

Формула 1 — ежегодный чемпионат мира по кольцевым автогонкам, который проводится на протяжении 10 месяцев в разных странах. Я заметила возрастающую популярность Формулы 1 среди сверстников. Мне стало интересно проанализировать трассы, на которых проводится чемпионат, возможно, сделать неожиданные выводы и просто насладиться процессом, изучая интересующий меня спорт.

Стилистика проекта

В плане стилистики я вдохновлялась фирменным стилем Формулы 1. Я взяла похожий красный цвет и использовала шрифт из открытой библиотеки Google Fonts, который похож по написанию на лицензионный пакет шрифтов Формулы 1.

Официальный фирменный стиль Формулы 1.

Используемые в проекте цвет и шрифт.

big
Original size 1151x361

Код сгенерирован ChatGpt.

big
Original size 1172x157

Промт для ChatGpt.

Здесь я устанавливала шрифт на все графики. Для этого мне нужно было скачать его, загрузить в файлы Google Collab, а после проложить к нему путь для программы и задать параметры.

Для своего исследования я использовала круговую, линейчатую диаграммы, гистограмму, линейный график, а так же интерактивную карту и диаграмму рассеяния, чтобы схематично передать информацию из карты в статике. Круговая диаграмма наглядно показала превалирующую часть данных. Гистограмма и линейчатая диаграмма использовались для демонстрации большого количества данных. Линейный график наглядно показал, как возрастало количество трасс за каждый год проведения Формулы 1. Интерактивная карта и диаграмма рассеяния использовались как приятный бонус, чтобы можно было проследить, как на мировой карте располагаются трассы.

Используемые данные

Для углубленного анализа я использовала не только данные про местонахождение трасс, но и данные про страны и континенты, про количество и место проведения гран-при Формулы 1. Все базы данных были взяты с сайта Kaggle.

Для анализа я совмещала базы данных в одну при помощи merge.

Original size 1121x540

Код сгенерирован ChatGpt.

Original size 1184x525

Промт для ChatGpt.

Для начала я приводила разные вариации названий под единую базу. После этого я ввела данные в одну конкретную таблицу df_merged, которую дальше использовала для анализа и визуализации.

Графики и их анализ

Original size 686x658

Данные предоставлены с 1950 года по 2024.

Original size 1531x949

Код сгенерирован ChatGPT.

Original size 1215x192

Промт для ChatGpt.

Сначала нужно было посчитать общее количество трасс на каждом континенте и общее количество всех трасс в принципе, а после рассчитать процентное соотношение. Так как данных много, я создала код, который задавал бы в словарь список цветов для каждого континента. А дальше идет построение и оформление круговой диаграммы.

Я задалась вопросом, на каком же континенте за всю историю Формулы 1 больше всего проводилось гран-при. Результат меня не удивил, так как изначально Формула 1 именно европейская серия кольцевых автогонок. Однако для меня было удивительно, что в Африке было столько же трасс, сколько и в Северной Америке. Океания же не поразила, так как в целом подходящих стран для постройки трасс на этом континенте мало. В Океании существует только две трассы (в Мельбурне и Аделаиде), обе из которых находятся в Австралии — крупнейшей стране на континенте.

Original size 833x461

Данные предоставлены с 1950 года по 2024.

Original size 1544x935

Код сгенерирован ChatGPT.

Original size 1181x203

Промт для ChatGpt.

Для начала нужно было посчитать количество трасс по странам и вывести топ-10, а потом создать фигуру и оси. После этого строится столбчатая диаграмма на основе посчитанного индекса и значений. Сам график выполняется в фирменном стиле.

И даже несмотря на то, что подавляющая часть (53.3%) трасс Формулы-1 располагается в Европе, в США, которые располагаются на североамериканском континете (21.3%), суммарно трасс больше. Так получается из-за того, что в Европе много стран и европейские трассы не сконцентрированы в одной стране. После США пятерку лидеров занимают европейские страны, что только подтверждает, что Формула 1 все же европейская серия.

Original size 1003x541

Данные предоставлены с 1950 года по 2024.

Original size 1614x702

Код сгенерирован ChatGpt.

Сначала ведется подсчет количества проведенных гран-при по трассам и выбирается топ-10. Создается фигура с красным фоном, строится линейчатая диаграмма, добавляются числовые подписи. Для минималистичного внешнего вида я решила убрать некоторые подписи и рамки.

Трассы, которые лидируют в этом графике, можно назвать легендарными. «Монза», победившая в этом графике, одна из старейших трасс, поэтому у нее было много времени, чтобы себя показать. «Монза» много значит для фанатов Формулы 1. В особенности «Монзу» любят тиффози, итальянские ярые болельщики, так как трасса располагается в Италии, недалеко от Милана, а так же гонщики Феррари (итальянской команды, принимающей участие в Формуле 1) поставили на этой трассе много рекордов.

Трасса в Монако тоже здесь не случайно. Болиды ездят прямо по улицам княжества, а гонщикам крайне тяжело обогнать друг друга из-за узких поворотов и необгонных прямых. Само Монако — тихое, спокойное место, где обычно живут невероятно богатые люди. Для жителей княжества родной этап гран-при — способ развеяться, для туристов — возможность прикоснуться к роскоши. Традиционно трассу в Монако принято считать «жемчужиной» чемпионата.

«Сильверстоун», замыкающий тройку лидеров, является трассой, на которой прошел первый в истории гран-при Формулы 1. Хотя бы этот факт возносит трассу до уровня легенды. Сильверстоун нравится как многим пилотам из-за своей конфигурации и возможности к обгонам, так и фанатам из-за прикосновения к истории королевского автоспорта.

Original size 846x464

Данные предоставлены с 1950 года по 2024.

Original size 1398x666

Код сгенерирован ChatGPT.

Original size 1176x174

Промт для ChatGpt.

Для того, чтобы создать этот график, сначала нужно было посчитать количество гонок по каждому году и отсортировать данные по возрастанию года. Затем создается фигура и оси, строится линейный график зависимости количества гонок от года, а после декоративных дизайнерских исправлений убираются точки и рамка для более аккуратного вида.

Возрастание количества гран-при в год закономерно росло. Интерес к спорту повышался, нужно было расширять географию и задействовать местных спонсоров. Интересно, что в 2020 году во время пандемии чемпионат все же состоялся, однако зрителей либо не было совсем, либо было ограниченное количество. Многие гонки перенесли либо же вовсе отменили. По слухам, в будущем планируется уместить в календарь сезона еще больше гонок, чему, конечно, пилоты не рады из-за сильной физической нагрузки, постоянного морального напряжения, бесконечных перелетов и невозможностью провести время с семьей или друзьями.

Бонус

Мне стало интересно наглядно посмотреть на географическое расположение трасс Формулы 1. Для этого мне показалось забавным решением написать код для генерации карты, на которой будут подсвечены локации трасс.

Original size 1542x856

Интерактивная карта с точками, обозначающими расположение трасс. Данные предоставлены с 1950 года по 2024.

Original size 1341x437

Код сгенерирован ChatGpt.

Original size 1155x158

Промт для ChatGpt.

Для создания карт удобно использовать библиотеку folium. Для построения карты нужно было задать числовые значения из таблицы и дизайн их визуализации, в данном случае красные точки с обводкой.

0

Детали интерактивной карты. Данные предоставлены с 1950 года по 2024.

Как можно заметить, наибольшая часть трасс действительно концентрируется в Европе. В крупных городах Америки так же есть трассы — большая часть США все же состоит из небольших городов, удаленных друг от друга, поэтому строить трассы там было бы банально негде и нецелесообразно. Примерно такая же ситуация обстоит и в Австралии, где большую площадь страны занимают пустыни или леса.

Original size 999x543

Данные предоставлены с 1950 года по 2024.

Original size 1511x900

Код сгенерирован ChatGpt.

Original size 1160x169

Промт для ChatGpt.

Создаются фигура и оси, задается красный фон в фирменном стиле. После этого строится диаграмма рассеяния на основе географических ширины и долготы из таблицы. Я решила убрать рамки, так как они мешают восприятию графика, отвлекая от самих значений.

Источники