Проект по разработке системы аналитики и планирования отпуска
Это учебный проект, который был выполнен мной по окончании одного из блоков профессии "Аналитик данных с нуля до middle" в Нетологии. Цель проекта - разработать систему планирования и анализа расходов в отпуске. Задачи:
-
Разработать Google-форму, позволяющую планировать отпуск. Форма должна содержать следующие поля:
-
Страна
-
Город
-
Дата начала
-
Дата окончания
-
Планируемый бюджет
-
-
Добавить в Google-таблицы столбцы для заполнения информации по фактической информации по отпуску. Столбцы должны содержать следующую информацию:
-
Стоимость билетов
-
Стоимость отеля
-
Траты на отдыхе
-
Общая оценка отпуска по шкале от 1 до 5
-
Столбец с итоговой стоимостью отпуска (сумма трех столбцов выше)
-
Отклонение итоговой стоимости от плана
-
Стоимость одного дня отпуска
-
-
Внести данные по 10 и более отпускам за последние 3 года (данные могут быть вымышленные)
-
Разработать отчет (в Google-таблицах или Google Data-Studio) со следующими показателями:
-
Вывести самый дорогой отпуск (суммарно)
-
Среднее отклонение фактической цены отпуска от планируемой
-
Расход бюджета: какую долю в среднем занимают авиабилеты, проживание и траты на месте
-
Рейтинг (таблица) стран по стоимости отеля за день
-
Рейтинг (таблица) стран по стоимости трат на месте за день
-
Отчет должен содержать фильтр по датам, а также по оценке
-
-
Рассчитать корреляцию между ценой отпуска за день и оценкой за отзыв.
-
Построить точечный график с этими показателями
-
Проверить статистическую гипотезу, что вы хорошо планируете отпуска: среднее отклонение планируемых трат от реальных равно 0
-
При помощи Python и SQL найти, как называются ваши города в таблице City базы данных World-db
-
Создать соответствующий справочник на отдельном листе Google-таблиц
-
Добавить колонку с английским названием города при помощи функции VLOOKUP (ВПР)
-
Скачать данные в CSV и открыть их в Python
-
При помощи SQL и Python получить датафрейм с названием города и его населением из таблицы City
-
При помощи Python соединить данные из выгруженного CSV файла и таблицы с населением города
-
Сгруппировать итоговый датафрейм по странам и рассчитать среднюю численность населения в городах, в которых вы отдыхали
Посмотреть полученную таблицу можно здесь, отчет - здесь, работу в коде здесь и здесь
Первая часть задания, в котором нужно было создать таблицу и заполнить её данными по отпускам
Вот так выглядит отчет, выполненный в Data Stidio
Создание справочника с английскими названиями городов и тестирование гипотез
Точечный график зависимости оценки отпуска
и стоимости отдыха за день
Итоговый датафрейм со странами и населением