top of page

Проект по разработке системы аналитики и планирования отпуска

Это учебный проект, который был выполнен мной по окончании одного из блоков профессии "Аналитик данных с нуля до middle" в Нетологии. Цель проекта - разработать систему планирования и анализа расходов в отпуске. Задачи:

  1. Разработать Google-форму, позволяющую планировать отпуск. Форма должна содержать следующие поля:

    • Страна 

    • Город 

    • Дата начала 

    • Дата окончания 

    • Планируемый бюджет 

  2. Добавить в Google-таблицы столбцы для заполнения информации по фактической информации по отпуску. Столбцы должны содержать следующую информацию:

    • Стоимость билетов

    • Стоимость отеля

    • Траты на отдыхе

    • Общая оценка отпуска по шкале от 1 до 5

    • Столбец с итоговой стоимостью отпуска (сумма трех столбцов выше)

    • Отклонение итоговой стоимости от плана

    • Стоимость одного дня отпуска

  3. Внести данные по 10 и более отпускам за последние 3 года (данные могут быть вымышленные)

  4. Разработать отчет (в Google-таблицах или Google Data-Studio) со следующими показателями:

    • Вывести самый дорогой отпуск (суммарно)

    • Среднее отклонение фактической цены отпуска от планируемой

    • Расход бюджета: какую долю в среднем занимают авиабилеты, проживание и траты на месте

    • Рейтинг (таблица) стран по стоимости отеля за день

    • Рейтинг (таблица) стран по стоимости трат на месте за день

    • Отчет должен содержать фильтр по датам, а также по оценке

  5. Рассчитать корреляцию между ценой отпуска за день и оценкой за отзыв.

  6. Построить точечный график с этими показателями

  7. Проверить статистическую гипотезу, что вы хорошо планируете отпуска: среднее отклонение планируемых трат от реальных равно 0

  8. При помощи Python и SQL найти, как называются ваши города в таблице City базы данных World-db 

  9. Создать соответствующий справочник на отдельном листе Google-таблиц

  10. Добавить колонку с английским названием города при помощи функции VLOOKUP (ВПР)

  11. Скачать данные в CSV и открыть их в Python

  12. При помощи SQL и Python получить датафрейм с названием города и его населением из таблицы City

  13. При помощи Python соединить данные из выгруженного CSV файла и таблицы с населением города

  14. Сгруппировать итоговый датафрейм по странам и рассчитать среднюю численность населения в городах, в которых вы отдыхали

Посмотреть полученную таблицу можно здесь, отчет - здесь, работу в коде здесь и здесь

Первая часть задания, в котором нужно было создать таблицу и заполнить её данными по отпускам

Вот так выглядит отчет, выполненный в Data Stidio

Создание справочника с английскими названиями городов и тестирование гипотез

Точечный график зависимости оценки отпуска

и стоимости отдыха за день

bottom of page