Расскажем, как работать с облачными сервисами. Вы научитесь проектировать базы данных и системы аналитики, управлять качеством и трансфером данных, выводить модели машинного обучения в продакшн с помощью Kubernetes.
11 месяцев
Опыт работы
с базами данных
12 проектов
в портфолио
Онлайн-обучение,
2 раза в неделю
Вы научитесь запускать виртуальные серверы, разворачивать приложения с микросервисной архитектурой и работать со Spark, ClickHouse, Greenplum, ADB, Kafka, JupyterHub и Kubeflow в Kubernetes.
Также вы научитесь строить эффективные data lake и data warehouse с разделением на слои данных, работать с каталогом метаданных, организовывать эксперименты с моделями машинного обучения и выводить эти модели в продакшен.
Преподаватели курса — практикующие дата-сайентисты и архитекторы Group, X5 Retail Group и «Магнита». Они помогут освоить все необходимые навыки и ответят на вопро
Курс разработан вместе с экспертами из платформы Mail.ru Cloud Solutions. На её базе вы потренируетесь работать с облаками, разберёте кейсы и пополните портфолио новыми проектами.
Поможем проанализировать ваши компетенции и пути карьерного развития. Все студенты, которые обращаются в центр карьеры GeekBrains, выходят на работу по специальности.
Чтобы вы выгодно выделялись на фоне конкурентов, наши HR-специалисты помогут составить резюме.
Менеджер по трудоустройству отправляет подборки вакансий, а вы откликаетесь на самые интересные.
Дадим советы, как пройти собеседование, и поздравим с оффером :-)
Чтобы поддерживать программу актуальной, мы можем изменить некоторые уроки или состав преподавателей.
Научитесь использовать публичную облачную платформу и S3-хранилища.
Вы научитесь запускать виртуальные серверы в облаке, деплоить приложения с микросервисной архитектурой в Docker-контейнерах в Kubernetes.
• Микросервисы и контейнеры.
• Docker.
• Введение в Kubernetes.
• Хранение данных и ресурсы.
• Сетевые абстракции Kubernetes.
• Устройство кластера.
• Продвинутые абстракции.
• Деплой тестового приложения в кластер, CI/CD.
Вы научитесь использовать облачную платформу, запускать виртуальные серверы и разворачивать приложения с микросервисной архитектурой в Docker-контейнерах в Kubernetes.
Также вы познакомитесь с системой управления конфигураций Ansible и языком описания инфраструктуры Terraform.
Научитесь строить ETL/ELT-потоки с помощью облачных технологий. Познакомитесь с основами построения data lake и data warehouse.
Познакомитесь с фреймворками Hadoop и Spark и средами разработки Zeppelin и JupyterHub.
Также вы поработаете с оркестраторами Airflow и Luigi, которые позволяют выстраивать процессы по обработке данных.
Познакомитесь с инструментами для потоковой обработки данных: NiFi, Kafka, Spark.
Освоите инструменты дата-инженера. Научитесь строить data lake и data warehouse и работать с пакетной и потоковой обработкой данных.
Познакомитесь с решениями на основе массивно-параллельной архитектуры (MPP). Потренируетесь работать с MPP-СУБД: Vertica, ADB, Greenplum, Clickhouse.
Познакомитесь с инструментами дата-инженера и дата-сайентиста: Spark, JupyterHub, Kubeflow.
Также узнаете о специфике работы с этими инструментами в Kubernetes.
Познакомитесь с MPP-системами и потренируетесь работать со Spark, JupyterHub и Kubeflow в Kubernetes.
Вы научитесь обеспечивать качество данных, работать с каталогом метаданных, организовывать эксперименты с моделями машинного обучения и выводить эти модели в продакшн.
Разберёте задания, которые встречаются на собеседованиях. Узнаете о проблемах работы с облачными сервисами и познакомитесь с распространёнными ошибками.
Вы научитесь управлять качеством данных и подготовитесь к собеседованию.
Познакомим с основными понятиями: репозиторий, коммит, тег, ветки, создание и клонирование репозитория, слияние веток, запрос истории изменений.
Специализируется на облачной инфраструктуре и PaaS-сервисах, внедряет сложные кастомные проекты. Опыт работы с облачным технологиями 8 лет.
Специализируется на построении хранилищ и платформ по работе с данными, а также на PaaS-сервисах, DS- и ML-решениях в облаках. Раньше создавал хранилища данных для «Платформы ОФД» и X5 Retail Group.
Создает аналитические хранилища на базе Hadoop и Spark. Разрабатывает хранилища данных для маркетинговой аналитики, реализовывает потоковую обработку больших данных с помощью машинного обучения.
В «Платформе ОФД» разрабатывал библиотеки для больших данных, создавал хранилища и аналитические продукты. В МТС участвовал в проекте классификации пользователей по географическому перемещению. В Яндексе проходил стажировку по созданию чат-бота для приёма на работу.
Занимается алгоритмами машинного обучения и переводом информационных систем из тестовой среды в продакшен. Руководит командой дата-сайентистов, разворачивает модели машинного обучения в распределенных системах по типу Hadoop и Azure.
Работает дата-сайентистом 3 года. До этого работал 2 года дата-инженером и 1,5 года — аналитиком данных.
Разрабатывает интеллектуальные системы в ритейле. Был аналитиком данных в Mail.ru Group, помогал бизнесу принимать решения на основе данных, создавал проекты с помощью машинного обучения.
Они регулярно разбирают практические задания, отвечают на вопросы и делятся кейсами.
Присылает подборки материалов по пройденным темам, помогает поддерживать темп обучения.
Помогает записаться на курс и освоиться в личном кабинете, передаёт ваши пожелания.
Решают сложности с личным кабинетом или загрузкой занятий.
Linux
Docker
Kubernetes
Git
GreenPlum
ClickHouse
Spark
Nifi
Kafka
Hadoop
JupyterHub
Kubeflow
MLflow
Amundsen
Вы получаете электронный сертификат и диплом о профессиональной переподготовке, их можно приложить к портфолио и показать работодателю. Обучение проводим на основании гослицензии № 040485.
Вы можете вернуть до 13% стоимости обучения в виде налогового вычета. Подробности расскажет наш консультант после отправки заявки.