Освойте востребованную профессию и получите опыт разработки Machine Learning-проектов: от сбора данных до оптимизации моделей.
6 месяцев
Знание Python и математики
2 проекта в портфолио
Онлайн-вебинары
Вы хотите перейти в Data Science из другой области. Вам будет проще пройти курс, если разбираетесь в математике и Python.
Научитесь использовать машинное обучение в работе: изучите алгоритмы, потренируетесь решать задачи и обучите свою рекомендательную систему.
Научитесь внедрять ML- модели, прогнозирующие различные показатели. Больше не придётся ограничиваться только базовой аналитикой.
Мы обновляем программу ежегодно: проводим исследования и учитываем требования работодателей.
У преподавателей большой опыт в IT: они автоматизируют процессы в X5 Retail Group, Delivery Club, oneFactor и Dentsu Aegis Network Russia.
В группу входит много бизнес-продуктов: ВКонтакте, Delivery Club, Ситимобил и другие. Мы анализируем их развитие и делимся с вами накопленными знаниями.
Поможем проанализировать ваши компетенции и пути карьерного развития.
Чтобы вы выгодно выделялись на фоне конкурентов, наши HR-специалисты помогут составить резюме.
Менеджер по трудоустройству отправляет подборки вакансий, а вы откликаетесь на самые интересные.
Дадим советы, как пройти собеседование, и поздравим с оффером :-)
Многие из наших выпускников раньше не работали в IT, но после обучения открыли свой бизнес или устроились в крупные компании.
Студент факультета аналитики Big Data
Я начал изучать Big Data и быстро почувствовал, что знания по аналитике легко дополняют мой практический опыт. В итоге я переквалифицировался в аналитика, повысил заработок в 2,5 раза.
Деньги — это временный мотиватор: чтобы постоянно развиваться, надо жить своим делом. Чтобы убедиться, что тебе нравится IT, пообщайся с разработчиками: они расскажут о сложностях и перспективах развития.
Студент факультета аналитики Big Data
В 33 года сложно осваивать новую специальность, особенно с двумя маленькими детьми. С первого месяца обучения я научился экономить время на работе: написал парсер госзакупок, обрабатывал огромные эксельки при помощи pandas и визуализировал их в Matplotlib.
Моя цель — переквалифицироваться в аналитика, и я рад, что ребята из GeekBrains поддерживают меня на этом пути.
Выпускник факультета искусственного интеллекта
Из-за разницы во времени я смотрел занятия в записи, но это не повлияло на качество обучения. В GeekBrains одинаково хорошо объясняют азы и нюансы.
После обучения научился использовать методы машинного обучения в работе, например, чтобы прогнозировать спрос на продукцию. Теперь, когда появляется новый бизнес-процесс, в первую очередь думаю, как его реализовать без человека.
Старайтесь сложные задачи решать утром — это самое продуктивное время. Если задача не решается, отложите до завтра — решение обязательно придёт.
Операции над матрицами и векторами.
Функция, её производная, градиент.
Условная вероятность, формула Байеса, независимые испытания.
Закон распределения вероятностей, биномиальный закон распределения, распределение Пуассона.
Качественные и количественные характеристики популяции, графическое представление данных.
Функция и плотность распределения вероятностей, равномерное и нормальное распределение, центральная предельная теорема.
P-значения, доверительные интервалы, A/B-тестирование.
Параметрические и непараметрические показатели корреляции, корреляционный анализ, расчет корреляции для заданных значений.
Многомерный статистический анализ. Линейная регрессия.
Дисперсионный анализ. Логистическая регрессия.
Понятие алгоритмов, их виды, исполнители и способы представления, 4 практических кейса.
Циклы — многократное повторение однотипных действий. Рекурсивный перебор, алгоритм Евклида. Решето Эратосфена — алгоритм определения простых чисел. Использование функций.
Понятие массива, кортежа, множества и списков. Обработка последовательностей, одномерных и двумерных массивов. Работа с ассоциативными массивами (таблицами данных). Бинарный поиск элемента в массиве.
Измерения времени работы с использованием timeit. Профайлер.
Основные типы коллекций: counter, doque, defaultdict, ordereddict, namedtuple.
Решение 4 практических задач:
Управление памятью и представление коллекций.
Как работают разные алгоритмы сортировки: пузырьком, быстрая, обратная, сортировка Шелла, с использованием ключа или функции attrgetter.
Двоичные деревья поиска, проход по дереву, хэш-функция.
Вычисления с помощью Numpy. Работа с данными в Pandas.
Визуализация данных в Matplotlib.
Pickle, itertools, collections.
Задача и метрики классификации. Классификаторы KNN и Logloss. Логистическая регрессия и градиентный спуск. Задача на классификацию людей с сердечно-сосудистыми заболеваниями.
Задача и метрики регрессии, Loss-функции для регрессии. Линейная регрессия и регуляризация. Задача предсказание спроса на товар по предыдущим данным.
Деревья для задачи классификации и регрессии. Случайный лес, принципы построения, метод опорных векторов. Проработка задачи по товарам или сердечно-сосудистым заболеваниям.
Задача и метрики кластеризации. Методы кластеризации DBSCAN и KMeans, агломеративная кластеризация, кластеризация деревьями. Добавление признаков из кластеризации в задачу классификации людей с ССЗ.
Методы SVD, PCA, tSNV.
Бустинг и градиентный бустинг: AdaBoost, XGboost, CatBoost.
Label Encoding, One-Hot Encoding, mean encoding, target encoding, работа с текстовыми описаниями.
Обзор методов калибровки моделей и поиска аномалий.
Окончание задачи на выбор:
Основы PyTorch — библиотеки машинного обучения. Применение feedforward-сетей к курсовому проекту по машинному обучению.
Примеры архитектур Resnet, VGG, Alexnet, Inception. Работа с предобученными сетями. Классификация изображений датасета CIFAR.
LSTM, GRU, NER. Классификация текстов стандартными методами и рекуррентными сетями, сравнение качества.
Transformer, BERT, GPT3.
Введение в генеративные сети (GAN), способы дебага нейронных сетей.
Понятие сервиса. Введение в HTTP (TCP/IP).
WSGI сервера, flask, gunicorn.
Реализуем прототип: настраиваем взаимодействие приложения модели.
Gunicorn, falcon. Пример сервиса на стеке flask-gunicorn. Сбор метрик.
Docker. Виртуализация. Как поднять сервис в докере.
Выбор и обучение модели на отобранных признаках. Сравнение качества и оценка модели.
Типы контента. requests, selenium.
Принципы Active-learning. Дообучение моделей, в том числе с добавлением факторов.
Создание прототипа модели:
Начинал с задач по классификации товаров на основе чеков в «Платформе ОФД». Занимался прогнозом спроса для «Пятёрочки» и помогал разрабатывать инструмент для оценки эффективности промоакций.
Работал в PwC и ML Research. Создавал рекомендательные системы для ритейла, оптимизировал маркетинговые кампании на основе ML.
Разрабатывает интеллектуальные системы в ритейле. Два года работал аналитиком игровых проектов в Mail.ru Group, помогал бизнесу принимать управленческие решения на основе данных.
Прогнозирует просмотры рекламы с применением методов искусственного интеллекта. Применял ИИ- и ML-технологии в Сбербанке и Росбанке, строил финансовые модели в компании Equifax.
Декан факультетов искусственного интеллекта и аналитики BigData GeekBrains.
Занимается построением дашбордов для планирования ассортимента, создаёт пайплайн по обработке данных, исследует данные для запуска моделей.
Программа обучения на 70% состоит из вебинаров: вы задаёте вопросы и получаете обратную связь по своим проектам.
Помогает составить резюме и подготовиться к собеседованию.
Отвечает на вопросы по домашним заданиям и помогает быстрее усваивать материал.
Помогает записаться на обучение и освоиться в личном кабинете, передаёт ваши пожелания.
Помогут, если возникнут сложности с личным кабинетом или загрузкой занятий.
Вы получаете электронный сертификат и удостоверение о повышении квалификации установленного образца, их можно приложить к портфолио и показать работодателю. Обучение проводим на основании гослицензии № 040485
Вы можете вернуть до 13% стоимости обучения в виде налогового вычета. Подробности расскажет наш консультант после отправки заявки.