15
Курсов
250+
Отзывов
20
Обзоров
Професии

1 место. Курс «Spark Developer» — OTUS

https://otus.ru/lessons/spark/

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 65 000 ₽

Курс рассчитан на Data инженеров, желающих глубже изучить Spark, а попутно также Hadoop и Hive.

На курсе вы изучите следующие основные темы:

и т.д.

Научитесь применять все это на практике и закрепите с помощью интересных и сложных домашних заданий и выпускного проекта.

После прохождения курса вы сможете:

Программа обучения:

Модуль 1. Scala

Модуль 2. Hadoop

Модуль 3. Spark

Модуль 4. Streaming

Модуль 5. Apache Hive

Модуль 6. Обслуживающие системы

Модуль 7. Проектная работа

Выпускной проект

В качестве выпускного проекта будет построена ETL-система на основе Hadoop, включающая в себя:

После курса Вы:

  1. заберете с собой полный комплект обучающих материалов: видеозаписи всех вебинаров, презентации к занятиям, а также решение задач и проектов в виде кода на github и другие дополнительные материалы;
  2. получите сертификат о прохождении курса;
  3. получите приглашение пройти собеседование в компаниях-партнерах (эту возможность получают самые успешные студенты).

2 место. Курс «Анализ данных с Apache Spark» — ООО “УЦ КОММЕРСАНТ”

https://spark-school.ru/courses/apache-spark-data-analyz/

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 54 000 ₽

3-дневный практический курс для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют Spark SQL, потоковую обработку Spark Streaming, машинное обучение MLLib и построение графов Spark GraphX.

Программа курса:

  1. Обзор Apache Spark
    Архитектура Обзор компонентов Spark и их назначения
  2. Основные абстракции Apache Spark
    Трансформации и действия, Lazy Evaluation
  3. Знакомство с Dataframes
    Structured API и основная абстракция Spark – Dataframe
  4. Знакомство со Spark RDD
    Low Level API, использование Resilient Distributed Dataset
  5. Apache Spark SQL
  1. Работа с источниками данных
  1. Производительность и параллелизм в Apache Spark
    Планы выполнения запроса: логические и физические
  2. Конфигурирование Apache Spark
    Принципы конфигурирования и основные настройки
  3. Spark Streaming
  1. GraphX
  1. MLLib
  1. Обработка слабоструктурированных данных

3 место.Курс «Анализ данных с Apache Spark» — Академия АйТи

https://academyit.ru/courses/SPARK/

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 52 000 ₽ — 54 000 ₽

Целевая аудитория:

Специалисты, аналитики данных и разработчики, желающие получить опыт настройки и использования компонентов Apache Spark.

Успешное окончание обучения по программе курса позволит специалистам:

Цель курса:

Совершенствование знаний и навыков, необходимых для анализа данных с помощью Apache Spark.

Расписание:

  1. Экосистема Apache Spark — Spark RDD
  1. Apache Spark SQL
  1. Spark Streaming
  1. GraphX

Курс «Основы Apache Spark» — Luxoft Training

https://www.luxoft-training.ru/kurs/osnovy_apache_spark.html

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 37 000 ₽

Курс дает представление об основах Apache Spark и методах разработки приложений, обрабатывающих данные на его основе. Рассматриваются как базовые возможности Spark (RDD), так и проекты, расширяющие их набор: Spark SQL, Spark Streaming, MLLib, Spark ML, GraphX.

Целевая аудитория:

Разработчики, архитекторы.

Цели:

Разбираемые темы:

  1. Основные концепции и архитектура Spark;
  2. Программирование с RDD;
  3. Использование RDD с парами ключ/значение;
  4. Загрузка и сохранение данных;
  5. Аккумуляторы и широковешательные переменные;
  6. Spark SQL, DataFrames, Datasets;
  7. Spark Streaming;
  8. Машинное обучение с использованием MLLib и Spark ML;
  9. Анализ графов с использованием GraphX.

После окончания курса выдаётся сертификат на бланке Luxoft Training.

Курс «Apache Spark» — bigdataschool

https://www.bigdataschool.ru/apache-spark

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 36 000 ₽ — 54 000 ₽

Курсы предназначены для разработчиков распределенных приложений, инженеров больших данных, аналитиков Big Data, DataOps и DevOps-инженерам, а также специалистов по Data Science и Machine Learning, которые хотят получить следующие знания и навыки:

Курсы:

  1. Анализ данных с Apache Spark
  2. Core Spark — основы для разработчиков
  3. Потоковая обработка в Apache Spark
  4. Машинное обучение в Apache Spark
  5. Графовые алгоритмы в Apache Spark.

Курс «Apache Spark» — НОЧУ ДПО «НЬЮПРОЛАБ»

https://newprolab.com/ru/spark-module

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 32 000 ₽

Для кого этот курс?

Чему вы научитесь:

В курсе есть четыре составляющих

  1. RDD и Dataframes API
    Научитесь загружать данные в Spark и преобразовывать их в RDD или датафреймы, а также совершать операции и трансформации над ними. Узнаете об отличиях этих двух форматов и в каких случаях их стоит использовать, а также про узкие и широкие трансформации, broadcast-переменные и аккумуляторы.
  2. Spark ML
    Научитесь тренировать модели машинного обучения в Spark и делать при помощи них прогнозы. Узнаете, как создавать автоматизированные пайплайны в Spark ML из различных трансформаций.
  3. Spark GraphX
    Научитесь работать с графовыми данными в Spark при помощи специальной библиотеки GraphX. Узнаете о том, как правильно анализировать данные из соцсетей.
  4. Spark Streaming
    Научитесь работать в режиме near real-time при помощи Spark Streaming, подключаясь к Kafka как источнику данных и производя агрегации над ними.

Лабы этого курса

  1. Неперсонализированные рек. Системы
    Задача — построить различного рода топы для рекомендации фильмов пользователям, по которым еще нет никаких данных, используя RDD в Apache Spark.
  2. Content-based рек. Системы
    Вам нужно будет, рассчитывая похожесть описаний онлайн-курсов, выявить те, которые можно рекомендовать в дополнение пользователям, используя Spark Dataframes.
  3. Коллаборативная фильтрация
    Используя матричные разложения, разработать рекомендации, учитывающие жанр, стиль и другие неявные факторы фильма, используя Spark.
  4. Гибридная рек. Система
    Соревнование, в котором вам нужно будет добиться наилучшего скора, используя вместе разные алгоритмы рекомендательных систем, в том числе алгоритмы Spark ML.
  5. Рекомендации фильмов по телесмотрению
    Используя данные по просмотру телепередач разных пользователей, сделать рекомендации фильмов по подписке с использованием Spark ML.

Курс «Промышленное машинное обучение на Spark» — НИУ ВШЭ

https://cs.hse.ru/dpo/mlforindustry

ТОП-7 курсов Spark в 2023 году: обучение онлайн. Рейтинг, сравнение, стоимость.

Стоимость: 30 000 ₽

Курс о настоящем Apache Spark, который базируется на практическом использовании этого инструмента в «боевых условиях» на потоках данных из миллионов транзакций в день. Это практический курс, где вся теория подкреплена практикой. Вы получите комплексные знания о новом инструменте и научитесь его применять.

Чему научитесь:

Для кого: 

Программа:

8 недель обучения

  1. Как работают и где живут большие данные
    Введение в большие данные. Организация хранения данных и отличие от обычных систем. Map-Reduce и правила работы с большими данными. Обзор экосистемы. SQL поверх больших данных.
  2. Погружение в среду Spark. Spark RDD / Spark SQL
    Знакомство со Spark. Сравнение RDD и DataFrame. Реализация методов или расчетов в RDD и в DataFrame. Развитие инструмента: от функционального программирования с RDD до приемлемых и знакомых методов из Pandas в Spark DataFrame.
  3. Advanced SQL (+ pandas UDF и др.)
    Усложнение методов аналитики и обработки данных. Трансформации данных и настоящие примеры. Сравнение методов. Разбор каждого метода: где и какой метод можно применять. Инструменты и новые функции (Pandas UDF и др.). Настройки (configuration Spark).
  4. Spark ML / Spark TimeSeries
    Машинное обучение на Решение задач по анализу временных рядов.
  5. Advanced ML & проверка результатов качества моделей
    Подключение Java библиотек Xgboost и Catboost в Spark. Подготовка Model Quality по результатам обучения модели регрессии и классификации.
  6. Spark GraphX / Spark Streaming
    Графовые данные в Spark в библиотеке Анализ социальных сетей. Streаming в Spark. Использование данных из реального времени.
  7. Spark Ecosystem (MLFlow, AirFlow, H2O AutoML)
    Интеграция Spark с другими промышленными сервисами. Spark в MLFlow и AirFlow для автоматизации работы. Интеграция Spark в другие библиотеки и продукты (на примере H2O).
  8. Spark в архитектуре проекта / Spark CI/CD
    Правильная архитектура Spark и работа с ним. Автоматизация (Continious Integration) процесса разработки и интеграции кода в готовый продукт. Структура Spark проекта и «что можно ещё поменять в Spark» для ускорения или упрощения работы.

Документ при успешном завершении обучения.