Giai đoạn 1

Data Engineer

Làm chủ Big Data và Cloud Computing.

Làm chủ Big Data và xây dựng hạ tầng dữ liệu với Spark, Hadoop và Cloud ETL Pipelines. 100% thực chiến với dự án thật đang triển khai của doanh nghiệp .
Nhận Certificate of Completion: Data Engineer pathway.

Học phí

15.000.000 VND

Giai đoạn 1

Kỹ năng đạt được

Apache Spark: Cơ chế Catalyst Optimizer, thực thi Tungsten.
Optimization: Chiến lược Partitioning, xử lý Data Skew, tinh chỉnh bộ nhớ (Memory Tuning).
Architecture: Kiến trúc Master-Slave, giao tiếp Driver-Executor.

LEVEL 1

Advanced Python & SQL: Lập trình hàm (Functional programming), AsyncIO, tối ưu hóa HiveSQL, Recursive CTEs.
Linux & Shell Automation: Quản lý tiến trình, Cron jobs, viết Bash script tự động hóa, SSH tunneling.
Hadoop Internals: Kiến trúc HDFS (NameNode/DataNode), quản lý tài nguyên YARN.
Spark Core Architecture: Cơ chế RDD lineage, lập lịch DAG Scheduler, Catalyst Optimizer, Tungsten.

Linux/Bash Docker HDFS/YARN Spark Core SQL Tuning Git Advanced

LEVEL 2

The Lakehouse Pattern: Triển khai kiến trúc Medallion (Bronze/Silver/Gold) với Delta Lake sử dụng Spark.
Modern ETL & Transformation: Chuyển đổi dữ liệu với dbt (Data Build Tool), điều phối luồng chạy bằng Airflow DAGs.
Streaming Pipelines: Thu thập dữ liệu thời gian thực với Kafka & Spark Structured Streaming.
DataOps & Governance: CI/CD với GitHub Actions, kiểm soát chất lượng dữ liệu (Great Expectations).

Databricks Airflow dbt Kafka Azure/AWS CI/CD

Đăng ký ngay để nhận lộ trình chi tiết và tư vấn 1:1