ELT: proses memindahkan data dari berbagai source ke target, namun berbeda dari sisi movement. data disalin terlebih dahulu ke target kemudian di transformasikan perbedaanya adalah ETL merupakan proses yang tradisional untuk proses pemindahan data dari source ke target karena data yang dipindahkan tidak terlalu besar, sedangkan ELT memindahkan data yang berukuran sangat besar dan targetnya merupakan data engine seperti hadoop, data appliance, dalam proses loading ELT lebih cepat dibanding dengan ETL karena data dari berbagai sumber langsung di load kemudian baru ditransformasikan.
Perbedaan utamanya adalah adalah pada ELT ini kita memanfaatkan power of big data.
Kita akan melakukan ingestion data dalam bentuk raw format ke Hadoop dan di transform di cluster big data.
Sementara jika ETL yang dilakukan adalah proses transformasi dilakukan di server ETL yang notabene merupakan single server yang memiliki kapasitas besar. Tentu saja kemampuan server ini terbatas dan harga untuk memperbesar nya ( Vertical Scaling ) cukuplah mahal.
Mari kita bandingkan single server ETL dengan cluster (kumpulan dari beberapa node/server) Hadoop. Jelas ELT merupakan pilihan dari Big Data.
ETL vs ELT
- Waktu - Beban ETL: Menggunakan area staging dan sistem, waktu tambahan untuk load data ELT: Semua dalam satu sistem, hanya muat satu kali
- Waktu - Transformasi ETL: Perlu menunggu, terutama untuk ukuran data yang besar - seiring pertumbuhan data, waktu transformasi meningkat ELT: Semua dalam satu sistem, kecepatan tidak tergantung pada ukuran data
- Waktu - Pemeliharaan ETL: Pemeliharaan yang tinggi - pilihan data untuk load dan transform dan harus melakukannya lagi jika terhapus atau ingin meningkatkan repositori data utama ELT: Pemeliharaan rendah - semua data selalu tersedia
- Kompleksitas Implementasi ETL: Pada tahap awal, membutuhkan sedikit ruang dan hasilnya bersih ELT: Membutuhkan pengetahuan mendalam tentang alat dan desain ahli dari gudang repositori utama
- Style Analisis dan Pengolahan ETL: Berdasarkan beberapa skrip untuk membuat tampilan - menghapus tampilan berarti menghapus data ELT: Menciptakan tampilan adhoc - biaya rendah untuk pembangunan dan pemeliharaan
- Batasan Data atau Pembatasan dalam Supply ETL: Dengan asumsi dan memilih data yang diprioritaskan ELT: Dengan kebijakan hardware (tidak ada) dan data retention
- Dukungan Data Warehouse ETL: Model warisan yang lazim digunakan untuk data lokal dan relasional, terstruktur ELT: Disesuaikan untuk menggunakan infrastruktur cloud untuk mendukung big data terstruktur dan tidak terstruktur
- Dukungan Data Lake ETL: Bukan bagian dari pendekatan ELT: Memungkinkan penggunaan Lake dengan data terstruktur yang didukung
- Kegunaan ETL: Tabel tetap, timeline tetap, Digunakan terutama oleh IT ELT: Ad Hoc, Agility, Fleksibilitas, Dapat digunakan oleh semua orang dari pengembang hingga integrator awam
- Cost-Effective ETL: Tidak hemat biaya, untuk usaha kecil dan menengah ELT: Scalable dan tersedia untuk semua ukuran bisnis dengan menggunakan solusi SaaS online.
Daftar Referensi
- https://medium.com/data-engineering-bootcamp/etl-vs-elt-a8d4400e5d57#:~:text=Perbedaan%20utamanya%20adalah%20adalah%20pada,memanfaatkan%20power%20of%20big%20data.&text=Sementara%20jika%20ETL%20yang%20dilakukan,server%20yang%20memiliki%20kapasitas%20besar.
- https://www.academia.edu/36316608/ETL_dan_ELT

