g2QFCKwavghUp2yzjKrIFwEeG13RASCerFTCMH35



ETL: proses memindahkan data dari berbagai source(aplikasi ERP,spreadsheet, aplikasi ERP) ke target(Datawarehouse), yang terdiri dari proses ekstraksi yaitu membaca data dari satu atau lebih database, yang kedua proses transform yaitu mengubah bentuk data dari source ke dalam bentuk yang perlu sehingga dapat ditempatkan kedalam DWH, yang ketiga proses Load yaitu memindai data yang telah terintegrasi dan dibersihkan dari staging area ke Datawarehouse.

ELT: proses memindahkan data dari berbagai source ke target, namun berbeda dari sisi movement. data disalin terlebih dahulu ke target kemudian di transformasikan perbedaanya adalah ETL merupakan proses yang tradisional untuk proses pemindahan data dari source ke target karena data yang dipindahkan tidak terlalu besar, sedangkan ELT memindahkan data yang berukuran sangat besar dan targetnya merupakan data engine seperti hadoop, data appliance, dalam proses loading ELT lebih cepat dibanding dengan ETL karena data dari berbagai sumber langsung di load kemudian baru ditransformasikan.
Source Image :https://miro.medium.com/max/1400/1*YXXRlmITRb4bVWPeJ4MeWQ.jpeg

Perbedaan utamanya adalah adalah pada ELT ini kita memanfaatkan power of big data.
Kita akan melakukan ingestion data dalam bentuk raw format ke Hadoop dan di transform di cluster big data.
Sementara jika ETL yang dilakukan adalah proses transformasi dilakukan di server ETL yang notabene merupakan single server yang memiliki kapasitas besar. Tentu saja kemampuan server ini terbatas dan harga untuk memperbesar nya ( Vertical Scaling ) cukuplah mahal.
Mari kita bandingkan single server ETL dengan cluster (kumpulan dari beberapa node/server) Hadoop. Jelas ELT merupakan pilihan dari Big Data.

Selama beberapa dekade terakhir ETL (extract, transform, load) telah menjadi pendekatan tradisional untuk data warehousing dan analisis. Pendekatan ELT (ekstrak, load, transformasi) mengubah paradigma lama. ETL : Extract -> Transform -> Load ELT : Extract -> Load -> Transform Perubahan ini terlihat sederhana, tapi memiliki perbedaan besar dalam keseluruhan konsep manajemen datanya. 

ETL vs ELT

  1. Waktu - Beban ETL: Menggunakan area staging dan sistem, waktu tambahan untuk load data ELT: Semua dalam satu sistem, hanya muat satu kali
  2.  Waktu - Transformasi ETL: Perlu menunggu, terutama untuk ukuran data yang besar - seiring pertumbuhan data, waktu transformasi meningkat ELT: Semua dalam satu sistem, kecepatan tidak tergantung pada ukuran data 
  3. Waktu - Pemeliharaan ETL: Pemeliharaan yang tinggi - pilihan data untuk load dan transform dan harus melakukannya lagi jika terhapus atau ingin meningkatkan repositori data utama ELT: Pemeliharaan rendah - semua data selalu tersedia 
  4. Kompleksitas Implementasi ETL: Pada tahap awal, membutuhkan sedikit ruang dan hasilnya bersih ELT: Membutuhkan pengetahuan mendalam tentang alat dan desain ahli dari gudang repositori utama
  5. Style Analisis dan Pengolahan ETL: Berdasarkan beberapa skrip untuk membuat tampilan - menghapus tampilan berarti menghapus data ELT: Menciptakan tampilan adhoc - biaya rendah untuk pembangunan dan pemeliharaan 
  6. Batasan Data atau Pembatasan dalam Supply ETL: Dengan asumsi dan memilih data yang diprioritaskan ELT: Dengan kebijakan hardware (tidak ada) dan data retention
  7.  Dukungan Data Warehouse ETL: Model warisan yang lazim digunakan untuk data lokal dan relasional, terstruktur ELT: Disesuaikan untuk menggunakan infrastruktur cloud untuk mendukung big data terstruktur dan tidak terstruktur 
  8. Dukungan Data Lake ETL: Bukan bagian dari pendekatan ELT: Memungkinkan penggunaan Lake dengan data terstruktur yang didukung 
  9. Kegunaan ETL: Tabel tetap, timeline tetap, Digunakan terutama oleh IT ELT: Ad Hoc, Agility, Fleksibilitas, Dapat digunakan oleh semua orang dari pengembang hingga integrator awam 
  10. Cost-Effective ETL: Tidak hemat biaya, untuk usaha kecil dan menengah ELT: Scalable dan tersedia untuk semua ukuran bisnis dengan menggunakan solusi SaaS online.

Daftar Referensi
  • https://medium.com/data-engineering-bootcamp/etl-vs-elt-a8d4400e5d57#:~:text=Perbedaan%20utamanya%20adalah%20adalah%20pada,memanfaatkan%20power%20of%20big%20data.&text=Sementara%20jika%20ETL%20yang%20dilakukan,server%20yang%20memiliki%20kapasitas%20besar.
  • https://www.academia.edu/36316608/ETL_dan_ELT
Related Posts

Related Posts

Posting Komentar