Menentukan
Ketepatan Data yang diperlukan Dalam ETL
Mark Mosley (2008) mengatakan Data Quality adalah level data yang menyatakan data tersebut akurat, lengkap, terbaru, konsisten dan sesuai dengan semua kebutuhan bisnis
Data Quality Characteristic
·
Accuracy
: sejauh mana data dengan benar
mencerminkan objek dunia nyata atau yang
di deskripsikan
·
Accesbility
: data dapat dengan mudah diakses, dan dimengerti, serta dapat digunakan sesuai
dengan keperluan yang dibutuhkan
·
Completeness
: sejauh mana seluruh data yang dibutuhkan tersedia
·
Consistency
: bahwa data di seluruh perusahaan harus sinkron dengan satu sama lain
·
Integrity
: setiap data harus berhubungan atau dpat dihubungkan dengan data-data yang
lain sehingga setiap data bisa saling terkait
·
Timeliness
: data harus mempresentasikan dengan waktu saat itu
Data Quality
Tools
Data
Auditing
a. Data
Auditing meningkatkan akurasi dan kebenaran data pada sumbernya. Tools ini pada
umumnya membandingkan data di database sumber dengan aturan bisnis yang
ada.
b. Bila menggunakan sumber eksternal
organisasi, aturan bisnis dapat ditentukan dengan menggunakan teknik data
mining untuk menemukan pola dalam data. Data yang tidak mematuhi aturan bisnis
kemudian dapat dimodifikasi sesuai kebutuhan.
Data
Cleansing
Data
cleansing merupakan proses identifikasi dan mengoreksi data yang kotor. Data
yang kotor seperti data tidak lengkap, salah, duplikat, atau melampaui tanggal.
Data cleansing berguna untuk melakukan standarisasi dan verifikasi data terhadap
data yang tidak dikenali
Beberapa
fitur yang terdapat dalam Data Cleansing :
·
Data
Parsing
·
Data
Standarization
·
Data
correction and verification
·
Data
Transformasi
·
Householding
Data Migration
digunakan untuk mengekstrak data dari sumber untuk dikirim ke staging area dan dari staging area ke data warehouse
Referensi :
Materi kelompok 8
http://blog.umy.ac.id/fajarrianda/2014/10/29/assuring-data-quality/
Tidak ada komentar:
Posting Komentar