Manajemen Data adalah bagian dari manajemen sumber daya informasi yang mencakup semua kegiatan yang memastikan bahwa data:
Kegiatan Manajemen Data1. Pengumpulan DataData yang diperlukan dikumpulkan dan dicatat dalam suatu formulir yang disebut dokumen sumber yang berfungsi sebagai input bagi system.2. Integritas dan PengujianData tersebut diperiksa untuk meyakinkan konsistensi dan akurasinya berdasarkan suatu peraturan dan kendala yang telah ditentukan sebelumnya.3. PenyimpananData disimpan pada suatu medium, seperti pita magnetic atau piringan magnetic.4. PemeliharaanData baru ditambahkan, data yang ada diubah, dan data yang tidak lagi diperlukan dihapus agar sumberdaya data (berkas) tetap mutakhir.5. KeamananData dijaga untuk mencegah penghancuran, kerusakan atau penyalahgunaan.6. OrganisasiData disusun sedemikian rupa untuk memenuhi kebutuhan informasi pemakai.7. PengambilanData tersedia bagi pemakai.
- akurat dan efisien
- Pengertian Data Warehouse
Terdapat banyak pendapat yang mampu menerangkannya seperti pendapat para pakar berikut ini :
Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya.
Jadi, data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda.
Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.
Karakteristik Data Warehouse
1. Subject Oriented (Berorientasi subject)
data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu.
2. Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah.
3. Time-variant (Rentang Waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu.
4. Non-Volatile
Data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan.
Fungsi Data Warehouse
menurut williams ada 4 fungsi atau tugas warehouse yakni :
- pembuatan laporan
- On-Line Analytical Processing (OLAP). OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL.
- Data mining proses untuk menggali(mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika.
- Proses informasi executive
Beberapa keuntungan dari penggunaan data warehouse yakni :
- Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
- Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
- Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
- Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Sekilas tentang Data Mining ,yakni suatu proses yang interaktif atau terotomatisasi untuk menemukan pola (pattern) data tersebut dan memprediksi kelakuan (trend) di masa mendatang berdasarkan pola data tersebut
Perkembangan saat ini data warehouse digunakan sebagai sumber data untuk Business Intelligence (BI), penyempurnaan CRM (Customer Relationship Management) ataupun Data Mining (DM).Oleh karena itu dapat dikatakan bila data mining memerlukan data yang banyak untuk di analisa dan mendapatkan pola-pola tertentu yang pengoperasian datanya berasal dari datawarehouse yang menyimpan data besar.
warehouse sendiri merupakan suatu sistem yang mengkonsolidasikan data secara periodik dari sistem-sistem yang ada (OLTP) ke dalam suatu penyimpanan dimensional. Model OLTP ini lebih digunakan untuk dibuat insert, update, delete (transactional). Biasanya < 10TB untuk tetap menjaga performance. Selain itu terdapat juga datawarehouse model OLAP, di mana model ini lebih di gunakan buat analisis di mana data mining salah satunya. Model OLAP ini biasa digunakan oleh datawarehouse untuk mempercepat proses sehingga datamining dapat berkerja secara optimal dan lebih cepat.
Istilah-Istilah Dalam Warehouse
- Data Warehouse : metode penyimpanan data dalam skala yang sangat besar
- Data Mining : metode pencarian pengetahuan baru yang terkandung dalam data yang sangat besar
- On-Line Analytical Processing(OLAP) : salah satu cara membuktikan pengetahuan baru yang didapatkan oleh data mining
- Data Mart : mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan.
- On-Line Transaction Processing(OLTP) : suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari.
- Dimension Table : Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan.
- Fact Table : Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik
- DSS : sistem yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
http://blog.ub.ac.id/labuitenzorgetadam/2010/11/02/pengertian-datawarehouse-by-adam/