>Tujuan dari visualisasi adalah bagaimana sistem komputer membantu kita dalam tugas mengelola.
>Eksplorasi visual data dapat dengan mudah mengangani data yang sangat besar, sangat homogen dan noisy sejumlah data.
> Eksplorasi visual data tidak membutuhkan pemahaman tentang matematika yang kompleks dan logika statistik.
>Teknik visualisasi memberikan gambaran kualitatif yang berguna untuk analisis kuantitatif lebih lanjut.
Representasi adalah pemetaan informasi menjadi format visual.
Contoh :
Objek-objek sering direpresentasikan sebagai titik
Nilai atribut-atributnya dapat direpresentasikan sebagai posisi dari
titik-titik atau karakteristik dari titik sebagai contoh warna, ukuran
dan bentuk
Jika posisi di gunakan, maka relasi pada titik , apakah terbentuk
dalam group atau sebuah titik pencilan, dapat dengan mudah dilihat.
Objek-objek sering direpresentasikan sebagai titik
Nilai atribut-atributnya dapat direpresentasikan sebagai posisi dari
titik-titik atau karakteristik dari titik sebagai contoh warna, ukuran
dan bentuk
Jika posisi di gunakan, maka relasi pada titik , apakah terbentuk
dalam group atau sebuah titik pencilan, dapat dengan mudah dilihat.
Dapat membuat perbedaan besar mengenai bagaimana mudahnya untuk memahami data.
>Entitas adalah sebuah objek yang ingin di visualisasikan.
>Atribute qulaity sering di gunakan untuk menggambarkan metode visualisasi.
>Nominal adalah pelebelan
Ex : buah dapat di klasifikasikan dalam jambu , jeruk dll.
>interval adalah suatu pengukuran untuk mendapatkan kesenjangan nilai antar data.
Sumber dari Data :
> Survey
>Eksperiment
>Observasi
Visualisasi dari Matriks Data Iris
Sebagai bagian dari operasi harian suatu organisasi, data merupakan kumpulan dari alasan varietas.
>Database Operasional adalah Database ini berisi transaksi bisnis yang sedang berlangsung. Database jenis ini diakses terus-menerus dan diperbarui secara teratur.
> Data Warehouse adalah Sebuah gudang data adalah salinan dari data yang dikumpulkan dari yang lain sumber dalam suatu organisasi yang telah dibersihkan, normalisasi dan dioptimalkan untuk membuat keputusan, database jenis ini diperbarui tetapi tidak sesering database operasional.
>Historical Databases
Databases are often used to house historical polls,surveys and experiments.
>Purchased data
Penggabungan dari data internal yang ada dengan data dari eksternal.
>Data Tables
>Continuous and Discrete Variables
Sebuah kategorisasi awal yang berguna untuk mendefinisikan setiap variabel yang dapat diambil dalam hal ini adalah jenis nilai, berikut ini adalah daftar istilah deskriptif untuk kategori variabel:
>Konstan: Sebuah variabel dimana setiap nilai data adalah sama.
>Dikotomis: Sebuah variabel di mana hanya ada dua nilai.
>Diskrit : variabel yang hanya dapat mengambil nilai-nilai tertentu (baik teks atau angka).
Kontinu: Sebuah variabel yang memiliki nilai numerik yang tak terbatas dalam kisaran tertentu
>Scales of Measurement
Skala variabel menunjukkan akurasi di mana data telah diukur. Klasifikasi ini memiliki implikasi untuk jenis analisis yang dapat dilakukan terhadap variabel tersebut.
>Roles in Analysis
Hal ini juga berguna untuk berpikir tentang bagaimana variabel akan digunakan dalam analisis berikutnya. Contoh peran dalam analisis data
>Label : Variabel yang menjelaskan pengamatan individu dalam data.
>Deskriptor : variabel ini hampir selalu dikumpulkan untuk mengambarkan suatu observasi
>Respon : variabel ini yang diprediksi dari model prediktif
>Distribusi Frekuensi : Distribusi frekuensi didasarkan pada jumlah nilai atau rentang nilai (dalam hal skala interval atau rasio).
Visualisasi dari Matriks korelasi Iris