Mengubah / mentransformasikan data ke dalam bentuk yang paling tepat / cocok untuk proses data mining.
•Generalization dari
data, dimana level rendah atau data
•"primitif" (data mentah) digantikan oleh higher-level concepts
melalui penggunaan hirarki konsep.
•Normalization, dimana
data sebuah atribut diskalakan ke dalam rentang (kecil) yang ditentukan.
•min-max
normalization
•z-score
normalization
•normalization
by decimal scaling
•Attribute Construction
(atau Feature
Construction), dimana atribut-atribut yang
baru dibentuk dan ditambahkan ke dalaanm kelompok atribut yang telah ada.
Anggap bahwa nilai minimum dan
maximum
untuk atribut income secara berturut-turut adalah $12,000
dan $98,000. Jika
income
akan dipetakan pada rentang [0.0,1.0], dengan normalisasi
min-max, maka $73,600, sebuah nilai dari income
ditransformasikan menjadi
Tidak ada komentar:
Posting Komentar