Rencana Riset Bulan Oktober 2016

{Riset terdahulu}

Riset semester lalu dilakukan berdasarkan dari paper “Combating Sub-clusters Effect in Imbalanced Classification” dari Yang Zhao yang dipublish pada “2013 IEEE 13th International Conference on Data Mining”. Paper ini telah dicitasi oleh 3 paper lain termasuk paper “Imbalanced classification by learning hidden data structure” yang juga ditulis oleh penulis paper pertama.

Pada intinya paper tersebut ingin memecahkan masalah imbalanced class pada masalah binary class atau 2 class. Cara yang dilakukan adalah dengan melakukan dekomposisi masalah atau memecah masalah besar menjadi sub masalah untuk dipecahkan. Pada paper tersebut, cara memecah masalah adalah dengan membagi class mayoritas menjadi sub cluster. Sub cluster yang dihasilkan diperiksa dengan between-class variance dan within-class variance untuk memastikan cluster yang dihasilkan sudah bagus. Dan proses membuatan sub cluster akan diulang jika hasilnya tidak bagus. Kemudian dilakukan klasifikasi pada setiap sub cluster dan class minoritas.

 

{Riset yang telah dilakukan}

Pada riset yang telah saya lakukan pada semester lalu saya menggunakan data original dari dataset tanpa dimodifikasi menjadi kasus binary class.  Setiap class dicluster menjadi sub cluster dengan jumlah instance sesuai dengan jumlah instance class terkecil.  Proses clustering menggunakan teknik bisectional clustering dengan menggunakan algoritma K-Means. Proses ini akan menghasilkan jumlah sub-cluster yang banyak dengan label class yang telah dimodifikasi.  Artinya akan dimiliki jumlah class yang banyak dengan jumlah instance yang nyaris sama.

Setelah itu baru dilakukan klasifikasi multi-class untuk seluruh class tersebut dengan menggunakan beberapa algoritma seperti SVM, KNN dan lain-lain.

Tetapi performance classifier yang dihasilkan tidak lebih baik dibandingkan dengan performance classifier yang menggunakan data original.  Hal tersebut terjadi, kemungkinan karena saya melakukan klasifikasi multi-class dengan jumlah class yang terlalu banyak. Sehingga mungkin menurunkan performance classifier.

 

{Riset yang akan dilakukan}

Dari kedua pembahasan di atas maka akan saya coba menggunakan teknik membuat cluster yang telah saya lakukan. Kemudian untuk proses klasifikasi dilakukan dengan teknik dekomposisi masalah, yaitu dengan melakukan klasifikasi 1 sub cluster dari class mayoritas dengan class minoritas.

Leave a Comment

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *