Skip to content

lutfiahk/riskratingclassification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

KLASIFIKASI merupakan salah satu metode dari supervised learning, yang dapat diartikan sebagai suatu algortima atau Teknik yang dapat digunakan untuk membuat suatu skema 
atau kategori data yang berlabel.

Dalam melakukan pengklasifikasian diperlukan dua data, yaitu data train atau data yang digunakan dalam proses learning of mapping, dan data test atau data yang akan 
digunakan pada proses classifier. Data train dan data test ini bersifat independen terhadap satu sama lain. Terdapat beberapa algoritma terkenal yang sering digunakan 
dalam pengklasifikasian, antara lain naïve bayes, k-nearest neighbor, decision tree, support vector machine, dan random forest. 

STUDI KASUS :  PENENTUAN RISK RATING PADA KARYAWAN

Sebagai Data Scientist keuangan di perusahaan, perlu untuk mempertimbangkan pemberian pinjaman pada karyawan. Sehingga perlu untuk memberikan risk rating atau penilaian 
risiko yang dilihat dari riwayat finansial, kewajiban, dan asset yang dimiliki oleh individu tersebut. 
Pada data yang digunakan, terdapat 7 kolom, dengan 900 baris data yang akan digunakan dalam pengklasifikasian. 

Dalam prosesnya, hanya terdapat 3 kolom yang akan digunakan datanya untuk melakukan klasifikasi yaitu kolom pendapatan_setahun_juta, durasi_pinjaman_bulan,dan 
jumlah_tanggungan. Dalam data tersebut, terdapat suatu kolom "risk_rating" yang merupakan pelabelan yang telah dilakukan sebelumnya, yang kemudian akan digunakan oleh 
program untuk melakukan learning mapping, dan juga sebagai referensi saat melakukan testing pada model yang digunakan.
Pada studi kasus ini, digunakan r programming dan library

Untuk penjelasan lanjut dapat dilihat pada file pdf, dan data yang digunakan dapat diakses pada file xlsx