Skip to content Skip to sidebar Skip to footer

Menghitung Naive Bayes dengan Excel Atribut Data Numerik


Assalamualikum Wr. Wb Salam Sejahtera untuk kalian semua dan salam budaya.

Oke..., Pada pembahasan kali ini saya akan memberikan anda pengalaman tentang bagaimana cara menghitung naive bayes menggunakan microsoft excel pada kasus atribut data numerik atau kontinu.

Sebelum kalian ingin menghitung naive bayes menggunakan excel, kalian harus lebih paham tentu tentang kosep dasar perhitungan algoritma naive bayes pada kasus data nemerik atau bisa kalian baca di Menghitung Naive Bayes Atribut Data Kontinu.

Jika kalian sudah bisa membahami konsep dasar perhitungannya kita juga akan bisa mengitungnya menggunakan formula excel. Pada Microsoft excel kita akan memanfaatkan formula atau rumus fungsi COUNTIF, STDEV dan AVARAGE. Dan Langsung saja kita mulai tahap yang paling awal yaitu persiapan data.

Baca Juga : Cara menghitung laplacian correction algoritma Naive Bayes

1. Persiapan Data

    Pertama lakukan filter berdasarkan kelasnya. Disini saya akan memberi contoh dengan memfilter dua kelas yaitu (Lulus dan Keluar). Cara mengaktifkan adalah pertama. Blok Letak kolom kelas, kemudian pilih menu Sort & Filter dan pilih Filter. Selanjutnya pada kolom kelas pilih icon filter dan pilih salah satu kelas yang akan di filter

Filter

Langkah berikutnya buat tabel sendiri untuk menyalin data yang sudah di Filter. Dalam contoh saya akan membuat tabel seperti ini 

Dua Tabel Variabel

2. Hitung NILAI MEAN

    Pada konsep perhitungan selanjutnya kita akan menghitung nilai mean atau rata-rata disetiap atributnya dengan berdasarkan kelasnya. Dalam contoh kita akan menghitung nilai mean dari atribut Jumlah MK dengan kondisi kelas lulus maka formulanya adalah 
=AVARAGE(Blok Kolom JUMLAH MK) kemudian ENTER. Catatan lain kita harus membuat tabel MEAN  tersendiri agar bisa membedakan untuk pehitungannya. Contoh :

Mean

Tabel diatas adalah hasil perhitungan dari nilai mean berdasarkan kelasnya yang sudah kita filter ditahap nomer satu tadi.

3. Hitung Standar Deviasi.

    Selanjutnya kita hitung nilai standar deviasi nya dari masing-masing atribut berdasarkan kelasnya. Dan rumus standar deviasi adalah sebagai berikut 
Standar Deviasi
Bagaimana kita menerapkan di formula excel ? jawabnya sudah disediakan oleh microsoft dengan memberikan fitur yang mudah, fitur atau formula standar deviasi terdapat dua bagian yaitu. STDEV.S dan STDEV.P . Apa fungsi itu semua sama atau berbeda ?
  • STDEV.S , adalah kondisi argumennya adalah sampel dari populasi
  • STDEV.P , adalah kondisi yang agrumennya menghitung seluruh populasi
Dalam kasus ini kita akan menggunakan STDEV.S karena yang akan kita hitung adalah masing-masing atribut dari seluruh populasi.


Sama seperti point nomor dua, buat tabel untuk membedakan atribut dari kelas lulus dan kelas keluar.  Dalam contoh kita akan menghitung nilai standar deviasi dari atribut Jumlah MK. kemudian hitung standar deviasi dengan formula
=STDEV.S(Blok atribut JUMLAH MK) kemudian ENTER. Dan lakukan ini untuk setiap atributnya.

Standar Deviasi

Tabel diatas adalah hasil perhitungan dari nilai standar deviasi berdasarkan kelasnya yang sudah kita filter ditahap nomer satu tadi.

4. Hitung Probabilitas Setiap kelasnya

Selanjutnya adalah menghitung nilai probabilitas atau peluang dari setiap kelasnya. Disini kita akan menggunakan formula COUNTIF dan COUNTA. Yang kita hitung nilai peluangnya bukan lagi data yang sudah di filter tapi adalah data yang asli atau data sebelum kita filter. dan Kita tulis rumusnya untuk menghitung nilai peluang dari kelas Lulus
=COUNTIF(Blok atribut Kolom Kelas;"Lulus"/COUNTA(Blok atribut Kolom Kelas) kemudian ENTER. dan untuk atribut kelas Keluar maka kita hanya mengganti "Lulus" menjadi "Keluar".

Probabilitas

Tabel diatas adalah hasil dari nilai probabilitas dari masing-masing kelasnya.

5. Hitung Nilai Gaussiannya.

Distribusi Gaussian adalah merupakan langkah terakhir untuk mengetahui hasil dari data latih, atau sebuah model uji data dengan mengambil nilai dari peluang dari data latih. Rumusnya adalah sebagai berikut :
Fungsi Gaussian
Berikutnya kita akan mencoba menghitung dari nilai uji data yang belum diketahui kelasnya 

Tes Data

Pertama hitung dulu distribusi gaussian dari masing-masing kelas yaitu kelas lulus dan keluar.
Jika menghitung dari kelas LULUS maka kita harus mengambil dari nilai mean, standar deviasi dari kelas Lulus yang sudah di bedakan dari poin satu dan dua. Dalam contoh kita akan menghitung nilai distribusi gaussian dari atribut Jumlah MK kelas Lulus. Tulis rumusnya seperti ini
 

=1/SQRT(2*3,14*standar deviasi Jumah MK kelas LULUS)*EXP(-((54-Nilai mean Jumlah MK kelas LULUS)^2/(2*standar deviasi Jumah MK kelas LULUS^2))) kemudian ENTER

lakukan rumus itu untuk masing-masing atribut. Dan untuk distribusi gaussian dari kelas Keluar maka ganti dengan nilai dari kelas keluar. 

Fungsi Gaussian

Setelah sudang menghitung dari atribut Jumlah MK sampai IPS S3, Maka langkah terakhir adalah mengalikan semua variabel dengan nilai probabilitas dari masing-masing kelas atau poin empat.
Caranya adalah =4.02403E-06*0.05512 .................. *0.03807425*nilai probabilitas kelas Lulus) kemudian Enter dan jika kelas Keluar  maka ganti dengan nilai probabiltas kelas Keluar. 
Kemudian hasil dari masing-masing kelas terdapat pada tabel di kolom kelas diatas.
Cari nilai Maximalnya. Dan diisitu nilai maksimalnya diperoleh dari hasil dari Distribusi Gaussian kelas Keluar.
Maka data uji dari mahasiswa dengan jumlah mk = 54, absensi =81,03%, Jumlah SKS 1-3 = 100, IPS S1 = 2.25, IPS S2 =2.83, IPS S3 =1.8 di prediksi algoritma naive bayes dengan hasil kelasnya adalah KELUAR. 

Terimakasih, semoga informasi ini bisa bermanfaat, apabila kamu berkenan bisa bantu donasi untuk pengembangan blog yang saya bangun melalui link ini https://saweria.co/PenS .

Oke jika kalian sudah bisa memahami teori diatas, kalian juga bisa belajar secara detail tentang Perhitungan Naïve Bayes Atribut Data Kontinyu Dengan Menggunakan MS.Excel pada video dibawah ini.

Ika teman-teman sudah belajar tentang cara menghitung algoritma naive bayes dengan data kontinyu atau numerik. teman-teman juga bisa mengunduh file excel seperti yang ada pada video di atas. link nya ada pada unduh bewarna excel.

 


Terimakasih sudah percaya dan mau belajar sendiri. untuk menghindari kesalah pahaman diantara beribu bintang hanya kau lah yang paling terang.. awowok :)

Nah itulah cara penyelesain masalah pada kasus atribut data numerik pada proses perhitungan Algoritma Naive Bayes dan jika kamu ingin belajar lebih dalam lagi, kamu bisa mendapatkan file excelnya.
  • File Excel ini berisikan 8 sheet perhitungan dari 3 algoritma
  • Naive Bayes (atribut numerik, deskrit, campuran), k-NN (atribut numerik, campuran ), C4.5 (numerik, deskrit)
  • Harga File Rp. 85.000, -
  • Jika Custom Data pada satu Algoritma Rp. 150.000,-
  • Bonus perhitungan Confusion Matrix.
  • File Excel untuk Satu Agoritma saja Rp. 30.000,-
Bisa menghubungi Admin di menu Contact yang terletak di footer bawah.