Naive Bayes [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

departement sales sales sales systems systems systems systems marketing marketing secretary secretary



age 31--35 26--30 31--35 21--25 31--35 26--30 41--45 36--40 31-35 46-50 26-30



salary 46K-50K 26K-30K 31K-35K 46K-50K 66K-70K 46K-50K 66K-70K 46K-50K 41K-45K 36K-40K 26K-30K



status senior junior junior junior senior junior senior senior junior senior junior



count 30 40 40 20 5 3 3 10 4 4 6



Tentukan status bagi data baru (department: “systems”, age: “26…30”, salary: “46K…50K”) Tabel di bawah ini berisi perhitungan dan probabilitas pada dataset employee. Department Age Salary   senior junior   senior junior   senior junior Sales 30 80 21…25 0 20 26K…30K 0 46 Systems 8 23 26…30 0 49 31K…35K 0 40 Marketing 10 4 31…35 35 44 36K…40K 4 0 Secretary 4 6 36…40 10 0 41K…45K 0 4       41…45 3 0 46K…50K 40 23       46…50 4 0 66K…70K 8 0 Sales 30/52 80/113 21…25 0 20/113 26K…30K 0 46/113 Systems 8/52 23/113 26…30 0 49/113 31K…35K 0 40/113 Marketing 10/52 4/113 31…35 35/52 44/113 36K…40K 4/52 0 Secretary 4/52 6/113 36…40 10/52 0 41K…45K 0 4/113       41…45 3/52 0 46K…50K 40/52 23/113       46…50 4/52 0 66K…70K 8/52 0



Status senior junior 52 113                     52/165 113/165                    



Untuk menentukan status bagi data baru (department: “systems”, age: “26…30”, salary: “46K…50K”), dapat digunakan formula seperti di bawah ini.



Langkah 1 Misalkan atau  



dan , yaitu:



, akan dihitung nilai prior probability



Langkah 2 Hitung likelihood



untuk setiap atribut, yaitu:



      Untuk menghindari zero-probability pada atribut age: “26…30” dan status: “senior”, maka dengan menggunakan Laplacian correction akan ditambahkan nilai 1 pada setiap kasus. Sehingga diperoleh,  Selanjutnya likelihood probability-nya adalah:   Langkah 3 Hitung posterior probability, yaitu



.











Karena nilai posterior probability tertinggi adalah



, maka Naïve Bayes classifier



memprediksikan status data baru (department: “systems”, age: “26…30”, salary: “46K…50K”) adalah “junior”.