Bài tập phân lớp sử dụng Naive Bayes

2017-08-11

Bài toán

Sử dụng Naive Bayes, phân lớp cho tập thuộc tính (A1, A2) = (1, 1):

A1 A2 Lớp
1 0 C1
0 0 C1
2 1 C2
1 2 C2
0 1 C1
1 1 ?
Lý thuyết

Cho C1, C2,..,Cn là phân hoạch không gian mẫu M. A là biến cố được dự đoán thuộc phân hoạch (lớp) Ci nếu:

Nghĩa là tiến hành so sánh các xác suất có điều kiện của biến cố Ci được tính với điều kiện biến cố A đã xảy ra, và chọn xác suất lớn nhất.

Theo định lý Bayes, ta có:

Như vậy để so sánh , ta so sánh phần tử của (1). Theo xác suất kết hợp, phần tử có thể biến đối thành:

Giả sử , và các biến cố Aj độc lập.

Suy ra:

Theo chain rule:

vì các Ai độc lập nên:

Do đó trở thành:

Như vậy, thay vì so sánh các , chúng ta có thể so sánh các .

Lời giải

Quay lại bài toán trên, để phân lớp khi thuộc tính X = (A1, A2) = (1, 1), ta so sánh 2 xác suất có điều kiện:

Theo lý thuyết, thay vì so sánh 2 xác suất trên, ta đi so sánh:

Lần lượt có:

,

,

,

Sau khi tính toán, nhận thấy rằng:

Vậy X = (A1, A2) = (1, 1) thuộc lớp C2.