Bài tập phân lớp sử dụng Naive Bayes
2017-08-11Bài toán
Sử dụng Naive Bayes, phân lớp cho tập thuộc tính (A1, A2) = (1, 1)
:
A1 | A2 | Lớp |
---|---|---|
1 | 0 | C1 |
0 | 0 | C1 |
2 | 1 | C2 |
1 | 2 | C2 |
0 | 1 | C1 |
1 | 1 | ? |
Lý thuyết
Cho C1, C2,..,Cn là phân hoạch không gian mẫu M. A là biến cố được dự đoán thuộc phân hoạch (lớp) Ci nếu:
Nghĩa là tiến hành so sánh các xác suất có điều kiện của biến cố Ci được tính với điều kiện biến cố A đã xảy ra, và chọn xác suất lớn nhất.
Theo định lý Bayes, ta có:
Như vậy để so sánh , ta so sánh phần tử của (1). Theo xác suất kết hợp, phần tử có thể biến đối thành:
Giả sử , và các biến cố Aj độc lập.
Suy ra:
Theo chain rule:
vì các Ai độc lập nên:
Do đó trở thành:
Như vậy, thay vì so sánh các , chúng ta có thể so sánh các .
Lời giải
Quay lại bài toán trên, để phân lớp khi thuộc tính X = (A1, A2) = (1, 1)
, ta so sánh 2 xác suất có điều kiện:
Theo lý thuyết, thay vì so sánh 2 xác suất trên, ta đi so sánh:
Lần lượt có:
,
,
,
Sau khi tính toán, nhận thấy rằng:
Vậy X = (A1, A2) = (1, 1)
thuộc lớp C2.