Bản chất của mô hình chủ đề là tô màu cho văn bản và từ

Cách tô:

  1. Mỗi văn bản có càng ít màu càng tốt
  2. Mỗi từ có càng ít màu càng tốt

Với mỗi từ chưa được tô màu, thuật toán Gibbs sẽ thống kê các màu đã được tô trước, sau đó chọi phi tiêu vào để lấy màu theo xác suất. Như vậy màu nào thoả điều kiện thì sẽ có xác suất to hơn, nhưng vẫn không loại trừ những cái nhỏ hơn

1

Nguồn:: Training Latent Dirichlet Allocation: Gibbs Sampling


Cập nhật lần cuối : 20 tháng 4, 2024
Tạo : 12 tháng 10, 2023