Phân tích ý kiến khách hàng trực tuyến trong lĩnh vực khách sạn tiếp cận theo mô hình chủ đề

Bài viết đã thu thập tập ngữ liệu với 26,482 ý kiến nhận xét và bình luận của khách hàng bằng tiếng Anh từ một số trang web thương mại điện tử trong lĩnh vực khách sạn. Sau khi tiền xử lý dữ liệu thu thập được, mô hình được đánh giá thông qua các phép đo Perplexity và Coherence Score để chọn số lượng chủ đề (K) tốt nhất làm tham số đầu vào cho mô hình. Cuối cùng, thực nghiệm trên tập ngữ liệu theo mô hình chủ đề Latent Dirichlet Allocation (LDA) với hệ số K để khám phá chủ đề tiềm ẩn.