/Spam-filter

Xây dựng ứng dụng lọc email spam bằng giải thuật Naïve Bayes sử dụng ngôn ngữ Java

Primary LanguageJava

Spam-filter

Xây dựng ứng dụng lọc email spam bằng giải thuật Naïve Bayes sử dụng ngôn ngữ Java

  • Giải thuật Naïve Bayes thuộc vào nhóm Supervised Machine Learning Algorithms (Học có hướng dẫn), gồm có các quy trình thực hiện:

    1. Tiền xử lý và làm sạch dữ liệu
    2. Xác định đặc trưng và lựa chọn đặc trưng
    3. Trích xuất đặc trưng
    4. Xác định ngưỡng.
  • Các bước chạy chương trình:

    • Nhập thư(có thể nhập trực tiếp vào ô textbox hoặc đọc từ file
    • Nhấn button check để kiểm tra
    • Xem kết quả

==> Sau mỗi lần thực thi, chương trình sẽ ghi nhận kết quả và đưa vào huấn luyện

  • Mục đích của phần mềm là xác định mail đầu vào có phải là thư rác hay không và tính xác suất là thư rác của từng ký tự có trong mail