/CS117.L22.KHCL

Computational Thinking

Primary LanguageJupyter Notebook

Trường Đại học Công nghệ Thông tin | University of Information Technology

COMPUTATIONAL THINKING

THÀNH VIÊN NHÓM

STT MSSV Họ và Tên Chức Vụ Github Email
1 19521676 Đỗ Trọng Khánh Nhóm trưởng trong-khanh-1109 19521676@gm.uit.edu.vn
2 19521383 Võ Phạm Duy Đức Thành viên ducducqn123 19521383@gm.uit.edu.vn
3 19521326 Trịnh Công Danh Thành viên danhtrinh15092001 19521326@gm.uit.edu.vn

GIỚI THIỆU MÔN HỌC

  • Tên môn học: Tư duy tính toán - Computational Thinking.
  • Mã môn học: CS117.
  • Mã lớp: CS117.L22.KHCL.
  • Năm học: HK2 (2020 - 2021).
  • Giảng viên: TS.Ngô Đức Thành.

GIỚI THIỆU ĐỒ ÁN

  • Tên đồ án: Phân tích bình luận thô tục trên mạng xã hội Facebook

Week 5: Methods of evaluating a classification model.

1. Accuracy.

  • Cách đánh giá này đơn giản tính tỉ lệ giữa số điểm được dự đoán đúngtổng số điểm trong tập dữ liệu kiểm thử.

2. Confusion matrix.

  • Các tính Accuracy ở trên chỉ cho ta biết được phần trăm lượng dữ liệu được phân loại đúng mà không chỉ ra rõ được lớp nào có độ chính xác cao nhất hay thấp nhất và dữ liệu của lớp nào thường bị phân loại nhầm vào lớp khác.
  • Do đó Confusion matrix thể hiện có bao nhiêu điểm dữ liệu thực sự thuộc vào một class, và được dự đoán là rơi vào một class.

3. Precision and Recall.

  • Bài toán phân loại mà tập dữ liệu của các lớp là chênh lệch nhau rất nhiều, có một phép đó hiệu quả thường được sử dụng là Precision-Recall.
  • Precision được định nghĩa là tỉ lệ số điểm Positive mô hình dự đoán đúng trên tổng số điểm mô hình dự đoán là Positive => Precision càng cao, tức là số điểm mô hình dự đoán là positive đều là positive càng nhiều.
  • Recall được định nghĩa là tỉ lệ số điểm Positive mô hình dự đoán đúng trên tổng số điểm thật sự là Positive (hay tổng số điểm được gán nhãn là Positive ban đầu) => Recall càng cao, tức là số điểm là positive bị bỏ sót càng ít.

                 Copyright © 2021 - Đỗ Trọng Khánh