COMPUTATIONAL THINKING
THÀNH VIÊN NHÓM
STT | MSSV | Họ và Tên | Chức Vụ | Github | |
---|---|---|---|---|---|
1 | 19521676 | Đỗ Trọng Khánh | Nhóm trưởng | trong-khanh-1109 | 19521676@gm.uit.edu.vn |
2 | 19521383 | Võ Phạm Duy Đức | Thành viên | ducducqn123 | 19521383@gm.uit.edu.vn |
3 | 19521326 | Trịnh Công Danh | Thành viên | danhtrinh15092001 | 19521326@gm.uit.edu.vn |
GIỚI THIỆU MÔN HỌC
- Tên môn học: Tư duy tính toán - Computational Thinking.
- Mã môn học: CS117.
- Mã lớp: CS117.L22.KHCL.
- Năm học: HK2 (2020 - 2021).
- Giảng viên: TS.Ngô Đức Thành.
GIỚI THIỆU ĐỒ ÁN
- Tên đồ án: Phân tích bình luận thô tục trên mạng xã hội Facebook
Week 5: Methods of evaluating a classification model.
1. Accuracy.
- Cách đánh giá này đơn giản tính tỉ lệ giữa số
điểm được dự đoán đúng
vàtổng số điểm trong tập dữ liệu kiểm thử
.
2. Confusion matrix.
- Các tính Accuracy ở trên chỉ cho ta biết được phần trăm lượng dữ liệu được phân loại đúng mà không chỉ ra rõ được lớp nào có độ chính xác cao nhất hay thấp nhất và dữ liệu của lớp nào thường bị phân loại nhầm vào lớp khác.
- Do đó Confusion matrix thể hiện có bao nhiêu điểm dữ liệu thực sự thuộc vào một class, và được dự đoán là rơi vào một class.
3. Precision and Recall.
- Bài toán phân loại mà tập dữ liệu của các lớp là chênh lệch nhau rất nhiều, có một phép đó hiệu quả thường được sử dụng là Precision-Recall.
- Precision được định nghĩa là tỉ lệ
số điểm Positive mô hình dự đoán đúng
trêntổng số điểm mô hình dự đoán là Positive
=> Precision càng cao, tức là số điểm mô hình dự đoán là positive đều là positive càng nhiều. - Recall được định nghĩa là tỉ lệ
số điểm Positive mô hình dự đoán đúng
trêntổng số điểm thật sự là Positive
(hay tổng số điểm được gán nhãn là Positive ban đầu) => Recall càng cao, tức là số điểm là positive bị bỏ sót càng ít.
Copyright © 2021 - Đỗ Trọng Khánh