/NMKHDL_FinalProject

Analyze traffic situation in Ho Chi Minh City

Primary LanguageJupyter Notebook

NMKHDL_FinalProject

Phân tích nguyên nhân tử vong ở trẻ em dưới 5 tuổi trên toàn cầu

Bảng phân công

MSSV Họ và tên Công việc Đánh giá
20120524 Võ Đức Lợi Thu thập dữ liệu, tiền xử lý và khám phá dữ liệu 100%
20120322 Đặng Thiên Long Đặt câu hỏi, viết báo cáo 100%
20120274 Nguyễn Đăng Linh Dương Xây dựng mô hình 100%
19120664 Lê Đức Thiện Xây dựng mô hình 100%

Các tài liệu liên quan

Nội dung đồ án

Pha 01 - Thu thập và khám phá dữ liệu

1.1 Thu thập dữ liệu

  • Cài đặt môi trường
  • Phân tích Web API cung cấp dữ liệu
  • Sử dụng Web API thu thập dữ liệu theo từng bước

1.2 Khám phá dữ liệu

  • Cài đặt môi trường
  • Tiền xử lý dữ liệu (làm sạch dữ liệu và sử dụng kỹ thuật đặc trưng)
  • Khám phá dữ liệu (đơn biến, song biến, đa biến)

1.3 Đặt ra những câu hỏi ý nghĩa cần được trả lời

  • Câu hỏi 1: Nguyên nhân nào gây tử vong cao nhất ở Việt Nam từ năm 2000 đến năm 2021 ?
  • Câu hỏi 2: Quốc gia nào có tổng số ca tử vong cao nhất năm 2021 ?
  • Câu hỏi 3: Quốc gia nào có tổng số ca tử vong vì HIV/AIDS cao nhất trong 10 năm qua ?
  • Câu hỏi 4: Nguyên nhân tử vong nào luôn chiếm tỷ lệ tử vong cao nhất trên toàn cầu qua các năm ?
  • Câu hỏi 5: Nguyên nhân tử vong do các bệnh truyền nhiễm phân bố như thế nào ?

Pha 02 - Xây dựng mô hình dữ liệu và đánh giá

  • Bài toán 1: Dự đoán số ca tử vong do sinh non
  • Bài toán 2: Dự đoán số ca tử vong do bệnh dịch dựa trên số ca tử vong không do bệnh dịch

Pha 03 - Triển khai mô hình (chưa thực hiện)