/covidtest-tracking-indonesia

men-track laju test covid dan perkembangan jumlah laboratorium test RT-PCR maupun TCM di Indonesia. Dikumpulkan dari twit Direktur Pengembangan Strategi Penanggulangan Bencana BNPB, maupun dari akun resmi BNPB

Primary LanguagePython

Covid Test Scraper

Script ini bertujuan mengumpulkan laporan Gugus Tugas Covid terkait perkembangan jumlah laboratorium dan jumlah test di Indonesia sejak 1 April 2020. Data diambil dari twit Bapak Agus (@aw3126) dan dari BNPB (@bnpb_indonesia). Proses ocr menggunakan modul pytesseract.

Requirements

  • Python 3
  • twint
  • pytesseract

Installation

  • git clone https://github.com/lantip/covidtest-tracking-indonesia.git
  • cd covidtest-tracking-indonesia
  • Jalankan pip install -r requirements.txt

Usage

# untuk mengumpulkan twit, gunakan:
$ python main.py

File image akan disimpan dalam folder "data". Hasil akan tersimpan dalam file twit.json

# untuk proses extract text menjadi file json:
$ python tsr.py

Hasil akan disimpan dalam file result.json