Deploy FastAPI Machine Learning model dengan menggunakan CloudRun
- Pyenv (optional)
- Virtualenv (optional)
- Python 3.9
- Google Cloud Platform Account
- Google Cloud Platform - API Cloud Build
$ python -m venv [nama-folder]
$ cd [nama-folder]
$ cd Scripts
$ activate
$ cd ..
$ git clone https://github.com/fikrimln16/fastAPI-cloudrun-models-deployment
$ pip install -r requirements.txt
$ uvicorn main:app --reload
$ gcloud init
$ gcloud services enable run.googleapis.com
$ gcloud builds submit --tag gcr.io/[project-id-kalian]/fastapi-model-deployment
$ gcloud run deploy --image gcr.io/[project-id-kalian]/fastapi-model-deployment --platform managed --region asia-southeast2 --allow-unauthenticated fastapi-model-ml
-
Pastikan Anda memiliki akun Google Cloud Platform (GCP) yang aktif. Jika belum, daftar dan buat proyek baru di https://console.cloud.google.com.
-
Pastikan Anda telah menginstal Google Cloud SDK (https://cloud.google.com/sdk) dan menginisialisasi dengan menjalankan perintah berikut di terminal atau command prompt:
gcloud init
-
Buatlah repository di layanan pengelolaan kode seperti GitHub atau GitLab, dan pastikan repository tersebut berisi semua file yang diperlukan untuk aplikasi FastAPI, termasuk Dockerfile, requirements.txt, dan kode aplikasi FastAPI Anda.
-
Buka terminal atau command prompt, lalu arahkan ke direktori tempat Anda ingin mengklon repository FastAPI.
-
Klone repository FastAPI dengan menjalankan perintah berikut:
git clone https://github.com/fikrimln16/fastAPI-cloudrun-models-deployment
-
Setelah proses pengklonan selesai, arahkan terminal atau command prompt ke direktori FastAPI yang baru saja dikloning.
-
Build container Docker lokal dengan menjalankan perintah berikut:
docker build -t gcr.io/[PROJECT_ID]/fastapi-app .
Ganti [PROJECT_ID] dengan ID proyek Google Cloud Platform yang telah Anda tentukan sebelumnya. -
Setelah proses pembangunan selesai, verifikasi bahwa kontainer Docker lokal berjalan dengan menjalankan perintah berikut:
docker run -p 8080:8080 gcr.io/[PROJECT_ID]/fastapi-app
Pastikan tidak ada kesalahan dan aplikasi FastAPI berjalan dengan baik di localhost. -
Jika langkah sebelumnya berhasil, berhenti dan hapus kontainer Docker yang berjalan dengan menekan Ctrl+C di terminal atau command prompt.
-
Untuk menerbitkan kontainer Docker ke Google Cloud Container Registry, jalankan perintah berikut:
docker push gcr.io/[PROJECT_ID]/fastapi-app
Kontainer akan diunggah ke Container Registry di proyek Google Cloud Platform yang sesuai. -
Selanjutnya, buat layanan Cloud Run dengan menjalankan perintah berikut pada asia-southeast2(jakarta):
gcloud run deploy --image gcr.io/[PROJECT_ID]/fastapi-model-deployment --platform managed --region asia-southeast2 --allow-unauthenticated fastapi-model-ml
-
GCP akan meminta Anda untuk memilih wilayah (region) untuk mendeploy layanan Cloud Run. Pilih wilayah yang sesuai dengan kebutuhan Anda.
-
Setelah proses deploy selesai, GCP akan memberikan URL yang dapat digunakan untuk mengakses aplikasi FastAPI yang dideploy. Salin URL tersebut dari output dan coba akses di web browser atau dengan menggunakan perangkat lunak pengujian API seperti Postman.
Untuk mencoba demo model diatas bisa buka link tersebut : https://fastapi-model-deployment-dl6yh3mkfa-et.a.run.app/docs