A Engenheira de Machine Learning é a pessoa que trabalha com a operacionalização das soluções que envolvem inteligência artificial (IA), ou seja, cuida de ponta a ponta delas. O maior foco é na disponibilização (o que é comumente referido como "colocar em produção" ou "deployar/fazer deploy"), monitoramento e manutenção dos modelos de IA e integração com outros serviços. Outra tarefa importante é a automação de processos. Além disso um MLE pode ser responsável pela qualidade dos modelos, servindo como suporte/consultor para áreas de Data Science e semelhantes.
O que é mais importante na Engenharia de Machine Learning? É lembrar que a IA é apenas uma ferramenta. Se você tiver um objetivo bem definido e a motivação necessária para resolver o problema escolhido, você será capaz de aprender qualquer coisa para isso.
O maior entregável da Engenheira de Machine Learning é a integridade e escalabilidade de uma solução de IA!
- Conceitos básicos de Inteligência Artificial: tipos de aprendizado, estatística, etc.
- Conhecimento em linguagem de programação, como Python
- Conhecimento em Engenharia de Software: boas práticas de código, microsserviços, APIs, git
- SQL e noções de arquitetura de dados (data warehouse, data lake, delta lake etc.)
- DevOps/MLOps - automatização, CI/CD e pipelines
- Orquestração de serviços e pipelines: Kubernetes, Airflow, Kubeflow
- Ferramentas para atuação com big data, como uso de pyspark e suas melhores práticas de processamento distribuido (hadoop)
- Cloud Computing: AWS, Azure, Google Cloud, Oracle Cloud
- Infraestrutura como Código: Ansible, Terraform, Chef, Puppet, Azure Pipelines
- Soluções de data lake/warehouse/lakehouse: Redshift, Dremio, Presto, Athena, BigQuery, S3, Databricks, etc.
- Conceitos de IA responsável (Responsible AI)
- MLFlow
- Iniciante: https://www.alura.com.br/cursos-online-data-science/sql
- Avançado: https://www.youtube.com/channel/UCW8Ews7tdKKkBT6GdtQaXvQ
- Machine Learning Crash Course: https://developers.google.com/machine-learning/crash-course?_lrsc=2816a671-927b-4c92-af3b-63e9baa14f36
- Inteligência artificial e computacional (Eu Capacito): https://eucapacito.com.br/curso-ec/inteligencia-artificial-e-computacional/
- Machine Learning (Stanford, com Andrew Ng): https://www.coursera.org/learn/machine-learning
- Cursos do DeepLearning.AI: https://www.deeplearning.ai/programs/
- Made With ML (ML aplicado + MLOps): https://madewithml.com/
- Machine Learning University (cursos diversos): https://www.youtube.com/channel/UC12LqyqTQYbXatYS9AA7Nuw/featured
Supletivos Data Hackers
- 61º Python Floripa - Edição sobre Machine Learning
- Roadsec@Home#26 - Hands-on "Aprendendo o "Hello World" da Engenharia de Machine Learning"
- Cursos do Kaggle (são vários!)
- Google Cloud Platform (GCP) skills challenge
- MLFlow docs
- MLOps: pipelines de entrega contínua e automação no aprendizado de máquina
- Rules of Machine Learning
- Guia para profissionais de MLOps: um framework para entrega contínua e automação de machine learning
- MLOps and DevOps: Why Data Makes It Different
- MLOps: The Upcoming Shining Star
- Esse artigo fala dos motivos pelos quais MLOps é tão importante
- The Hundred-Page Machine Learning Book - Andriy Burkov
- Blog da Chip Huyen
- Blog do Eugene Yan
- Papers with Code
- Awesome MLOps (listas que outras pessoas fizeram sobre o tema!)
- Guia dos principais termos: https://atozofai.withgoogle.com/intl/pt-BR/
- Definições de fairness (justiça):
- Viés: https://www.youtube.com/watch?v=mdCEaHjHsxs
- Model cards: https://modelcards.withgoogle.com/about
- "Interpretable Machine Learning: A Guide for Making Black Box Models Explainable": https://christophm.github.io/interpretable-ml-book/