rsouza/Databases_Course

Algumas sugestões :)

Opened this issue · 0 comments

Opa Renato,

como vão as coisas?

Apareceu no meu feed aqui do github o material pra esse curso que me parece muito útil. Seria mto grato se o tivesse tido. :)

Estou me dando o direito de fazer algumas sugestões de bases de dados e suas interlocuções com python que venho usando recentemente.

  1. SQLite (ou qlqr base) + jupyer + plotly
    Tem esse tutorial que eu sempre achei super útil e mostra como fazer query de bases de dados grandes usando sqlite.

  2. Recentemente eu descobri que dá pra fazer seus próprios 'comandos mágicos' no jupyter (obviamente). E fiz alguns para trabalhar com sql e acho eles super úteis. Posso te copiar as funções que criei se interessar.

  3. Bigquery e Athena. Essas bases de dados são distribuídas e maravilhosas para trabalhar com mto dado. Eu tenho a impressão que elas serão os 'standard' para trabalhar com bastante dados por um tempo. Não tem que ficar montando servidor, etc.

  4. Para trabalhar com o Athena da AWS tem esse pacote awswrangler que facilita mto as coisas. Tu pode subir um pandas como tabela particionada no Athena em uma linha. Também tem o pyathena para fazer queries.

  5. O bigquery também tem suporte nativo do pandas.

Abraços!