/proj-covid

Iniciativa do IPRJ/UERJ de reunir informações relevantes de fontes seguras sobre o COVID-19

Primary LanguagePython

Proj-COVID

Este repositório é uma iniciativa dos alunos e professores do IPRJ/UERJ no intuito de reunir informações relevantes de fontes confiáveis sobre o COVID-19

Usando este repositório

pip install -r requirements.txt
cd covid_news_scraper/
scrapy crawl CovidSearchDoctorEvidence -a limit=2 -t csv -o file.csv
# ou
scrapy crawl ArchiveItCollection -t csv -o file.csv
# ou
scrapy crawl WhoInt -t csv -o file.csv

Objetivo

Buscar e organizar/agrupar informações sobre publicações contendo decisões/experiências/soluções ligadas à COVID-19.

  • Assuntos envolvidos
    • Ventiladores/Respiradores (projetos open)
    • Peças impressas em 3D para EPI’s
    • Acessórios impressos em 3D para ventiladores/respiradores
    • Protocolos e ferramentas usadas para esterilização e desinfecção de EPI’s
    • Remédios testados
    • Máscaras cirúrgicas
    • CPAP e BIPAP e conversão para respiradores
    • Roupas de proteção
    • Estratégias de isolamento e resultados obtidos
    • Medidas de ajuda à economia (Pessoas físicas e jurídicas)
    • Outros assuntos

Resultado a ser gerado

Confecção de uma tabela, atualizada diariamente, contendo as informações conforme exemplificadas na Tabela 1.

Assunto País Data 1º acesso Autor(es) Resumo Fonte (site, artigo, etc)
Remédios testados - 05/04/2020 OMS
EUA 05/04/2020 CDC
06/04/2020 FDA
06/04/2020 MIT
Brasil 05/04/2020 Min. Saúde
06/04/2020 Governadores
06/04/2020 FioCruz
... ...
...
CPAP/BIPAP e conversão para respiradores - 06/04/2020 OMS
EUA 06/04/2020 Stanford
07/04/2020 Gov. Federal
07/04/2020 MIT
Brasil 05/04/2020 Min. Saúde
06/04/2020 Pref. Nova Friburgo
07/04/2020 UFRJ
... ...
... ...
  • Disponibilização dessas informações em um site, onde o usuário poderá se cadastrar, escolher tópicos e definir período que deseja receber por email notificações de novas inclusões (serviço similar ao oferecido no Scopus) - solicitação feita por Edgard em 08/04.
  • Possibilitar o cadastro de especialista, com aprovação posterior (do administrador do site). Esse especialista poderá confirmar a credibilidade de determinado conteúdo e emitir parecer - solicitação feita por Edgard em 08/04.

Fontes a serem consultadas

  • Revistas científicas
  • Sites de órgãos governamentais (ex.: FDA, Ministério da Saúde)
  • Sites de universidades
  • Sites de empresas e organizações do terceiro setor
  • Jornais e revistas

Desenvolvimento

Fase 1 - web scraping

A partir dais informações obtidas, agrupar e organizar os dados conforme a tabela 1.

Fase 2

TBD