(English Version at README-EN.org)
O projeto do DHBB começou a ser desenvolvido na FGV CPDOC em 1974, produzindo seu primeiro resultado dez anos depois. Era um tempo em que o acesso à internet ainda não era generalizado. Pesquisar sobre temas da história contemporânea do Brasil, além de exigir o domínio da bibliografia pertinente, significava sair em campo para localizar arquivos, consultar coleções de jornais, obter anuários e anais oficiais, entrevistar pessoas.
Publicar significava editar volumes em papel. Exatamente o que foi feito, com a primeira edição do DHBB saindo em 1984, com seus quatro volumes e 4.493 verbetes. Ao consolidar informações até então esparsas com o devido registro das fontes consultadas, a enciclopédia sobre a elite política brasileira tornou-se pioneira, consolidando-se como obra de referência para novas pesquisas. Lançada em 2001, a segunda edição do DHBB atualizou os verbetes existentes e incluiu novos, atingindo um total de 6.620 entradas. Uma novidade chamou a atenção na época: a dupla publicação, em papel e em CD-ROM.
Iniciado novo processo de atualização, num mundo em que a revolução da informática era fato consumado e novos caminhos se abriam à pesquisa histórica, realizaram-se concomitantemente estudos visando à democratização do acesso ao DHBB. Em 2010, nova versão do Dicionário, pôde ser assim oferecida na web, com acesso gratuito e aberto a todos. São 7.553 verbetes, sendo 6.584 de natureza biográfica e 969 verbetes temáticos, relativos a instituições, eventos e conceitos de interesse para a história do Brasil pós-1930.
Todos os verbetes agora podem ser consultados e lidos na íntegra a partir da base de dados integrada do Acervo do CPDOC. Para acessar basta se cadastrar gratuitamente na própria página de busca
http://www.fgv.br/cpdoc/busca/
Este repositório contém os arquivos dos verbetes em formato texto com respectivos metadados. Estes arquivos contém os mesmos conteúdos que podem ser consultados no link acima.
O principal objetivo deste repositório é dar acesso integral ao DHBB à pesquisadores interessados no processamento automático dos textos, inclusive para efeito de mineracao de dados.
- text
- neste diretório encontram-se os verbetes do DHBB, atualizados constantemente pela equipe da FGV CPDOC.
- ref
- em versões anteriores do DHBB, os verbetes eram finalizados com referências as fontes utilizadas pelos editores. Infelizmente, ao longo dos anos, a forma de referência às fontes não foi padronizada e por isso separamos neste diretório as referências antes incluídas no final de cada verbete.
Cada arquivo no diretório text
contém metadados e o texto dos
verbetes. Os arquivos são codificados em UTF-8. No cabeçalho, iniciado
e terminado com linhas contendo três hífens ---
, temos os metadados
do verbete no formato YAML. O texto dos verbetes é codificado em
Markdown mas no momento, apenas separadores de seções são usados.
Veja o arquivo LICENSE
Convidamos qualquer usuário deste repositório ou usuário do site http://www.fgv.br/cpdoc/busca/ que encontre imprecisões nos textos do DHBB, a criar um ISSUE neste repositório indicando o problema encontrado.
A criação de novos verbetes ou significativas mudanças em seus conteúdos são, no entanto, objetivo de avaliação e aprovação pela equipe do DHBB, que detem a prerrogativa de gestão editorial do corpus.
O DHBB adota o versionamento semântico. A primeira release usando este versionamento é a 1.0.0. O critério para novas releases será:
- MAJOR
- quando mudanças na organização ou formato dos arquivos. Mudanças nos metadados utilizados. Mudanças de muitos arquivos por alguma tarefa sistemática da equipe do DHBB.
- MINOR
- mudanças pontuais em um número limitado de verbetes, adição ou remoção de alguns poucos verbetes.
- PATCH
- qualquer correção nos textos não relacionada à mudança de conteúdo. Correção de typo ou erros de codificação etc.