A Associação Brasileira de Jornalismo Investigativo (Abraji) lançou no último dia 10 de setembro o projeto Publique-se, uma plataforma de busca que reúne documentos de mais de 30 mil processos judiciais cujos textos citam mais de 9 mil políticos brasileiros. Nenhuma outra ferramenta no Brasil até hoje identificou e reuniu tantos processos citando candidatos a cargos públicos.
A ideia é facilitar o acesso a provas, relatórios, comprovantes e documentos anexados a esses processos para ajudar repórteres em investigações jornalísticas sobre candidatos a cargos públicos. A ferramenta é gratuita e pode ser acessada no endereço publique-se.org.br.
Nesta primeira etapa, o projeto baixou dados de centenas de milhares de ações no Supremo Tribunal Federal (STF) e no Superior Tribunal de Justiça (STJ). Casos notórios de outros tribunais envolvendo grandes investigações sobre o poder público serão acrescentados numa segunda etapa.
“Houve um imenso esforço de captura e tratamento de dados para possibilitar a busca dentro desses documentos. O que você vai achar ali não são apenas processos que têm determinado político como réu ou investigado, mas todas as referências àquele político dentro de documentos em diferentes processos – mesmo que ele não seja parte naquele processo. Certamente há muita pauta escondida ali”, diz Tiago Mali, coordenador do projeto.
Ser citado em uma ação judicial não significa que o político tenha necessariamente participado de esquema de corrupção ou que tenha tido conduta reprovável. A transparência com relação a essas informações, no entanto, é passo importante para uma fiscalização mais ativa das instituições e dos agentes públicos por parte dos jornalistas. A Abraji fez uma lista de boas práticas para utilizar os dados do Publique-se.
Idealizado pela Abraji, o projeto contou com parceria da Associação Brasileira de Jurimetria (ABJ) na captura e tratamento dos dados e conta com o patrocínio do Instituto Betty e Jacob Lafer.
Como funciona
A base de documentos da primeira etapa do projeto foi criada a partir de downloads automatizados dos bancos de dados de processos eletrônicos do STF e do STJ. Os arquivos baixados passaram por uma ferramenta de reconhecimento de caracteres (OCR) para que seja possível pesquisar o texto dentro deles – muitos dos PDFs são imagens cujo texto não é pesquisável.
Após a extração de texto, o projeto identificou dentro das milhões de páginas de documentos aquelas que mencionam o CPF de cidadãos que se candidataram a qualquer eleição brasileira a partir de 2006 – são mais de 1 milhão de CPFs diferentes. Foram mantidos na ferramenta apenas os processos que citam dentro do seu texto o CPF de algum político.
A partir desta base, que no momento do lançamento reúne documentos de mais de 30 mil processos, é possível buscar diretamente por nomes de políticos ou fazer uma “busca livre” por termos de interesse que estejam presentes nos documentos de processos que citam políticos.
A primeira rodada de download em massa dos documentos foi feita entre os meses de fevereiro e março deste ano, reunindo todos os processos eletrônicos de diferentes anos presentes nas páginas do Judiciário. Uma segunda rodada, que acrescentará os processos iniciados após esse download, está em andamento e deve ser incorporada à ferramenta antes do primeiro turno das eleições.