Arquivo da tag: RAC

O jornalismo guiado por dados de acordo com Giannina Segnigni

O jornal El País divulgou uma palestra sobre jornalismo guiado por dados proferida pela repórter costa-riquenha Giannina Segnigni. A jornalista recebeu recentemente o prêmio Gabriel García Márquez e é especializada em investigação de tráfico e contrabando.

Segnini divide o jornalismo guiado por dados (JGD) em cinco etapas:

  1. Obtenção dos dados — Por um lado, é preciso conhecer os tipos de formatos e arquivos usados para a armazenagem de dados pelo setor público, para poder fazer pedidos de acesso à informação eficazes. Por outro, é preciso conhecer o marco jurídico que rege o a disponibilidade dos bancos de dados governamentais.
  2. Limpeza dos dados — É essencial, porque dados com ruído inviabilizam ou engendram erros na etapa seguinte, de análise.
  3. Análise dos dados — Para Segnini, esta é a etapa eminentemente jornalística do JGD. Envolve comparar, cruzar e correlacionar dados para encontrar tendências, padrões, comportamentos atípicos e explicações de fenômenos sociais.
  4. Verificação dos dados — O fato de uma base de dados ser produzida por uma instituição pública não garante a consistência da informação. É preciso tratar os dados com ceticismo, como se faz com qualquer outra fonte.
  5. Visualização dos dados — “Entrevistar” os dados e encontrar informação pode não ser suficiente, em geral é preciso apresentar as descobertas de forma atrativa para o leitor.

Durante a palestra, ela critica o que Paul Bradshaw chama de “data porn”: visualizações com muita pirotecnia, mas que não oferecem ao leitor a possibilidade de explorar ou comparar dados, ou mesmo apresentam pouco valor informativo. A seu ver, uma boa peça de JGD não deixa perguntas no ar — porque encontrar respostas é, afinal, o trabalho dos jornalistas — e não deixa o leitor perdido num oceano de dados.

A principal vantagem do JGD para o jornalismo, para Segnini, é a criação de informação inteligente, diferenciada, num mundo em que a maior parte da informação é agregada de terceiros e muito pouco contextualizada.

Ao final, a costa-riquenha lembra o adágio sobre ver o bosque e não se focar nas árvores, para dizer que, com o JGD, é possível ver as duas coisas ao mesmo tempo. O leitor comum pode desfrutar das visualizações, enquanto os nerds podem ter acesso às bases de dados completas e explorá-las por si mesmos. Com isso, aumenta a transparência da reportagem, mas do jornalista passa a ser exigida uma abdicação do controle total sobre a narrativa.

Websites e weblogs dedicados ao jornalismo guiado por dados

Há alguns meses, iniciei uma busca por websites e weblogs cujo foco principal fosse o jornalismo guiado por dados. A tarefa se mostrou bastante mais difícil do que se poderia imaginar. Com o falecimento dos blogrolls, infelizmente, desapareceu a curadoria espontânea produzida pelos autores de weblogs, que até a metade da década de 2000 oferecia conjuntos valiosos de referências sobre todos os assuntos blogáveis — ou seja, N+1 temas existentes no universo.

As ferramentas de busca não foram de grande ajuda, retornando resultados pífios, mesmo com o apoio de operadores lógicos. Muitos websites simplesmente não se apresentam como focados em jornalismo guiado por dados. Por outro lado, como são especializados, terminam soterrados sob o peso do PageRank da Wikipedia, de páginas de grandes universidades e websites generalistas sobre jornalismo na busca orgânica.

A solução foi convocar a coletividade para criar a lista. A partir de uma simples planilha no Google Docs, aberta à edição por qualquer pessoa, a base de dados cresceu de dez para mais de cem registros. Há desde as referências mais óbvias até websites produzidos por gente muito longe dos grandes centros, especialmente América Latina e África.

A planilha foi divulgada na revista Data Driven Journalism e em listas de discussão como as da Abraji. Por sorte, muitos nós importantes no Twitter e Facebook abraçaram a iniciativa. O resultado mostra que o princípio do crowdsourcing pode ser aplicado de maneira bastante simples.

Ao longo das semanas, vários colaboradores fizeram sugestões. A primeira foi esclarecer a licença de uso da planilha, de modo que os participantes tivessem certeza do interesse público deste esforço. Coloquei a planilha sob domínio público. Uma outra sugestão importante foi indicar a linguagem de cada website, porque muitos autores escrevem em inglês, apesar de esta não ser sua língua nativa, e para facilitar a filtragem. Também percebi que muitos colaboradores não tinham uma noção clara do conceito de jornalismo guiado por dados, então incluí na planilha uma referência ao verbete na Wikipedia.

Inicialmente, também havia uma lista em português, mas houve poucas contribuições e muito spam, então ela ficou para trás.

Quando nerds e palavras se confrontam

Em razão de minha pesquisa de doutorado, venho buscando, há meses, uma cópia do livreto When nerds and words collide: reflections on the development of Computer-Assisted Reporting, organizado por Nora Paul e publicado pelo instituto Poynter em 1999. A tarefa se mostrou inglória, até que um contato com a própria Nora Paul a levou a pedir ao Poynter Institute uma autorização para digitalizar o material. A obra pode ser distribuída livremente, mas os direitos autorais permanecem restritos e qualquer outro tipo de uso deve ser autorizado pela instituição.

O livreto traz relatos de diversos jornalistas envolvidos com Reportagem Assistida por Computador nos anos 1990. Tem grande valor histórico e acadêmico para os pesquisadores da área. Bom proveito!

When Nerds and Words Collide by Marcelo Träsel