Piccola introduzione al datajournalism

Oggi abbiamo fatto il primo incontro con i numeri. O meglio, con i numeri che possono diventare una fonte, possono nascondere una notizia, esattamente come un intervistato qualsiasi.

Oppure si possono trasformare nella base per prepararsi a un in incontro, un’inchiesta o un’ulteriore indagine, ben sapendo che gli ordini di grandezza di un determinato fenomeno assumono certe dimensioni.

Dove trovare i numeri

Il primo passaggio è stato l’incontro con la ricerca avanzata di Google: dalla classica finestra https://www.google.com/advanced_search passando per i comandi da inserire direttamente nella query.

site:istat.it o filetype:csv sono tra i due comandi più utili perché il primo circoscrive a un dominio, mentre il secondo restituisce direttamente un file del formato indicato (in questo caso Comma Separated Values.

In caso di PDF: no panic

Quando vi trovate a dover estrarre i numeri da una pagina PDF, ricordatevi che esiste Tabula.

Tabelle pivot come prima “bozza”

Lo strumento migliore per capire come si distribuiscono i dati su un db, anche se nel nostro caso si tratta di un semplice foglio di calcolo sono le tabelle pivot.

In questo caso ho inserito in un foglio excel tutte le Violazioni ai Regolamenti Comunali registrati nel portale Ope Data del Comune.

Davanti alle 17mila e oltre righe di informazioni, la prima cosa è creare una tabella pivot che consenta di verificare alcuni trend.

Quando ai arriva alla creazione della tabella è importante tenere conto di

  • Righe
  • Colonne
  • Filtri
  • Valori (ricordandosi la differenza tra COUNT e SUM, cioè tra il conteggio del numero dei fenomeni registrati e/o la somma dei valori
%d blogger hanno fatto clic su Mi Piace per questo: