Sporcarsi le mani Ovvero, perchĂŠ devo passare ore ad impazzire sui dati prima di poterli visualizzare
Michele Mauri DensityDesign Research Lab
Dati
Visualizzazione
Pochi dati o dati semplici
Country
CO2e emissions in megatonnes
Brazil
2854
Canada
810
China
7225
Germany
1005
India
1875
Indonesia
2038
Japan
1390
Russian Federation
2012
United Kingdom
684
United States of America
6933
molti dati o dati complessi
(schermata excel twitter)
Dati
conteggi, filtri, aggregazione
Esplorazione conteggi, filtri, aggregazione, conversione, ‌
Visualizzazione
1987: La visualizzazione dell’informazione diventa scienza
Edward Tufte
Visualizzare dati significa orire una prospettiva privilegiata su un fenomeno
quali sono i passaggi per creare una visualizzazione?
Misurazione Cosa misuro? Con quali strumenti? Con quale precisione?
Analisi Quali dati considero utili? Quali scarto considerandoli errori? Quali aggrego considerandoli parti dello stesso elemento?
Visualizzazione Quali relazioni metto in evidenza? Quali sono le variabili principali? Quali sono i vincoli fisici, di supporto, che devo rispettare?
There are three kind of lies. 1. Lies 2. Damn lies 3. Statistics
1. I dati non sono oggettivi, ma possono essere utilizzati per sostenere la propria posizione 2. Lo stesso può essere fatto con la visualizzazione 3. La scelta della visualizzazione dipende da ciò che si vuole raccontare
Cosa possiamo fare: -convertire (rimappare) - aggregare -espandere -unire -classificare -ordinare
Non sempre i dati sono nella forma pi첫 adatta alla visualizzazione
“Ciò che è immediatamente presente alla conoscenza, prima di ogni forma di elaborazione” ∼Vocabolario Treccani
“Il dato, come concetto astratto, può essere visto come il livello minimo di astrazione da cui derivano informazione e conoscenza.â€? en.wikipedia.org, 2/7/12
15
hello
[255,255,0]
La scala degli “elementi minimi� varia a seconda del fenomeno osservato
Continuo (peso: 73,857‌)
quantitativo Discreto (numero iscritti: 6)
dato Nominale (provincia)
qualitativo Ordinale (buono, mediocre, pessimo)
Il dato ha valore se messo in relazione
confronto = informazione
Monte Everest 8848 m
Monte Everest Monte Bianco 8848 m > 4810 m
Le relazioni vengono codificate con le strutture dato
Dati strutturati vs. dati non strutturati
Dati strutturati Monte
Stato
Altezza
Prima salita
Monte Bianco
Italia
4810
1786
Everest
Cina
8848
1953
Dati strutturati: collezione di dati, tra loro coerenti, codificati in una struttura che ne esplicita le relazioni
Dati non strutturati
“La montagna più alta della Cina è l'Everest, con 8848 metri di altezza. La prima ascensione è stata compiuta nel 1858 da Edmund Hillary. In Italia è il Monte Bianco, alto 4810 metri, salito per la prima volta nel 1786.”
Dati non strutturati: Forme espressive (testi, immagini) che possono contenere dati, la cui struttura è mutevole e non coerente.
Esempio 1. Visualizzare dati strutturati
11. Visualizzare dati non strutturati
111. Strutturare dati non strutturati (e poi visualizzarli)
Strutture dati: le tabelle
Monte
Stato
Altezza
Prima salita
Monte Bianco
Italia
4810
1786
Everest
Cina
8848
1953
Monte
Stato
Altezza
Prima salita
Monte Bianco
Italia
4810
1786
Everest
Cina
8848
1953
Monte
Stato
Altezza
Prima salita
Monte Bianco
Italia
4810
1786
Everest
Cina
8848
1953
Tipi di tabelle: matrici
lombardia
piemonte
Italia dei valori
4162
913
Partito Democratico
45231
7177
Per il Terzo Polo (ApI-FLI)
7667
2702
Popolo della LibertĂ
55975
8668
Tipi di tabelle: dataset (liste)
Partito
Regione
Politici (comuni)
Italia dei valori
lombardia
4162
Partito Democratico
lombardia
45231
Per il Terzo Polo (ApI-FLI)
lombardia
7667
Popolo della LibertĂ
lombardia
55975
Italia dei valori
piemonte
913
Partito Democratico
piemonte
7177
Per il Terzo Polo (ApI-FLI)
piemonte
2702
Popolo della LibertĂ
piemonte
8668
Formati dati per tabelle
Plain Text
.CSV (carachter separated values) .TSV (tabulation separated values) .DAT (generic data) Spreadsheet .XLS (Excel) .XLSX (Office Open XML) .numbers (Apple Numbers) .ODF (OpenOffice Spreadsheet)
Dove trovare dati in formato tabulare
Altre strutture dati
XML Extensible Markup Language
<tag>contenuto</tag>
JSON JavaScript Object Notation
Oggetti {}
ProprietĂ nomeProprietĂ : valore
Liste [ elemento1, elemento2, …]
Ottenere dati XML/JSON: le API Application programming interface
Dati non strutturati: il web