Sporcarsi le mani

Page 1

Sporcarsi le mani Ovvero, perchĂŠ devo passare ore ad impazzire sui dati prima di poterli visualizzare

Michele Mauri DensityDesign Research Lab



Dati

Visualizzazione


Pochi dati o dati semplici


Country

CO2e emissions in megatonnes

Brazil

2854

Canada

810

China

7225

Germany

1005

India

1875

Indonesia

2038

Japan

1390

Russian Federation

2012

United Kingdom

684

United States of America

6933



molti dati o dati complessi


(schermata excel twitter)


Dati

conteggi, filtri, aggregazione

Esplorazione conteggi, filtri, aggregazione, conversione, ‌

Visualizzazione


1987: La visualizzazione dell’informazione diventa scienza



Edward Tufte


Visualizzare dati significa orire una prospettiva privilegiata su un fenomeno



quali sono i passaggi per creare una visualizzazione?


Misurazione Cosa misuro? Con quali strumenti? Con quale precisione?

Analisi Quali dati considero utili? Quali scarto considerandoli errori? Quali aggrego considerandoli parti dello stesso elemento?

Visualizzazione Quali relazioni metto in evidenza? Quali sono le variabili principali? Quali sono i vincoli fisici, di supporto, che devo rispettare?



There are three kind of lies. 1. Lies 2. Damn lies 3. Statistics








1.  I dati non sono oggettivi, ma possono essere utilizzati per sostenere la propria posizione 2.  Lo stesso può essere fatto con la visualizzazione 3.  La scelta della visualizzazione dipende da ciò che si vuole raccontare


Cosa possiamo fare: -convertire (rimappare) - aggregare -espandere -unire -classificare -ordinare


Non sempre i dati sono nella forma pi첫 adatta alla visualizzazione




“Ciò che è immediatamente presente alla conoscenza, prima di ogni forma di elaborazione” ∼Vocabolario Treccani


“Il dato, come concetto astratto, può essere visto come il livello minimo di astrazione da cui derivano informazione e conoscenza.â€? en.wikipedia.org, 2/7/12


15


hello


[255,255,0]




La scala degli “elementi minimi� varia a seconda del fenomeno osservato


Continuo (peso: 73,857‌)

quantitativo Discreto (numero iscritti: 6)

dato Nominale (provincia)

qualitativo Ordinale (buono, mediocre, pessimo)


Il dato ha valore se messo in relazione


confronto = informazione


Monte Everest 8848 m


Monte Everest Monte Bianco 8848 m > 4810 m


Le relazioni vengono codificate con le strutture dato


Dati strutturati vs. dati non strutturati


Dati strutturati Monte

Stato

Altezza

Prima salita

Monte Bianco

Italia

4810

1786

Everest

Cina

8848

1953


Dati strutturati: collezione di dati, tra loro coerenti, codificati in una struttura che ne esplicita le relazioni


Dati non strutturati

“La montagna più alta della Cina è l'Everest, con 8848 metri di altezza. La prima ascensione è stata compiuta nel 1858 da Edmund Hillary. In Italia è il Monte Bianco, alto 4810 metri, salito per la prima volta nel 1786.”


Dati non strutturati: Forme espressive (testi, immagini) che possono contenere dati, la cui struttura è mutevole e non coerente.


Esempio 1. Visualizzare dati strutturati




11. Visualizzare dati non strutturati




111. Strutturare dati non strutturati (e poi visualizzarli)




Strutture dati: le tabelle


Monte

Stato

Altezza

Prima salita

Monte Bianco

Italia

4810

1786

Everest

Cina

8848

1953


Monte

Stato

Altezza

Prima salita

Monte Bianco

Italia

4810

1786

Everest

Cina

8848

1953


Monte

Stato

Altezza

Prima salita

Monte Bianco

Italia

4810

1786

Everest

Cina

8848

1953


Tipi di tabelle: matrici



lombardia

piemonte

Italia dei valori

4162

913

Partito Democratico

45231

7177

Per il Terzo Polo (ApI-FLI)

7667

2702

Popolo della LibertĂ

55975

8668


Tipi di tabelle: dataset (liste)


Partito

Regione

Politici (comuni)

Italia dei valori

lombardia

4162

Partito Democratico

lombardia

45231

Per il Terzo Polo (ApI-FLI)

lombardia

7667

Popolo della LibertĂ

lombardia

55975

Italia dei valori

piemonte

913

Partito Democratico

piemonte

7177

Per il Terzo Polo (ApI-FLI)

piemonte

2702

Popolo della LibertĂ

piemonte

8668


Formati dati per tabelle


Plain Text

.CSV (carachter separated values) .TSV (tabulation separated values) .DAT (generic data) Spreadsheet .XLS (Excel) .XLSX (Office Open XML) .numbers (Apple Numbers) .ODF (OpenOffice Spreadsheet)


Dove trovare dati in formato tabulare





Altre strutture dati


XML Extensible Markup Language



<tag>contenuto</tag>


JSON JavaScript Object Notation



Oggetti {}


ProprietĂ nomeProprietĂ : valore


Liste [ elemento1, elemento2, …]


Ottenere dati XML/JSON: le API Application programming interface





Dati non strutturati: il web







Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.