Quadra esplorazione visiva di database e biblioteche digitali
Ornella Giau 273074 Relatore - Katerina Dolejsova Correlatore - Natale Lionello UniversitĂ Iuav di Venezia FacoltĂ di Design e Arti Corso di Laurea Magistrale in Design (Comunicazioni Visive e Multimediali) II Sessione di Laurea. Settembre 2013
Tesi di laurea Corso di laurea specialistica o magistrale in
Design - Comunicazioni visive e multimediali Titolo tesi di laurea
Quadra: esplorazione visiva databaseeeconfronare biblioteche digitali Circlemeal. Un’applicazione per di visualizzare i valori nutrizionali
Cognome e nome
Petrilli OrnellaRita Giau
Matricola n.
271974 273074
Anno accademico
2012/2013 2012/2013
Relatore
Katerina Dolejsova Katerina Dolejsova
Firma
Correlatore
Natale Lionello Natale Lionello
Firma
Sessione di laurea
II IIISettembre Aprile 20132013
Quadra esplorazione visiva di database e biblioteche digitali
Ornella Giau 273074 Relatore - Katerina Dolejsova Correlatore - Natale Lionello UniversitĂ Iuav di Venezia FacoltĂ di Design e Arti Corso di Laurea Magistrale in Design (Comunicazioni Visive e Multimediali) II Sessione di Laurea. Settembre 2013
RINGRAZIAMENTI Grazie a Katerina Dolejsova, Natale Lionello, Gillian Crampton Smith, Phillip Tabor, Kris Krois, Klaus Gasteier, Paola Chiara Barsotti, Bruno Manunza, Miriam Era, Clelia Mongiu, Sara Bronzini, Federica Carta, Camilla Colorito, Marco Nardi, Fabrizio Farrugio, Francesca Sai, Laura Bignotti, Michele Salven, David Brandau, Julia Sommer, Ekaterina Karabasheva, Thomas Kueber, Martin Riga, Luca Migliore, Tania Boa, Giulia Bozzetto, Rita Petrilli, Tommaso Bertagnin, Stella Morelli, Andrea Micco, Valeria Sanguin, Alessia Longo, Matteo Marcato, Ruggero Castagnola, Martina Maitan, mamma, babbo, amici e colleghi
INDICE
Abstract
11
INTRODUZIONE
17
1 ANALISI E RICERCA 1.1 La ricerca esplorativa: considerazioni teoriche e risultati sperimentali
23
1.1.1 Atto di ricerca, atto intelligente 1.1.2 La ricerca e il suo contesto 1.1.3 Progettare per l’esplorazione 1.1.4 Ricerche esplorative oggi: nuovi standard del web - SCHEDA 1A
1.2 Metodi di visualizzazione applicati alla ricerca
34
1.2.1 Considerazioni generali e panoramica di approcci - SCHEDA 1B 1.2.2 Classificare la conoscenza: excursus storico 1.2.3 Strumenti per l’esplorazione di database - SCHEDA 1C 1.2.4 Considerazioni finali
1.3 Contesto di riferimento 1.3.1 Biblioteche digitali, sistemi di archiviazione ed accesso remoto alla conoscenza 1.3.2 Situazione italiana: intervista in una biblioteca universitaria 1.3.3 User Research - SCHEDA 1D
75
2 SVILUPPO DEL PROGETTO 2.1 Base progettuale
93
2.1.1 Target e intenti - SCHEDA 1D 2.1.2 Scelta del supporto, dati e risorse disponibili 2.1.3 L’idea: riferimenti bibliografici come metodo esplorativo
2.2 Definizione del concept: ipotesi ed esperimenti
107
2.2.1 Presentare i contenuti 2.2.2 Favorire l’esplorazione 2.2.3 Ricerca mirata 2.2.4 Viste multiple: tra informazioni di contesto e di dettaglio 2.2.5 Trattamento del testo
3 QUADRA 3.1 Un’applicazione per la ricerca accademica
135
3.2 Funzionalità e design
140
3.2.1 Layout e navigazione 3.2.2 Esplorare 3.2.3 Analizzare: testo originale 3.2.4 Analizzare: comparazione di più documenti 3.2.5 Ricerca, salvataggio e profilo
CONCLUSIONI
183
APPENDICE A.1 Interviste
189
A.1.1 Intervista a Kris Krois e Klaus Gasteier A.1.2 Intervista alla dott. Paola Chiara Barsotti
A.2 Prototipo e user test
203
A.2.1 FinalitĂ del prototipo A.2.2 Problematiche e stadi di sviluppo A.2.3 User Test - SCHEDA APPENDICE
Fonti
217
ABSTRACT
Il progetto Quadra e questa tesi s’inseriscono all’interno del dibattito sulla ricerca e le sue potenziali applicazioni. Il tema della ricerca esplorativa diventa sempre più attuale, e trova, tra i suoi sostenitori, aziende del calibro di Google, Amazon e Facebook. Il trend comune è quello di allontanarsi sempre più dal classico paradigma “parola chiave - lista di risultati” ed esplorare nuovi modi per presentare le informazioni. Uno degli ambiti in cui le operazioni di ricerca sono al centro del processo interattivo è la ricerca accademica. Quotidianamente, in università e laboratori scientifici, vengono cercati materiali e documenti per produrre contenuti originali. In particolare, con l’avvento dell’era digitale, una quantità sempre crescente di contenuti è resa accessibile online. Operazioni di ricerca, che prima venivano condotte manualmente, ora godono del supporto di strumenti e piattaforme digitali. Nate attorno agli anni novanta in America come singoli esperimenti di enti accademici e scientifici, le biblioteche digitali stanno diventando uno standard sia come strumento divulgativo, che come punto di riferimento per la ricerca universitaria. Gradualmente, anche l’Europa si sta adeguando in questo senso, con diversi atenei che integrano i propri sistemi bibliotecari con collezioni di testi digitali, archivi di materiali didattici e soprattutto output di dottorati e sperimentazioni. Questi servizi sono, nel complesso, ottimi per quel che riguarda i materiali disponibili, ma mancano di attenzione e cura per l’aspetto strutturale, grafico e interattivo. L’obiettivo del progetto è, in primo luogo, capire come coinvolgere maggiormente l’utente e quali tecniche utilizzare nella rappresentazione dei dati. Si cercherà di capire se e come sia possibile rappresentare in maniera grafica dei network bibliografici, che tipi di connessioni possono essere visualizzate e quale possa essere la maniera migliore per rappresentarli utilizzando gli strumenti della data visualization.
11
In secondo luogo, si svilupperà, sulla base di queste considerazioni, un’interfaccia digitale che permetta l’esplorazione e la ricerca all’interno di database di pubblicazioni scientifiche. Il target di riferimento sono studenti e ricercatori universitari che si confrontano giornalmente con pubblicazioni di carattere accademico e trarrebbero immediato vantaggio dall’utilizzo di questo genere di tool come supporto al proprio lavoro.
...
The project Quadra and this master thesis set themselves into the modern discussion about explorative serach and its potential applications. The topic of search becomes more and more present and finds among its supporters agencies with big names like Google, Amazon and Facebook. The common trend is to drift away from the standard “keyword-list of results” paradigm and to explore new ways of presenting informations. One of the fields where search activities are central interaction elements is academic search. Daily, in universities and scientific labs, material and documents are searched through to produce new content. Expecially with the growing importance of the digital world, a large amount of data is made available online. Search activities, usually performed by hand, are now supported by digital tools and platforms. Born around the ‘90s in the USA as isolated academical and scientific experiments, digital librarires are becoming a general standard both as educational tools and as reference point for researchers. Europe is gradually stepping forward in this process, with different institutions inserting in their libraries collections of digital documents, educational materials and, most importantly, the outputs of their academic research works. These services are generally succesful when speaking of the data they make available, but lack attention and care on the interactive, visual and user experience side.
12
ABSTRACT
The goal of this project is, in the first place, to understand how is possible to engage users and which techniques ca be used in representing data. It will try to understand if and how graphical means can be used in visualizing bibliographical networks, what kind of connections can be represented and which is the best way. Secondly, standing on these considerations, a digital interface for scientific papers database exploration will be developed. Target users are students and researchers that deal everyday with academic papers. They can be positevely influenced by such a tool as a support for their daily work task.
13
INTRODUZIONE
INTRODUZIONE
L’ispirazione per questa tesi è arrivata durante un pomeriggio estivo di studio. Leggendo un saggio mi è capitato di notare come le pubblicazioni scientifiche si citino l’un l’altra, stabilendo una conversazione invisibile, una rete di collegamenti che consolida la tematica trattata. Così, nel corso della lettura, mi sono ritrovata a pensare che sarebbe utile poter visualizzare graficamente questi collegamenti; aiuterebbe a capire meglio come sono strutturati certi argomenti, chi sono gli autori più importanti, e quali concetti hanno avuto maggior successo negli anni. Questo pensiero mi ha spinto ad indagare la tematica della rappresentazione visiva applicata alla bibliografia, portandomi a contatto con un mondo che mi aveva sempre interessato, ma non avevo scopert a fondo: la ricerca esplorativa. “Search is not a solved problem. […] As the choice of first resort, for many users and tasks, search is a defining element of the user experience.”1 La discussione su come fornire risultati interessanti a seguito di una query è una delle più vivaci al momento nel mondo del web. Quella che di solito viene identificata come attività di ricerca (la classica lista di risultati ordinati per rilevanza) è in realtà solo la punta dell’iceberg di un insieme complesso di processi cognitivi e comportamentali. Considerata la crescita esponenziale dei dati disponibili e la facilità di accesso alle tecnologie, il design di un’esperienza esplorativa richiede un’attenzione immediata e scrupolosa per supportare la costruzione di modelli mentali corretti di ciò che cerchiamo (Morville e Callender, p. 30).
1
“La ricerca non è un problema risolto. […] Come la scelta di una risorsa, per molti utenti e operazioni la ricerca è decisamente un elemento chiave della user experience” (TdA) Morville e Callender (2010, p.1)
Nel capitolo 1, ho tracciato i confini della tematica e preso in considerazione la possibilità di combinare attività di ricerca e visualizzazione grafica. Presto mi è parso chiaro quanti studi fossero già stati realizzati in quest’ambito: quello che
17
in un primo momento sembrava un campo inesplorato in termini di design grafico e di user experience, abbonda invece di piccoli e grandi progetti, con esperimenti sponsorizzati anche da aziende leader nel settore. La scoperta di questa realtà mi ha spinto a osservare quello che era stato fatto con molta attenzione, cercando una nicchia inesplorata dove sviluppare il mio progetto. Molti progetti realizzati nell’ambito della mappatura della conoscenza, lavorano con dati di tipo semantico e linguistico. Dal punto di vista di un ricercatore universitario però, anche i collegamenti bibliografici sono importantissimi per analizzare una tematica. I grandi portali di articoli scientifici e saggi mancano di uno strumento che permetta di esplorare il database a disposizione attraverso questi elementi, fornendo all’utente la possibilità di comprendere in maniera più profonda il tema trattato e la sua bibliografia. Così, fedelmente alle riflessioni di quel pomeriggio estivo, ho deciso di portare avanti io stessa un progetto che utilizzasse come informazione di base le bibliografie, e offrisse un’esperienza diversa dalla classica lista di risultati; in cui i dati fossero visualizzati graficamente e potessero essere elaborati direttamente. Le tappe principali del percorso progettuale sono ripercorse nel capitolo 2, mentre nel capitolo 3 presenterò Quadra, il prodotto finale dell’elaborato.
18
20
CAPITOLO 1
RICERCA E ANALISI
1.1
1.1 La ricerca esplorativa: considerazioni teoriche e risultati sperimentali 1.1.1 Atto di ricerca, atto intelligente Per introdurre il tema della ricerca esplorativa è necessario, prima di tutto, capire cosa s’intende con il termine “ricerca di informazioni”. Ryen White e Resa Roth nel loro saggio Exploratory Search: Beyond the Query-Response Paradigm, ne parlano come di una “fundamental human activity […] that provides many of the «raw materials» for planned behavior, decision making, and the production of new information products.”1 Essi caratterizzano l’atto del cercare come intelligente, che porta l’individuo a interagire con l’ambiente e a comprenderlo. Gli elementi che danno inizio a una ricerca sono definiti dagli stessi autori come: “Searches are often motivated by an incompleteness or a «problematic situation» […] that develops into a desire for information. When a search begins, the searcher’s state of knowledge is in an «anomalous state», and he has a gap between what he knows and wants to know.”2 Sono quindi principalmente due le condizioni necessarie perché si senta il bisogno di cercare un’informazione: trovarsi di fronte a una situazione problematica e una discontinuità tra ciò che già sappiamo e ciò che vorremmo sapere per risolverla. Questa combinazione di cause porta a desiderare più informazioni e ad adoperarsi per trovarle.
1
“una delle principali attività umane […] alla base di alcuni «comportamenti base» dell’uomo come l’azione pianificata, la capacità decisionale e la creazione di nuovi contenuti originali” (TdA) White e Roth (2009, p.3)
2
“L’inizio di una ricerca è spesso motivato da una situazione problematica nella mente di colui che cerca [...] Egli si trova in uno stato anomalo poiché esiste una lacuna tra quello che conosce e quello che vorrebbe conoscere” (TdA) White e Roth (2009, p.11)
Le tecniche che possono essere usate per raggiungere questo scopo sono tra le più diverse e molto dipende dal contesto e dalle task che si stanno svolgendo. Uno dei modi più immediati è, ad esempio, chiedere consiglio a terzi. Nell’ambito informatico vengono solitamente usati motori di ricerca che, a seguito di una certa combinazione di parole chiave, restituiscono una lista di risultati. Oppure, è possibile impostare
23
Really Simple Syndication, formato di distribuzione web caratterizzato da una struttura molto semplice e a campi definiti che permette l’aggiornamento automatico ogni volta che sono disponibili nuovi contenuti. [http://it.wikipedia.org/ wiki/RSS] 6 maggio 2013
una serie di filtri e preferenze per fare sì che siano le informazioni a raggiungere l’utente, tipicamente tramite feed RSS.3 Queste tecniche di ricerca ed altre come il pearl growing4, vengono spiegate nel libro Search Patterns di Peter Morville e Jeffery Callender dove il tema è analizzato in termini pratici, con consigli su come migliorare l’esperienza esplorativa. Prima di scendere nel dettaglio però (si veda 1.1.3) è il caso di fare una panoramica, seppur sommaria, degli studi sui i meccanismi dell’attività di ricerca.
4
Pearl growing: analizzare i risultati di una ricerca per individuare parole chiave da riutilizzare in una nuova query. Morville e Callender (2010, p.57)
Diversi sono gli psicologi e gli esperti di user experience che si sono occupati, negli ultimi decenni, di analizzare i processi cognitivi e comportamentali caratteristici delle operazioni di ricerca. Morville e Callender definiscono, come obiettivo finale del cercare, la findability, ovvero l’effettivo successo nel trovare l’informazione cercata.5 In realtà questo è solo uno degli aspetti della ricerca esplorativa, con cui abbiamo iniziato la trattazione.
5
Morville e Callender (2010, p.6)
3
24
1.1.2 La ricerca e il suo contesto
Il professor Gary Marchionini, direttore del Interaction Design Laboratory presso la School of Information and Library Science della University of North Carolina, ha riunito i diversi tipi di approccio alla ricerca in tre macro categorie, in relazione allo scopo finale (vedi FIG 1). Il primo gruppo di azioni è quello dedicato alle operazioni tipicamente di consultazione. A questo gruppo appartengono comportamenti volti alla ricerca di un’informazione precisa, veicolata da uno specifico contenuto. Valutare l’efficacia di un comportamento di tipo consultativo è dimostrabile quantitativamente osservando in quali casi l’informazione cercata è stata effettivamente trovata e in quali no. Ottimi esempi di strumenti per ricerche di questo tipo sono i motori di ricerca classici come Google e Amazon, che restituiscono risultati molto specifici a seguito di parole chiave semplici e discrete. Ma non tutto nel campo della ricerca si riduce a reperire o no un singolo contenuto. Sempre nel corso dell’articolo, Marchionini identifica altre due categorie il cui scopo è più complesso.
1.1
FIG 1
Lo schema qui riportato è una rielaborazione grafica di quello presente nell’articolo Exploratory Search: from finding to understanding di Gary Marchionini (2008, p.2)
25
6
7
26
“[Imparare:] la maggior parte del tempo durante una ricerca educativa è dedicato all’analisi e alla comparazione dei risultati, nonché alla riformulazione dei termini di ricerca per capire i margini dei concetti chiave […] Una ricerca investigativa può essere fatta per facilitare la pianificazione e la previsione, oppure per trasformare dati esistenti in nuova conoscenza.” (TdA) Marchionini (2008, p.3)
“Ognuno di questi contesti funge da lente di ingrandimento per valutare i vantaggi e i contributi di nuove interfacce per la ricerca.” (TdA) Wilson et al. (2010, p.22)
“[Learning:] much of the search time in learning tasks is devoted to examining and comparing results, as well as reformulating queries to discover the boundaries of key concept definitions […] Investigative searching may be done to support planning and forecasting, or to transform existing data into new data or knowledge ”6 Queste due categorie, imparare e investigare, formano la materia prima della ricerca esplorativa. Entrambe hanno a che fare con la comprensione dell’argomento di ricerca e supportano la produzione di contenuti originali. Entrambe sono volte non solo a ricevere l’informazione, ma all’azione propositiva. Per ricerca esplorativa s’intende quindi un’attività ad alti livelli cognitivi, con informazioni che arrivano da diverse sorgenti ed elaborazione dei risultati. Da non dimenticare è la caratteristica temporale del processo di ricerca: infatti, l’esplorazione non è circoscritta nel tempo ma avviene durante più iterazioni. È importante ricordare però, che queste tre macro aree non sono né gerarchiche né antitetiche, ma anzi sono aree tra le quali il ricercatore oscilla, passando dall’una all’altra con la massima fluidità a seconda del contesto di riferimento e del proprio obiettivo. Nel 2010 Max Wilson e colleghi hanno elaborato un modello di ricerca inserito nel panorama più ampio di azioni dell’individuo. Quando si inizia una ricerca, l’individuo non si trova in un ambiente sterile, ma immerso in una serie di situazioni che hanno determinato l’insorgere del bisogno d’informazioni. È possibile analizzare questi contesti a diversi livelli, tenendo presenti di volta in volta parametri di valutazione diversi e considerando che “each of these contexts provides a useful lens for understanding the benefits and contributions of novel user interfaces for search”.7 Il contesto socio culturale è quello più generale. Al suo interno s’inserisce uno specifico compito portato avanti dall’individuo che da origine alla ricerca. Alla fine di questa scala si colloca la consultazione mirata di informazioni precise e discrete (vedi FIG 2).
1.1
1.1.3 Progettare per l’esplorazione Supportare la ricerca esplorativa significa prima di tutto fornire risultati strutturati ed esplicitamente collegati alla query dell’utente. Rendere palesi le relazioni tra i risultati e mostrare contenuti articolati rende più immediata la comprensione e l’utilizzo attivo del risultato, facilitandone l’esplorazione. Si può a questo punto tornare alle osservazioni pratiche esposte in Search Patterns da Morville e Callender, dove si spazia dai concetti generali ai dettagli di interazione più specifici. Ho voluto riassumere in alcuni punti le osservazioni che mi sono sembrate più importanti riguardo le possibilità di miglioramento dei processi di ricerca: • Assecondare la transizione da un’attività di ricerca all’altra. Come spiegato nel 1.1.2, i diversi modi di cercare si intersecano tra loro nel corso dell’azione. È opportuno lasciare all’utente la possibilità di scelta sul tipo di accesso da utilizzare, se più mirato o più esplorativo. È importate che il sistema progettato si adatti automaticamente al bisogno corrente.8
8
Morville e Callender (2010, p. 28)
9
White e Roth (2009, p.42)
• Trovare un compromesso tra la quantità dei risultati e una alta precisione. Nel cercare di rendere possibile sia l’esplorazione che il recupero di informazioni specifiche, è necessario tenere a mente il gruppo di risultati che viene mostrato all’utente. Infatti, se il numero di risultati è alto sarà incoraggiata l’esplorazione, ma la leggibilità e la capacità di elaborazione ne soffrirebbero. Se solo pochi risultati venissero visualizzati, invece, si rischierebbe di privare il ricercatore di una visione d’insieme. • Supporto durante la definizione della ricerca. Un elemento molto spesso lasciato in disparte è la strutturazione della query, tipicamente costituita da una serie di parole chiave. Fornire strumenti che aiutino l’utente nelle fasi iniziali dell’interazione può rivelarsi fondamentale per la buona riuscita della ricerca.9 Spesso, infatti, soprattutto in situazioni esplorative, l’utente è mosso da una necessità non ben definita che deve essere indirizzata tramite filtri e gerarchie ecc.10
10 Morville e Callender (2010, p. 95)
27
28
FIG 2
Rappresentazione schematica dei comportamenti di ricerca cosĂŹ come espresso in From Keyword Search to Exploration: Designing Future Search Interfaces for the Web da Wilson et al.(2010, p.17)
1.1
• Manipolazione diretta dei risultati. Un sistema che intenda supportare l’esplorazione dovrebbe permettere all’utente non solo di analizzare i dati, ma di agire su di essi direttamente, combinandoli per proseguire la propria ricerca.11 • Memoria cronologica. Le ricerche di tipo esplorativo non sono tipicamente circoscritte nel tempo; anzi, spesso hanno un andamento altalenante, caratterizzato da iterazioni multiple. Far entrare all’interno del sistema i dati cronologici sul comportamento dell’utente può essere utile per imparare a proporre risultati migliori.12
11 Morville e Callender (2010, p. 78)
12 White e Roth (2009, p.21)
1.1.4 Ricerche esplorative oggi: nuovi standard del web Sebbene cercare sia un’attività presente nei più disparati ambiti, è con lo sviluppo esponenziale della digitalizzazione e dell’informatica che trova uno dei suoi maggiori campi di applicazione, data l’ampiezza dei contenuti accessibili e la velocità di calcolo. Come espresso nel 1.1.2, i motori di ricerca classici hanno sviluppato una forte competenza nel fornire risultati ottimali a quesiti precisi e discreti. I sofisticati algoritmi di ricerca permettono di analizzare, in breve tempo, un’enorme quantità di dati restituendo una lista di elementi, ordinati per rilevanza. Questo metodo è abbastanza efficace e molto preciso ma non supporta molte delle caratteristiche fondamentali di un sistema esplorativo. Come vedremo nel prossimo paragrafo, molti progetti sperimentali su interfacce esplorative sono stati sviluppati in ambito universitario, artistico o a livello di piccole istituzioni locali; tuttavia la tematica sta acquisendo negli ultimi anni un peso non indifferente anche tra le industrie digitali di alto livello. La stessa Google sperimenta continuamente nuovi approcci alla ricerca, offrendo strumenti innovativi ed interazioni inconsuete. Di seguito analizzerò alcuni dei più recenti esperimenti di ricerca esplorativa portati avanti dai grandi nomi del web. Questa analisi ha lo scopo di fornire un’idea di come il tema dell’esplorazione stia diventando particolarmente attuale nel mondo del digitale e come importanti aziende si stiano muovendo in questa direzione.
29
SCHEDA 1A
GOOGLE KNOWLEDGE GRAPH: il web semantico Recentemente Google ha introdotto, al fianco della classica lista, una visualizzazione dei risultati di ricerca più strutturata, volta a favorire l’esplorazione e la comprensione. 13 Termini del linguaggio web usati per descrivere tipologie di contenuto
Le informazioni vengono aggregate da diverse fonti sfruttando le così dette semantic tag.13 Queste vengono lette ed interpretate dagli algoritmi di ricerca, così che i contenuti da esse descritti possano essere visualizzati con uno stile grafico diverso, risultando più visibili e comprensibili. Google ha sviluppato un sistema che associa informazioni inerenti tra loro, permettendo all’utente di muoversi tra i vari contenuti come all’interno di una rete di connessioni. La mole di dati di cui l’azienda americana deve tenere conto è sicuramente superiore a qualsiasi altro esempio di progetto esplorativo sviluppato fin’oggi. La variabilità dei contenuti e la loro scarsa organizzazione alla fonte rende il processo di classificazione molto laborioso e complesso. È evidente tuttavia l’impegno a strutturare le informazioni di milioni di risultati non più come una lista, ma come risposta ad una domanda.
1.1
SCHEDA 1A
1.1
FACEBOOK GRAPH SEARCH: la ricerca intelligente “... another important kind of search is social searching...”14 Subito dopo Google, in ordine di visite totali15, viene il social network Facebook, che possiede uno dei più grandi database di utenti del mondo. Questi dati vengono utilizzati per migliorare l’esperienza dell’utente, proponendo contenuti personalizzati in base alla sua attività all’interno del sito e alle sue connessioni sociali. Nel gennaio 2013, Facebook ha presentato la versione beta del Graph Search. Il Graph Search è uno strumento che permette di interrogare il database dell’azienda e ricevere indietro una risposta strutturata. Si possono cercare persone, foto, tematiche e tutto ciò che è indicizzato negli archivi del sito. La novità proposta da questo nuovo metodo di ricerca è la possibilità di interrogare il sistema con un linguaggio naturale. Il Graph Search utilizza strumenti di analisi del linguaggio associando i termini della frase a specifiche parole chiave. Il servizio riescie, in questo modo, a trasformare una query di tipo booleano, solitamente abbastanza ostica per utenti non esperti, in una query scritta in linguaggio naturale, rendendo il tutto molto più accessibile. Se quindi Google si concentra sul fornire risposte strutturate, Facebook offre l’occasione di porre al sistema domande semanticamente complesse.
14 “... un altro importante tipo di riceca è la ricerca sociale...” (TdA) Marchionini (2010, p.3)
15 [http://it.wikipedia. org/wiki/Facebook] 6 giugno 2013
1.2 Metodi di visualizzazione applicati alla ricerca
1.2.1 Considerazioni generali e panoramica di approcci Tenendo conto delle considerazioni fatte nel paragrafo precedente, ho riflettuto su come fosse possibile visualizzare in maniera alternativa i risultati di una ricerca e facilitare i processi esplorativi. Per cominciare a rispondere a questa domanda, mi sono soffermata sui principi dell’information design e sulla loro applicazione in contesti di ricerca, analizzando criticamente alcuni progetti esistenti.
16 Tufte (2007, p. 7)
17 Per data mining si intendono tecniche di analisi dei dati testuali per estrarre metadati
34
Per information design s’intende l’utilizzo di rappresentazioni visive nello studio, nell’analisi e nella comprensione di un insieme di dati. Supporti visivi quali mappe, diagrammi e raffigurazioni possono agevolare questi processi e permettono di identificare più facilmente pattern ricorrenti o situazioni anomale molto più velocemente rispetto all’analisi dei dati numerici allo stato originario.16 All’interno delle attività di ricerca precedentemente analizzate, la disciplina dell’information design può essere un importante strumento a supporto dell’esplorazione. Una visualizzazione grafica ha la capacità di evidenziare relazioni semantiche, similarità di contenuto e collegamenti tra i risultati di una ricerca in maniera immediata. L’utente avrebbe la possibilità di scoprire interattivamente nuovi documenti ed ampliare consapevolmente la propria ricerca. Diversi sono gli studi teorici e sperimentali condotti sull’utilizzo di interfacce alternative nel corso di sessioni di ricerca. Particolarmente complesso è valutare l’efficacia di interfacce per la ricerca esplorativa o investigativa, in quanto, per definizione, gli obiettivi non sono in partenza definiti e misurabili. Nel 2008 Daniel Keim e collaboratori pubblicano un modello del processo esplorativo durante l’uso di un’interfaccia grafica (vedi FIG 3). Tale modello evidenzia lo stretto rapporto che la visualizzazione condivide con le tecniche di analisi dei dati, dette data mining.17 Il saggio si sofferma anche
1.2
sull’importanza della reazione dell’utente. Infatti, l’interazione diretta con la visualizzazione funge da feedback per il sistema e nel migliore dei casi influenza non solo lo sviluppo della visualizzazione ma anche il modo in cui vengono trattati i dati, imparando dall’utente che tipo di informazioni sono effettivamente utili. Sono davvero moltissimi i progetti di design che si sono cimentati nell’ambito della visualizzazione di network e domini semantici. Alcuni si concentrano più sull’aspetto grafico, altri sono focalizzati sulla funzionalità e la precisione. Certi si rivolgono a un pubblico eterogeneo mentre altri ancora sono pensati per un target di specialisti del settore. In linea generale, in un insieme di documenti relativi ad una ricerca, si possono distinguere due tipi di relazioni:18
18 Zamir (1998, p. 4)
• Le relazioni che legano i documenti ai termini della ricerca • Le relazioni che essi condividono tra loro Di seguito ho scelto di illustrare le caratteristiche di tre progetti che mi sono sembrati paradigmatici nel modo in cui gestiscono e rappresentano l’informazione. Si tratta di tre modi differenti ma ugualmente efficaci di costruire una visualizzazione dei dati di ricerca e ben concretizzano gli aspetti teorici spiegati nelle pagine precedenti. Nel primo esempio (vedi SCHEDA 1B: SEMAVIS), le tecniche di visualizzazione sono utilizzate per fornire all’utente maggiori informazioni sui documenti trovati, aiutandolo a capire perché proprio questi sono stati scelti e in che modo si relazionano ai termini della ricerca.19 Gli altri due progetti (vedi SCHEDA 1B: AFLOW e SCHEDA 1B: WELL-FORMED EIGENFACTOR) rendono espliciti i collegamenti che connettono i risultati e forniscono all’utente un’efficace visione d’insieme.
19 Le liste di rilevanza
a cui siamo abituati (Google, Amazon, ecc.) evidenziano di solito questo aspetto differenziando tipograficamente la parola cercata all’interno dell’anteprima. Questo metodo sebbene ben collaudato, manca spesso si profondità e lascia l’utente da solo nel trarre le proprie conclusioni.
35
36
FIG 3
Rappresentazione grafica del modello concettuale esposto in Visual Analytics: definition, process and challange da Keim et al. (2008, p.3)
1.2
37
SCHEDA 1B
SEMAVIS 20 [http://athena.igd. fraunhofer.de:8080/ InteractionAnalysis/ SemaVis4/ SemaVis_Framework_ Demonstrator.html] 7 giungo 2013 21 “supportare l’utente nella comprensione della rilevanza dei risultati e offrire una maggiore trasparenza dell’algoritmo di ricerca.” (TdA) Stab et. at (2012, p.2)
Semavis è un’interfaccia sviluppata all’interno del Fraunhofer Institute for Computer Graphics Research.20 Si tratta di un sistema che evidenzia graficamente alcune proprietà dei risultati di una ricerca. Lo scopo del progetto, spiegano Christian Stab e i suoi colleghi, è “[to] support users in assessing the relevance of search results and [to] offer more transparency in the search result generation process”.21 La collocazione spaziale di ogni contenuto rappresenta la sua affinità e/o relazione a specifici termini definiti dall’utente. In questo modo egli può capire a prima vista quali risultati sono contestualmente simili e quali collegamenti aggiuntivi possono essere interessanti per la sua ricerca. Inoltre, una parte dell’interfaccia è dedicata alla presentazione di possibili filtri e categorie per raffinare la ricerca. L’interfaccia condensa in poco spazio alcuni principi importanti dell’esplorazione visti nel 1.1.3, come offrire contemporaneamente una visione d’insieme e la possibilità di entrare più nel dettaglio seguendo suggerimenti mirati del sistema.
+ Accesso multiplo alle informazioni + Diversi strumenti di ricerca _ Complessità d’utilizzo e necessità di un periodo di apprendimento
1.2
SCHEDA 1B
AFLOW 22 [http://aflow.tv/] 3 agosto 2012
23 “In definitiva, l’idea di base è di non utilizzare la classica navigazione a filtri per trovare i tre risultati perfetti, Noi in realtà facciamo proprio il contrario. Riempiamo sempre la matrice completamente, per offrire molta varietà ma la ordiniamo in maniera che abbia senso […] quello che alla fine otteniamo, è comunque una visualizzazione basata su una lista di risultati, come Google”(TdA)
AFlow22 è un progetto per metà italiano, creato da Kris Krois, professore presso l’Università di Bolzano, e da Klaus Gasteier dell’Universitaet der Kunste di Berlino. I due progettisti, che hanno accettato di essere intervistati (vedi A.1.1), definiscono il loro progetto come un semantic magnifier per l’esplorazione dei contenuti web. Questi sono organizzati all’interno di una matrice di rettangoli e lungo direttrici tematiche, con un minimo utilizzo di funzioni aggiuntive. L’interazione e l’interfaccia rendono AFlow un motore di ricerca altamente esplorativo, in cui le possibilità di filtraggio diretto sono ridotte al minimo ed è privilegiata la navigazione istintiva. A differenza di Semavis, l’idea principale è un sistema di ricerca semplice, che permetta all’utente di esplorare una grande quantità di contenuti, senza l’ausilio di troppi filtri e classificazioni. Durante il nostro incontro, il professor Krois ha spiegato: “Conceptionally, the one basic idea is that, we don’t do the usual faceted browsing to end down to the three perfect results. We do kind of the contrary. We always fill the mash to offer a lot of variety but we order it loosely into direction […] what we ended up with is still a list based visualization like Google”23
1.2
Il punto forte ed innovativo di Aflow è sicuramente la semplicità d’utilizzo, con una curva di apprendimento pari a zero, mentre altri progetti, sebbene efficienti, sono spesso molto complessi e difficili da comprendere:
“I think that as far as i know the research in interfaces for search which use a kind of visualization […are not] really successful except in some niche of expert search. Most of them make you think too much, they require that you know what you are looking for, that you have knowledge in the field you are operating.”24
+ Semplicità e immediate + Classificazione innovativa _ Rischio di perdersi tra i contenuti
24 “Credo che per quello che so, le sperimentazioni d’interfacce per la ricerca che utilizzino una qualche rappresentazione grafica […non siano] molto utili a parte qualche caso isolato focalizzato su utenti esperti. La maggior parte di queste interfacce richiedono che si pensi troppo, che si sappia già cosa si vuole cercare e che si abbia una conoscenza profonda dell’ambito in cui ci si trova” (TdA)
SCHEDA 1B
WELL-FORMED EIGENFACTOR 25 [http://www.wellformed.eigenfactor. org/] 3 maggio 2013 26 Information designer tedesco, autore di molti progetti di infografica e visualizzazione di dati. [http:// moritz.stefaner.eu/] 24 maggio 2013 27 Progetto universitario della Washington University che si propone di analizzare e archiviare citazioni e riferimenti tra periodici scientifici così da poter stilare una classifica di prestigio e comprendere i pattern citazionali http://eigenfactor. org/ 24 maggio 2013 28 Per un approfondimento sul tema delle visualizzazioni multiple si rimanda al 2.1.1
Well-Formed Eigenfactor25 è una visualizzazione realizzata da Moritz Stefaner26 con i dati forniti dalla Eigenfactor Project.27 Ho scelto questo progetto perché, oltre all’attinenza diretta con il tema della tesi, propone un panoramica di possibili visualizzazioni di ampi network d’informazioni. Well-Formed Eigenfactor è costituito, in totale, da quattro visualizzazioni indipendenti, ognuna dedicata a uno specifico aspetto dei dati a disposizione. L’andamento temporale delle citazioni tra i periodici è mostrato tramite una timeline, mentre una visione d’insieme dei riferimenti bibliografici è visualizzata con una struttura ad albero e da un diagramma circolare. La collocazione spaziale, infine, viene utilizzata per creare una sorta di mappa geografica in cui, a seconda del valore assoluto delle citazioni e la relativa connessione ad altri periodici, ogni rivista è posizionata in un punto preciso. Il progetto, anche se non permette di andare nel dettaglio e di conoscere la qualità delle citazioni, fornisce all’utente un mezzo semplice ed interattivo per esplorare un archivio molto vasto in modi differenti. Ogni visualizzazione ha un suo scopo preciso, rappresentando in modo semplice e conciso un certo aspetto dei dati. L’utente è lasciato libero di destreggiarsi autonomamente tra di essi e scoprire nuove relazioni tra gli elementi.28
+ Declinazioni multiple degli stessi contenuti + Semplicità d’utilizzo delle singole viste e interazioni minime ma efficaci.
1.2
1.2.2 Classificare la conoscenza: excursus storico Esempi di visualizzazioni grafiche utilizzate per capire e mostrare il sapere scientifico si possano trovare già in epoche piuttosto antiche. L’uso di simboli astratti e non figurativi per rappresentare dei dati quantitativi è, al contrario, abbastanza tardo, contemporaneo circa alla rivoluzione industriale, tra ‘700 e ‘800. Recentemente poi lo sviluppo della disciplina ha subito una forte accelerazione in seguito all’avvento delle tecnologie digitali. Una breve digressione storica sull’utilizzo dei metodi di rappresentazioni grafica aiuterà non solo a definire meglio l’ambito dell’information design, ma anche a capire in che modo e perché certi tipi di rappresentazione si sono sviluppati e hanno avuto successo fino ad oggi. In questa sede, non ci si propone di trattare in maniera esaustiva la storia delle rappresentazioni della scienza, ma di darne una visione temporale d’insieme.
29 L ima (2011, p.28-41)
Da sempre infatti, l’uomo ha cercato di organizzare il sapere scientifico e/o religioso all’interno di classificazioni rigide, rappresentandole con i mezzi grafici più diversi. Per questo motivo, l’information design non è da considerare un’invenzione del nostro secolo ma ha radici e manifestazioni molto più antiche. Le rappresentazioni delle genealogie monarchiche oppure bibliche sono i primi esempi di grafica applicata alla classificazione. Nel libro Visual Complexity, di Manuel Lima, sono riportare una serie di visualizzazioni addirittura precedenti il 130029, come quelle di Gioacchino da Fiore (vedi FIG 4). Queste visualizzazioni così antiche sono accumunate dalla presenza di metafore naturali, quali l’albero, che molto bene rappresenta la concezione gerarchica del mondo. La metafora naturale rimase fortemente radicata nei secoli a venire, e divenne lo standard per la rappresentazione di classificazioni della conoscenza anche molto complesse. Verso il 1600 cominciano a comparire esempi di rappresentazioni gerarchiche meno figurative e più astratte, a partire dalla classificazione delle discipline realizzata da Christophe de Savigny, per arrivare, durante l’Illuminismo, al Systeme
44
FIG 4
Nel Liber Figurarum, Gioacchino da Fiore rappresentò, nel II secolo d.C., all’interno della metafora dell’albero, tutti i personaggi del Nuovo Testamento, e i loro collegamenti al Vecchio Testamento, con al centro la figura di Cristo
46
FIG 5
Christophe de Savigny, Tableaux accomplis de tous les arts libéraux, 1587
FIG 6
Diderot e d’Alembert, Système figuré des Connaissances humaines, 1751
1.2
Figure des Connaissances Humaines pubblicato da Denis Diderot and Jean le Rond d’Alembert, nella loro Encyclopédie (vedi FIG 5 e 6). Oltre alla classificazione dei saperi, anche in campo naturalistico si svilupparono delle rappresentazioni più astratte. Moltissimi botanici, antropologi e biologi si sono cimentati nella creazione di diagrammi più o meno complessi che spiegassero le affinità e le parentele tra i vari esseri viventi. Theodore Pietsch in Trees of Life: A Visual History of Evolution spiega come anche in questo caso si sia arrivati, avvicinandosi pian piano all’era darwiniana, a schemi astratti molto distanti visivamente dal classico diagramma ad albero. Particolarmente esplicativi sono i diagrammi realizzati da Ernst Haeckel, biologo tedesco dell’800, che nel corso della sua attività è passato da rappresentazioni assai figurative ad altre assolutamente schematiche30 (vedi FIG 7 e 8).
30 Pietsch (2012, p.108 – 131)
Lo sviluppo delle scienze contemporanee porterà alla necessità di rappresentare diagrammi sempre più complessi, in cui il punto di riferimento non sono più le gerarchie ma le connessioni trasversali tra gli elementi, come accade ad esempio nelle rappresentazioni neurali in cui non esiste una gerarchia dei nodi ma le connessioni attraversano tutto il network. Questo stesso tipo di rappresentazioni lo ritroviamo oggi utilizzato negli ambiti più diversi per descrivere moltissimi tipi di fenomeni, dall’informatica alla sociologia alla fisica (vedi FIG 9 e 10). Nel corso di tutto il XX secolo sono stati compiuti diversi studi sulle modalità di rappresentazione grafica dei dati coinvolgendo più discipline: dalla statistica alla psicologia, dalla semiotica alla comunicazione visiva. In particolare, nel 1967, il cartografo francese Jaques Bertin pubblica uno dei testi teorici che resteranno alla base dell’information design: Semiologie Graphique: Les diagrammes - Les réseaux - Les cartes. Il libro esplora e codifica gli aspetti visivi e simbolici della rappresentazione con una speciale attenzione alle proprietà percettive di certi elementi grafici (forme, colori, texture), classificandoli in base al loro utilizzo (vedi FIG 11).
47
48
FIG 7
Ernst Haeckel, albero genealogico monofiletico degli organismi, da Generelle Morphologie der Organismen 1866
1.2
FIG 8
Ernst Haeckel, albero genealogico delle sei più importanti classi dei viventi, da Natürliche Schöpfungsgeschichte, 1870. Come si nota questo diagramma è molto più astratto del precedente e veicola informazioni sia quantitative che temporali.
49
50
FIG 9
Jacob Levy Moreno, Who shall survive?
FIG 10 Arpanet Logic Map, 1977
1.2
FIG 11
Famosi sono i diagrammi presenti in Semiologie Graphique. Questo qui riportato classifica le proprietà visive in base ai concetti che possono esprimere. Bertin (1967, p. 96)
51
1.2.3 Strumenti per l’esplorazione di database I testi di Jaques Bertin, insieme a quelli di Edward Tufte, sono un punto di riferimento per la produzione di rappresetazioni visive efficaci. Dai primi anni ’90, in cui cominciano ad apparire le prime rappresentazioni realizzate automaticamente, le tecniche di visualizzazione si sono sviluppate in molte direzioni. Con l’avvicinarsi dell’anno 2000, diversi enti accademici, professionali e statali, hanno cominciato a sperimentare nell’ambito dell’information design e della user experience applicati alla ricerca scientifica. I lavori che sono stati portati avanti esplorano strade progettuali e metafore d’interazione molto diverse fra loro, andando a formare di conseguenza un’ampia panoramica di approcci al problema. Nel corso della ricerca per questa tesi ho raccolto progetti di varia natura e vari periodi storici, analizzandone gli aspetti positivi e quelli negativi. Di seguito ho selezionato alcuni dei progetti analizzati, classificandoli in base al tipo d’interfaccia proposta. Questa panoramica ha lo scopo di fornire, prima di immergersi nel lavoro progettuale, una buona comprensione di come altri designer e ricercatori hanno approcciato l’argomento della ricerca visuale.
52
1.2
MATRICI
I primi esperimenti di analisi e rappresentazione di dati si collocano attorno agli anni ’90 e si occupano più che altro della visualizzazione di archivi di documenti. Si tratta di progetti realizzati nello stesso periodo in cui venivano sperimentate le prime interfacce utente e le interazioni uomo-macchina; sono quindi da considerare come prodotti di un epoca ben precisa.31 Questi progetti, seppur arrivino a soluzioni differenti, partono dai medesimi interrogativi:
31 Per una panoramica esaustiva sulla nascita e lo sviluppo delle interfacce digitali si rimanda al testo Designing Interactions di Bill Moggridge (2007)
• Com’è possibile mettere l’utente in condizione di esplorare, analizzare ed utilizzare un vasto numero di documenti testuali evitando confusione e disorientamento? • In che modo è possibile rappresentare relazioni di somiglianza, contestualità e inerenza a dei parametri scelti? Un tipo di soluzione tipicamente adottata è la rappresentazione spaziale. Certe caratteristiche vengono mappate su due o tre dimensioni così che ogni documento vada ad occupare una precisa posizione sul piano, utilizzando algoritmi dai più semplici ai più complessi.32 La disposizione complessiva permette di identificare pattern, relazioni e peculiarità. Due dei primi esempi sono il progetto Envision, iniziato dal Virginia Tech Department of Computer Science nel 1996, e Dotfire della Baltimore Learning Community, nel 1999.
32 Una trattazione dettagliata degli algoritmi di visualizzazione spaziale è condotta da Johan Himberg nella sua tesi di dottorato From insights to innovations: data mining, visualization, and user interfaces discussa presso la facoltà di scienze informatiche di Helsinki. Himberg (2004, p. 23-50)
SCHEDA 1C
33 Shneiderman et al. (1999)
Entrambi si proponevano come strumenti per l’esplorazione di database di pubblicazioni digitali e, in entrambi i progetti, i documenti sono organizzati su una griglia bidimensionale. È l’utente a scegliere, di volta in volta, cosa visualizzare su ogni asse. Egli, in relazione alla specifica task portata avanti in quel momento (vedi 1.1.2) ha la possibilità di esplorare il database riducendo o ampliando la profondità della ricerca. Essendo entrambe delle griglie a posizione fissa, i documenti con caratteristiche uguali andrebbero normalmente a sovrapporsi. Envision risolve questo problema utilizzando dei simboli per gruppi di due o più documenti presenti nella stessa cella (vedi FIG 12), mentre Dotfire li rappresenta come cluster (vedi FIG 13). Nell’articolo che documenta Dotfire33 vengono individuati in chiusura alcuni principi per un’efficace navigazione dei documenti: • Assicurarsi che l’utente non perda l’orientamento nel sistema • Permettere la selezione diretta degli elementi così che la visualizzazione si riorganizzi per mostrarli nel dettaglio • Considerare la leggibilità degli elementi sugli assi cartesiani e all’interno del grafico Un altro esperimento risalente a prima dell’anno 2000, è Infocrystal, che propone un approccio diverso e più astratto alla visualizzazione del rapporto tra risultati e query.
FIG 12
Interfaccia di Envision
FIG 13
Interfaccia di Dotfire
1.2
SCHEDA 1C
FIG 14
Principio costruttivo di Infocrystal
FIG 15
Unione di pi첫 ricerche
1.2
Questo progetto, realizzato in ambito accademico presso il Massachusetts Institute of Technology, è presentato come “a visualization tool as well as a visual query language to help users search for information.”34 Infatti, gli strumenti di Infocrystal possono essere usati non solo per visualizzare un database di documenti, ma anche per compiere direttamente operazioni di tipo booleano come restringere o ampliare il campo di ricerca. L’interfaccia si basa sulla teoria degli insiemi35 ed utilizza dei simboli per rappresentare legami di unione, intersezione e differenza tra gli elementi del database e i termini della query (vedi FIG 14). Il risultato finale permette di esplorare sistemi di documenti anche molto complessi mantenendo una sintassi abbastanza chiara e definita. Il sistema è di tipo costruttivo ossia è possibile mettere in relazione diverse ricerche creando nel tempo un network di materiali correlati tra loro (vedi FIG 15).
+ Semplicità e flessibilità degli strumenti di ricerca + Dotfire: rappresentazione immediata della quantità e qualità dei documenti + Infocrystal: processo di ricerca costruttivo _ Eccessiva astrazione simbolica e necessità di un periodo di apprendimento
34 “sia come strumento di visualizzazione che come linguaggio di ricerca visivo che aiuta l’utente a interrogare il database” (TdA) Spoerri (1993, p.1)
35 Il Dizionario Rizcoli dei Termini Matematici definisce l’insiemistica come una branca della logica matematica, che studia le proprietà e le caratteristiche di collezioni di elementi. Teorizzata nella seconda parte del XIX secolo dal matematico Georg Cantor, sta alla base di molta dell’informatica moderna. Dizionario dei termini matematici (1987, p.216)
SCHEDA 1C
MAPPE
Direttamente collegate alla visualizzazione spaziale su piano cartesiano, sono le rappresentazioni cartografiche. Quello che esse si propongono è combinare i principi della cartografia con le odierne possibilità di analisi del testo ed elaborazione dei dati. I vantaggi di tali mappe sono sicuramente la visione d’insieme e la semplicità del codice visivo, nella maggior parte dei casi già familiare poiché mutuato dal mondo della geografia. In ambito digitale, le cartografie sono di solito utilizzate per mappare spazi astratti, tipicamente mappe della scienza o mappe concettuali. Il tema della cartografia della conoscenza è stato studiato da diversi ricercatori. Nella sua tesi del 2005, Moritz Stefaner conduce un’analisi dettagliata sia delle tecniche di data mining che di rappresentazione, e porta avanti di persona un progetto di mappatura di un database (vedi FIG 16). A proposito delle mappe della conoscenza, Stefaner scrive: 36 “[Nelle mappe della conoscenza] gli elementi base sono nodi e collegamenti, […] la configurazione spaziale non è arbitraria; al contrario, la vicinanza relativa sulla mappa presuppone spesso una vicinanza semantica tra gli elementi” (TdA) Stefaner (2005, p. 8)
“[In knowledge maps] the basic elements are nodes and relations, […] the spatial configuration is not arbitrary; rather, spatial proximity on the map is often supposed to reflect semantic proximity of the associated items.”36 Un esempio quasi tautologico è la Map of Science creata nel 2006 da Bradford Paley per la rivista Nature (vedi FIG 17). Analogamente al progetto Well-Formed Eigenfactor (vedi SCHEDA 1B: EIGENFACTOR), anche la Map of Science rappresenta sul piano contenuti scientifici in base al numero di
FIG 16
Intrefaccia di ASADO
FIG 17
Map of science. Di preciso, la visualizzazione rappresenta circa 770 paradigmi della scienza, estrapolati da più di 800.000 riviste specializzate. [http:// wbpaley.com/brad/index.html] 23 maggio 2013
FIG 18
Interfaccia di Studyscape
FIG 19
Diversi contenuti visualizzati con l’interfaccia Atlas
1.2
SCHEDA 1C
volte in cui articoli diversi sono stati citati assieme da un terzo autore. I collegamenti evidenziano autori comuni a diversi paradigmi e funzionano come delle forze di trazione, avvicinando i paradigmi con più condivisioni. Un progetto universitario di visualizzazione spaziale d’informazioni è StudyScape, realizzata da Patrick Vuarnoz come tesi di laurea presso la Hochschule der Künste di Zurigo. Il progetto si propone di rappresentare in maniera interattiva le informazioni riguardanti i vari piani di studio presenti nella Hochschule. A differenza di Map of Science e ASADO, StudyScape gestisce contenuti di diverso genere, non solamente testuali. Il prototipo realizzato come elaborato finale permette di esplorare i percorsi didattici, ma anche di vedere i progetti, le persone coinvolte e gli argomenti trattati (vedi FIG 18). Su questo filone troviamo anche il progetto italiano Atlas, di Marco Quaggiotto, ricercatore del politecnico di Milano. Anche in questo caso, la caratteristica è che i dati non sono di un unico tipo, ma vengono rappresentate, fianco a fianco, informazioni riguardo persone, argomenti, risorse testuali e visive (vedi FIG 19). Atlas si propone come tool digitale per l’esplorazione di database di conoscenze. Integra funzioni di ricerca, diverse viste e possibilità di ampliare il campo di ricerca interagendo con la visualizzazione. Tutte funzionalità pienamente inserite nel campo della ricerca esplorativa (vedi 1.1.3).
1.2
+ Alto livello esplorativo + Relazioni tra contenuti di diverso genere + Comprensione intuitiva comune alla maggior parte degli utenti _ Criteri che generano la visualizzazione sono solitamente impliciti e possono causare fraintendimenti
_
Comuni problemi di occlusione e leggibilitĂ
SCHEDA 1C
MAPPE
Articolare la visualizzazione in più viste è una tecnica molto utile quando si tratta d’interfacce per la ricerca. Queste permettono all’utente di interagire con i dati in diversi modi. Il progetto GeoVIBE mette a confronto due tipi di visualizzazioni spaziali, una che rappresentata la distribuzione dei documenti in relazione ai termini presenti nella query, mentre nell’altra gli stessi documenti sono messi in relazione al territorio americano (vedi FIG 20). Interagire con una delle due viste comporta automaticamente un cambiamento in entrambe le visualizzazioni.
37 [http://max-planckresearch-networks. net/] 14 giugno 2013
Un esempio recente è la Max Plank Research Network, una rappresentazione grafica di come i centri di ricerca Max Plank comunichino tra di loro, condividano documenti e siano collegati con enti esterni (vedi FIG 21). Il progetto, realizzato da Moritz Stefaner and Christopher Warnow, utilizza un mix di tecniche e interazioni per offrire all’utente una visione più completa, difficilmente esprimibile in un unico diagramma. Una mappa astratta visualizza lo “scambio di idee” tra i vari istituti, una vista geografica mostra la posizione effettiva delle sedi, e del testo offre maggiori informazioni sull’elemento selezionato.37 Il ricercatore Johnatan Roberts spiega, in un suo articolo, l’utilità di un approccio multimodale alla visualizzazione:
FIG 20 Interfaccia di GeoVIBE FIG 21
Interfaccia del Max Plank Research Network. Il software è esposto presso la Max Planck Science Gallery a Berlino
1.2
SCHEDA 1C
“Direct manipulation techniques allow the user to filter or select elements from the visualization itself. The technique of brushing is the principle approach, where elements are selected (and highlighted) in one display, concurrently the same information in any other linked display is also highlighted.”38 39 J. C. Roberts (2004, p. 8)
38 “Tecniche di manipolazione diretta permettono all’utente di filtrare e selezionare elementi della visualizzazione. Uno dei principali approcci e la tecnica del brushing, in cui gli elementi vengono selezionati (ed evidenziati) nella vista principale, e contemporaneamente la stessa informazione si riflette in tutte le altre viste.” (TdA) Roberts (2004, p.5)
Alcuni elementi da tenere in considerazione quando si utilizzano diverse viste sono:39 • Diversità & complementarietà. E’ necessario che le due viste servano a scopi diversi • Scomposizione. Diverse viste aiutano a dividere la complessità della visualizzazione in parti più piccole e gestibili • Sequenzialità vs parallelismo. Nel progetto di un’interfaccia è importante considerare quali informazioni ha senso visualizzare assieme e quali invece dovrebbero essere viste in sequenza • Auto evidenza e focus. Sfruttare elementi percettivi che rendano ovvie le relazioni e aiutino l’utente a focalizzarsi sui giusti elementi • Design uniforme
+ Possibilità di suddividere la complessità dei dati in piccole parti gestibili _ Possibile frammentarietà dell’interfaccia
1.2
TIMELINE
Oltre alla visualizzazione spaziale, un approccio comune nelle interfacce per l’esplorazione di documenti, sono le linee del tempo, in cui i contenuti sono ordinati in base a un dato temporale che li contraddistingue (tipicamente la pubblicazione). Il vantaggio delle timeline è sicuramente la loro estrema semplicità e il basso sforzo cognitivo necessario per comprenderne il funzionamento. Allo stesso tempo esse offrono una serie di possibilità molto interessanti dal punto di vista interattivo. Science Archive40 è una visualizzazione interattiva, creata dallo studio Pitch Interactive con i dati d’archivio della rivista Science (digitalizzati in collaborazione con Google). I numeri della rivista sono rappresentati come singoli elementi grafici posti in sequenza cronologica. Tramite una casella di testo è possibile cercare dei termini specifici all’interno di ognuno di essi. La grafica, composta da elementi geometrici, evidenzia di volta in volta la frequenza del termine all’interno di ogni numero della rivista, restituendo un grafico della popolarità dell’argomento nel corso degli anni (vedi FIG 22). Questo progetto, nella sua essenzialità, rappresenta bene le potenzialità della timeline come strumento di visualizzazione: pochi elementi creano un’infografica utile, semplice da usare e innovativa. Il secondo progetto incluso in questa breve panoramica, è Citeology41, un progetto recentissimo, sviluppato da Justin Matejka, Georg Fitzmaurice e Tovi Grossmann. Citeology utilizza un metodo di esplorazione diverso dagli esempi precedenti: le citazioni bibliografiche. Esistono diversi modi di classificare le citazioni. Gli indici standardizzati come li conosciamo oggi (gli stessi che sono
40 [http://www.popsci. com/content/ wordfrequency#war] 23 maggio 2013
41 [http://www. autodeskresearch.com/ projects/citeology] 4 maggio 2013
SCHEDA 1C
42 “dedicò anni della sua vita al sogno di realizzare un indice multidisciplinare di citazioni”(TdA) White e McCain (1998, p.327) 43 Oltre alla classica citazione diretta, ci sono altri modi per estrarre dal testo materiale citazionale. Anche la co-occorrenza di termini specifici, o la co-citazione di terzi sono informazioni utili per determinare l’affinità tra due saggi. K. Börner et al. (2003, p. 4) 44 Börner et al. (2003, p. 30-46)
45 Börner et al. (2003, p.5) 46 [http://dl.acm.org/] 4 giugno 2013
stati usati per progetti come l’Eigenfactor) hanno origine non prima del 1950, ad opera di Eugene Garfield che “devoted years to fulfilling his dream of creating a multidisciplinary citation index”.42 Nel saggio Visualizing Knowledge Domains di Börner et al., vengono illustrati fondamentalmente due modi per utilizzare le citazioni nelle visualizzazioni:43 • Visualizzazioni di dominio. Le citazioni sono utilizzate, per creare una mappa concettuale di un certo argomento ed i suoi collegamenti con altri ambiti.44 Questo tipo di visualizzazione è molto adatta ad utenti nuovi poiché permette di farsi velocemente un’idea dei punti chiave di un argomento. •Mappe longitudinali. La citazione è usata per mostrare l’andamento nel tempo della tematica, mettendo in evidenza quali punti hanno subito aggiornamenti e in che modo.45 Questo può essere un importante strumento per utenti esperti che desiderano tenere sotto controllo gli ambiti di loro interesse. Questi due metodi non si devono pensare come esclusivi, ma possono coesistere nella stessa visualizzazione. Tornando a Citeology, il progetto utilizza una selezione di circa 3.000 articoli accademici pubblicati su ACM Library46 dal 1982 al 2010. Gli articoli sono raggruppati per anno di pubblicazione e ordinati per numero di citazioni totali, sia effettuate che ricevute. L’utente può interattivamente esplorare questo database scoprendo quali articoli sono stati citati maggiormente e in che periodo. La visualizzazione consiste
1.2
FIG 22
Interfaccia di Science Archive. Ogni quadrato rappresenta un singolo documento, il colore piÚ o meno opaco di ognuno di essi rappresenta la frequenza del termine ricercato.
SCHEDA 1C
1.2
in una singola linea blu che unisce gli articoli citati e una rossa che unisce quelli che citano il selezionato. Come spesso accade nei progetti d’information visualization, l’esplorazione porta a scoprire nuovi aspetti, come l’articolo che più di tutti è stato citato negli anni e quello che cita documenti più indietro nel tempo. (vedi FIG 23 e FIG 24).
+ Metafora di utilizzo e rappresentazione chiara + L’elemento temporale può essere abbinato ad altri parametri, creando visualizzazioni sempre diverse _ Con quantità di dati molto grandi è meglio verificare leggibilità e comprensibilità
FIG 23
Interfaccia di Citeology
FIG 24 Interfaccia di Citeology. Alcuni esempi di configurazioni particolari: a sinistra l’articolo che più è stato citato negli anni; a destra quello che cita documenti più indietro nel tempo
SCHEDA 1C
VISUALIZZARE IL TESTO
47 Un esempio è il programma open source Processing, sviluppato in America da Ben Fry, che è diventato oramai un punto di riferimento per la creazione di infografiche interattive e prototipi. [http://www. processing.org/]
Per finire questa panoramica di approcci, presenterò alcuni lavori che si concentrano sulla visualizzazione del testo. In ambiti in cui i contenuti sono per la maggior parte di tipo testuale, le tecniche di rappresentazione grafica possono aiutare l’utente a trovare più velocemente l’informazione all’interno di documenti lunghi. I progetti che si sono cimentati su questo versante sono innumerevoli, soprattutto visto lo sviluppo di strumenti per l’elaborazione digitale di dati alla portata di designer e grafici.47 Gli ambiti di applicazione vanno dalla letteratura, come per la visualizzazione di Poetry on the Road (vedi FIG 25), alla religione (vedi FIG 26) e alla grafica, come ad esempio la rappresentazione grafica dei saggi contenuti in Total Interaction (vedi FIG 27). In particolare, un progetto che ho preso come riferimento è Two Sides of the Same Story, realizzato da Jer Thorp nel 2009. Thorp ha progettato e programmato una piccola interfaccia per confrontare il contenuto di due articoli di cronaca che parlavano dello stesso argomento. Il programma analizza entrambi gli articoli e restituisce una visualizzazione del testo destrutturata, in cui la posizione e la grandezza dei termini dipende dal numero di volte che questi appaiono in uno e nell’altro testo (vedi FIG 28). L’aspetto peculiare di questo progetto è il modo in cui mette in relazione l’infografica con il testo originario. Infatti, l’utente non vede solo la visualizzazione dei termini, ma può interattivamente esplorare come e quando il termine è stato utilizzato, con anteprime del testo originale (vedi FIG 29). In questo modo è possibile andare più a fondo nell’analisi, avvalendosi di riferimenti precisi.
FIG 25
Poatry on the Road, realizzato nel 2006 da Boris Müller. Rappresenta brevi testi poetici con forme geometriche, elaborando la frequenza delle lettere dell’alfabeto. [http://www.esono.com/boris/projects/ poetry06/] 29 maggio 2013
FIG 26 Bible Cross Reference, di Chris Harrison, rappresenta come i personaggi biblici vengano nominati assieme nei versi del testo.[http://chrisharrison.net/index. php/Visualizations/BibleViz] 29 maggio 2013
FIG 27
Visualizzazione di uno dei saggi contenuti in Total Interaction. Diversi elementi grafici rappresentano diversi aspetti del testo, come la lunghezza dei capitoli, la frequenza di certe parole chiave e la relazione con altri saggi.
1.2
SCHEDA 1C
FIG 28 Interfaccia di Two sides of the same story FIG 29 Selezionando un termine, questo viene riportato in relazione al testo originario
1.2
+ Scansione del testo piÚ veloce + Collegamenti impliciti resi palesi _ Total Interaction: rischio di sovrastrutturare la visualizzazione nell’intento di rappresentare piÚ informazioni
1.2.4 Considerazioni finali 48
“Riteniamo che il lavoro sulla rappresentazione della conoscenza possa contribuire […] a migliorare la leggibilità e l’efficacia delle visualizzazioni. Può contribuire inoltre allo sviluppo scientifico in generale, esplorando metodi e approcci per facilitare la scoperta di lavori collegati, ad aumentare la vitalità del mondo della ricerca accademica, identificando ambiti in evoluzione, ecc” (TdA) Börner et al. (2003, p. 50)
49 Termine mutuato dal linguaggio informatico. Lo sviluppo di un servizio digitale si divide in: fornt end, ossia tutto ciò che può essere visto, manipolato e utilizzato dall’utente, e back end, con cui l’utente non entra in contatto e dove sono gestiti i processi logici più profondi, i database e le componenti esterne. [https:// it.wikipedia.org/wiki/ Front-end_e_back-end] 30 maggio 2013
74
In questo paragrafo ho cercato di tracciare i contorni del campo su cui concentrerò i miei sforzi progettuali. Ho elencato alcuni progetti nati da simili intenzioni, e li ho suddivisi in macro categorie in base al metodo di visualizzazione utilizzato. Un’analisi di questo tipo, sebbene non omnicomprensiva, ha lo scopo di fornire spunti progettuali e individuare eventuali lacune che potrebbero essere colmate da un nuovo approccio. Prima di passare alla definizione del contesto progettuale, è utile fare una sintesi conclusiva di quanto espresso finora. Innanzitutto, è bene chiarire ancora una volta perché possa essere utile portare avanti un progetto d’information design nel campo della ricerca esplorativa. Börner e collaboratori si esprimono in questo modo a riguardo: “We believe that research aimed at visualizing knowledge domains can benefit […] to vastly improve the readability and effectiveness of domain visualizations. It can also contribute to the development of science in general by exporting methods and approaches to identify related work by experts in relevant research areas, assess research vitality, identify evolving research fields, etc.”48 Alla luce di quest’affermazione, e della trattazione precedente si può dire che l’uso di mezzi grafici gioca un ruolo importante sia nel campo della ricerca esplorativa più generale, sia in quello specifico della visualizzazione di documenti accademici. I vantaggi sono soprattutto per l’utente finale riguardo all’esperienza e alla funzionalità del servizio, ma anche il back end49 può beneficiare di una struttura più comprensibile, volta a supportare l’esplorazione. La messa in pratica di quanto detto può declinarsi in molti modi diversi. Da un punto di vista cronologico, si può, in linea di massima, affermare che i progetti realizzati prima del 2000 cercavano di essere il più possibile omnicomprensivi,
1.3
mettendo a disposizione dell’utente quante più informazioni e possibilità d’interazione (vedi SCHEDA 1C: MATRICI). Questo, sebbene fornisca all’utente esperto uno strumento di lavoro efficace, risulta spesso di maggiore difficoltà per utenti inesperti, con una curva di apprendimento più lunga. Progetti più recenti cercano, invece, di sviluppare nel dettaglio singoli elementi dell’interazione (vedi SCHEDA 1C: VISTE MULTIPLE e TIMELINE), fornendo solo uno o due metodi per analizzare i dati, rendendo la ricerca più alla portata di utenti neofiti. Per quel che riguarda invece le modalità di rappresentazione già esplorate, molto è stato fatto nel campo delle mappe concettuali (vedi SCHEDA 1C: MAPPE). Punti ancora poco esplorati sono la possibilità di indagare a fondo i contenuti e di utilizzare la visualizzazione come strumento di lavoro per la ricerca scientifica e accademica. Di queste opportunità e del loro contesto di applicazione si parlerà nel prossimo paragrafo.
1.3 Contesto di riferimento 1.3.1 Biblioteche digitali: sistemi di archiviazione ed accesso remoto alla conoscenza L’era del digitale ha coinvolto in profondità la nostra società. Sempre più industrie progettano strumenti per accedere ai propri contenuti tramite internet. Alcuni si limitano a riprodurre sullo schermo servizi disponibili analogicamente, altri sfruttano le potenzialità della piattaforma digitale per offrire nuove esperienze e interazioni. Vantaggi importanti delle tecnologie digitali sono sicuramente la possibilità di trattare in maniera automatica un elevato numero di dati, la velocità e la possibilità di rispondere in maniera personalizzata alle richieste dell’utente.
75
Uno degli ambiti ampiamente influenzati dalla rivoluzione digitale è la gestione di materiali testuali, collezioni di documenti e, nella fattispecie, di archivi bibliotecari. Per biblioteca digitale s’intende un insieme di risorse, sia testuali che multimediali, messe a disposizione degli utenti tramite servizi online. I primi esempi di archivi bibliotecari digitali risalgono agli anni ’80/’90, sull’onda della rivoluzione informatica, come tentativo d’innovazione da parte di grandi enti bibliotecari. Partiti come semplici portali di consultazione remota e riproponendo online schemi classici di utilizzo bibliotecario, nel corso degli anni gli archivi digitali hanno condotto diversi esperimenti per integrare funzionalità alternative, volte a coinvolgere attivamente l’utente. Un testo che mi è stato di riferimento per quel che riguarda la cronologia del fenomeno, è The Digital Library: A Biography, curato da Daniel Greenstein e Suzanne Thorin. Il saggio ripercorre in maniera dettagliata la nascita e lo sviluppo di alcune biblioteche digitali associate ad enti universitari, e ne propone una classificazione, in base “alle età” della biblioteca: la giovinezza, la crescita e la maturità (vedi FIG 30).
50 Greenstein e Thorin (2002, p.8)
51 Greenstein e Thorin (2002, p.10)
76
I primi esempi di biblioteche digitali compaiono negli Stati Uniti all’interno di campus universitari quali la University of Virginia e la University of Michigan50. Diversi sono i motivi che hanno spinto le biblioteche universitarie ad intraprendere la strada del digitale: la riflessione sul proprio ruolo futuro, l’importanza del digitale nell’apprendimento e, non ultimo, il desiderio di acquistare prestigio ed assicurarsi nuove iscrizioni51. In linea generale, sono due gli aspetti che caratterizzano una biblioteca digitale giovane: servizi tradizionali di consultazione riproposti in maniera digitale e, dall’altro lato, il forte sviluppo di funzionalità innovative, le così dette killer-apps, che portano un immediato valore aggiunto ma mancano di un’infrastruttura solida sottostante.
1.3
Il passaggio dalla giovinezza alla maturità consiste in un lento affinamento dei servizi e nella creazione di una struttura portante per l’accesso ai documenti. In questa fase è fondamentale l’attenzione verso i bisogni dell’utente: se precedentemente i servizi venivano progettati per esperti informatici, ora è fondamentale considerare le librerie digitali come servizi ad ampio spettro, capaci di soddisfare un gruppo eterogeneo di utenti, mettendo in evidenza informazioni utili e tralasciando quelle che potrebbero unicamente confondere. Spiegano gli autori di The Digital Library: “[For example,] from a user’s perspective, the fragmentation of digital collections makes little sense. [Libraries should...] allow patrons to search seamlessly across collections, regardless of whether they were available in print or digital form, and, if in digital form, regardless of whether they were managed as texts, digital images, geospatial information systems, or other types of data.”52 A tutt’oggi, grazie alla collaborazione dei sistemi bibliotecari con le università e gli utenti, esistono diversi esempi di servizi dedicati alla ricerca bibliografica e all’esplorazione che permettono di gestire l’elevato numero di risorse in maniera più semplice, tramite anteprime e visualizzazioni d’insieme. Da ricordare sono il progetto DLITE53 della Stanford University, concentrato sulla ricerca collaborativa e condivisa, il National Digital Library Program54 della Library of Congress e vari progetti per l’esplorazione di contenuti digitali sponsorizzati dalla British Library.55 Tuttavia, la maggior parte dei sistemi bibliotecari online, universitari e non, rimangono abbastanza rigidi per quel che riguarda l’esperienza e l’interazione, scoraggiando in questo modo gran parte degli utenti nonostante l’utilità dei servizi offerti. La maggior parte si limita a fornire una lista di risultati poco esplicativi, lasciando all’utente l’obbligo di esaminarli uno per volta senza aiutarlo nella comprensione e nella scelta.
52 “[Ad esempio,] dal punto di vista dell’utente, la frammentazione in più archivi dei contenuti digitali ha poco senso. [Le biblioteche devono…] permettere di effettuare ricerche attraverso tutte le collezioni, senza far distinzione tra documenti stampati o digitali, e se digitali, che si tratti di testi, immagini, informazioni geografiche o altri tipi di dati” (TdA) Greenstein e Thorin (2002, p.22) 53 Digital Library Integrated Task Environment della Stanford University [http://ilpubs.stanford. edu:8090/284/1/199769.pdf ] 24 maggio 2013 54 [http://memory.loc. gov/ammem/dli2/ html/lcndlp.html] 24 maggio 2013
55 [http://www.bl.uk/ onlinegallery/index. html] 25 maggio 2013
77
1.3.2 Situazione italiana: intervista in una biblioteca universitaria Per capire come funziona nel dettaglio l’archiviazione e la classificazione dei materiali bibliotecari, ho svolto, presso la biblioteca universitaria Iuav di Venezia, un’intervista con la responsabile dei servizi all’utenza, la dottoressa Paola Chiara Barsotti (vedi A.1.2). Durante la conversazione si è potuto fare chiarezza sui metodi di classificazione effettivamente utilizzati e sui dati disponibili, e sono emersi anche alcuni punti critici e possibilità di miglioramento. Il sistema bibliotecario Iuav, come tutte le biblioteche pubbliche italiane, si basa su standard internazionali e nazionali redati dalla Biblioteca Nazionale Centrale di Firenze. I dati inseriti nel sistema di archiviazione sono quindi di tipo cooperativo e standard sia dal punto di vista sintattico che semantico (vedi FIG 31). “C’è un linguaggio standard per il titolo e per i dati bibliografici. È un linguaggio/punteggiatura che viene utilizzato in tutto il mondo, quindi anche se un utente non conosce la lingua di pubblicazione, riesce comunque a capire quali sono i campi.”
56 [http://thes.bncf. firenze.sbn.it/] 21 giugno 2013
78
Per quel che riguarda il processo di soggettazione e classificazione tematica, questo viene eseguito, almeno all’interno della biblioteca Iuav, a mano dal personale; ossia tramite una lettura tecnica dell’indice e dell’introduzione del documento, vengono assegnati allo stesso una serie di soggetti che ne descrivono l’argomento. La biblioteca Iuav segue, per quanto possibile, il Nuovo Soggettario56 messo a punto dalla Biblioteca Nazionale Italiana nel 2007, che raggruppa in una struttura ad albero tematiche ed argomenti (vedi FIG 32). La soggettazione così eseguita è uno dei principali strumenti che permette alle biblioteche di compiere ricerche bibliografiche. Riguardo a questo tipo di metadato, mi è sembrato di individuare alcuni punti sia positivi che negativi:
1.3
FIG 30 EtĂ di una biblioteca digitale FIG 31
Dati standard archiviati dal sistema bibliotecario
79
80
1.3
• La soggettazione offre un alto livello di precisione • La precisione è però dovuta a un processo svolto sostanzialmente a mano, un libro alla volta • Il soggettario offre una grande complessità, ma l’accesso ai termini singoli avviene più o meno in maniera casuale in quanto non c’è modo di esplorare in maniera dinamica l’albero gerarchico Altre chiavi di accesso al database bibliotecario sono: copertina e indice del libro (letti automaticamente da OCR57), codice ISBN58 e collocazione. Infine, per quel che riguarda i collegamenti bibliografici, sebbene la biblioteca Iuav non li indicizzi direttamente, esistono database esterni come Scopus59 e Web of Knowledge60. Trattandosi però di database privati, non è ancora possibile utilizzare questo tipo di metadato come filtro di ricerca né tantomeno visualizzare la citazione assieme al suo contenuto. In definitiva, il sistema OPAC della biblioteca Iuav offre una grande quantità di strumenti e chiavi di accesso per la ricerca bibliografica. Nonostante questo però, la maggior parte rimane poco utilizzata: “L’informazione che noi mettiamo a disposizione è già ben organizzata, ed è questa la principale differenza rispetto a quello che si trova su Google, dove l’informazione è slegata. Nonostante tutto però, i nostri utenti utilizzano ben poche delle nostre risorse…” Questa riflessione spontanea mi è sembrata fondamentale in vista del progetto, poiché mette in evidenza non solo la grande quantità di informazione codificata presente nelle biblioteche statali, ma pone l’accento sul fatto che queste risorse non sono efficacemente sfruttate. Un’ipotesi sulla causa di questo, è forse la scarsa attenzione del servizio all’usabilità e alla visibilità delle funzioni, che, sia a detta degli studenti (vedi SCHEDA 1D) che della Barsotti stessa, rende difficile l’uso mirato delle risorse:
FIG 32
Ogni termine è strutturato in questa maniera: • appartiene ad una categoria, • è descritto da una nota d’ambito (cioè una spiegazione) • presenta delle etichette di noto (non utilizzabili per la soggettazione ma usate per specificare l’ambito all’interno della categoria) • è collegato ai termini inferiori, ed infine i termini relativi)
57 Optical character recognition: sistemi di riconoscimento ottico dei caratteri che convertono immagini bitmap in formato testuale. [http://it.wikipedia.org/ wiki/Riconoscimento_ ottico_dei_caratteri] 4 marzo 2013
58 International Standard Book Number: sequenza numerica utilizzata a livello internazionale per indicizzare tutti i libri pubblicati. [http://it.wikipedia. org/wiki/ISBN] 5 marzo 2013 59 [https://www.scopus.com/customer/ authenticate.url?origin=login&zone=login] 7 giugno 2013 60 [http://wokinfo. com/] 7 giugno 2013
81
“Trovo questi sistemi di ricerca abbastanza arretrati rispetto allo scenario contemporaneo del mobile e del touch [...] Il lavoro di analisi del testo che facciamo ha poco senso oramai perché ci porta via tantissimo tempo e non viene apprezzato dall’utente [...] Per me è un limite ad esempio che non si possano eseguire ricerche all’interno di tutto il testo.” Quello che emerge è la volontà anche da parte degli addetti ai lavori di aumentare la mole di lavoro riservata all’automatizzazione e concentrarsi maggiormente sulla user experience in modo che il loro lavoro sia effettivamente apprezzato. “Questo è un periodo, che stiamo vivendo noi come biblioteca e che riguarda tutto il mondo delle biblioteche, di grande trasformazione. Ovviamente subiamo l’impatto del digitale. Gli ebook, come tutti i fenomeni di tipo economico (ed è anche questo un fenomeno di tipo economico e non culturale, cominciato negli Stati Uniti) sta investendo l’Europa per il momento più nel settore della narrativa però mano a mano sta invadendo anche il settore accademico.” Lo sforzo delle istituzioni di avvicinarsi al digitale, sta portando già alcuni miglioramenti tra le interfacce per la ricerca; allo stesso tempo però è necessario capire meglio quale sia il target giusto per questi servizi e cosa sia effettivamente utile per l’utente finale. 1.3.3 User Research Per studiare l’utilizzo di un servizio di ricerca bibliografica, ho coinvolto alcuni possibili utenti in una breve intervista. Lo scopo di questa era capire in che modo essi si rapportassero con i servizi già esistenti, se fossero a conoscenza delle possibilità offerte da molti database
82
1.3
online e che funzioni desiderassero veder implementate. L’intervista è stata condotta su 24 individui tra i 20 e i 35 anni, con professionalità distribuite tra il mondo del design, del marketing e dell’editoria. Per la maggior parte si è trattato di studenti universitari, sebbene alcuni stessero affrontando un dottorato di ricerca o fossero già inseriti nel mondo del lavoro. Ho cercato di coinvolgere persone di diversa nazionalità (italiani, francesi, tedeschi) così da avere un quadro più ampio a livello europeo. Le domande che ho rivolto per iscritto ad ognuno degli intervistati sono: • Quando fai una ricerca su un certo argomento, da dove inizi? Con quali risorse? • Hai mai usato database online tipo ACM o Mendely? • Quando il sistema ti presenta molti risultati, come scegli il documento giusto per i tuoi scopi? • Come tratti le citazioni? Ti sembra utile studiare come un certo autore sia stato citato e da chi? • Sarebbe interessante se, prima di decidere se leggere un documento intero, potessi farti un’idea di quali parti del testo sono rilevanti per la tua ricerca? • Qual è la cosa che ti da più fastidio delle ricerche online? • Quale è secondo te l’elemento più importante che uno strumento di ricerca deve avere per essere veramente utile? • Hai qualche proposta specifica? Nella scheda seguente esporrò una rielaborazione delle risposte che ho ricevuto.
83
SCHEDA 1D
COME INIZIARE UNA RICERCA Domanda 1 e 2
La maggior parte degli studenti intervistati afferma di iniziare una ricerca accademica su Google, raramente sull’OPAC della biblioteca. I dottorandi, i professionisti del settore editoriale, ma anche designer e grafici consultano invece database più specifici, archivi di conferenze, e pubblicazioni online. 61 Database pubblicato dalla Association for Computing Machinery, che indicizza dati su centinaia di migliaia di articoli dal 1950 ad oggi [http://dl.acm. org/] 3 marzo 2013 62 Software per la gestione di pdf e materiali di ricerca che offre accesso diretto a molti database di articoli digitali [http://www.mendeley. com/] 21 marzo 2013
È evidente una fondamentale dicotomia tra ricerche di tipo veramente professionale e ricerche più naïve in cui l’utente non sa bene cosa cercare e si affida per questo agli algoritmi del motore di ricerca. Pochi, studenti e professionisti, affermano di usare database di articoli digitali online come ACM61 o Mendeley.62 Spesso sono le interfacce stesse e la user experience a fare da deterrente.
ORIENTARSI TRA I RISULTATI Domanda 3
Le prime fasi della ricerca volgono a collezionare riferimenti e a farsi un’idea del campo di ricerca. Alcuni intervistati hanno ammesso di andare spesso sul sicuro seguendo raccomandazioni o social networks. Gli utenti inseriti nel campo della ricerca accademica, dottorandi e professori, discriminano i risultati controllando parametri standard tipo autore e anno di pubblicazione, probabilmente poiché, vista l’esperienza nel campo, a loro bastano poche informazioni chiave per capire se un determinato materiale è rilevante oppure no. Strumenti molto utilizzati sono anche gli abstract che però non sempre sono presenti.
1.3
SCHEDA 1D
Altri utenti eseguono una lettura sommaria del documento, aiutandosi con la ricerca di parole chiave nel testo, per capire come e dove viene trattato l’argomento di loro interesse. Quasi tutti gli utenti hanno sottolineato il disagio di trattare quantità troppo elevate di documenti, ammettendo di cambiare termini di ricerca se i primi risultati prodotti non centrano subito il punto.
CITAZIONI E ANALISI DEL TESTO Domanda 4 e 5
Due elementi interessanti emersi nel corso delle interviste sono l’uso delle citazioni come strumenti esplorativi e le indicazioni sulla struttura del testo. Alcuni trovano le citazioni utili per esplorare velocemente un ambito di ricerca. Molti partono da un documento e poi espandono la ricerca ai documenti citati da questo, creando una mappa concettuale. Altri però hanno espresso il timore di allargare troppo la ricerca, nel tentativo di capire che ruolo hanno gli autori citati e in che contesto si collocano. Inoltre, un altro elemento importante è quanto recente sia la citazione o se è stata già superata da altri lavori. L’altro elemento interessante riguarda la possibilità di visualizzare dove sono collocati nel testo i passi rilevanti per la ricerca. Questa funzionalità viene già in un certo senso messa in atto da alcuni utenti che utilizzano lo strumento “CERCA” per trovare parole chiave nel testo. Nel caso di testi lunghi però, cercare per parole singole può consumare più tempo di quanto ne fa risparmiare. Un utente ha contestato una rappresentazione troppo rigida che impedirebbe di trovare collegamenti inaspettati.
1.3
SCHEDA 1D
CRITICITA’ E DESIDERATA Domanda 6, 7 e 8
Tutti gli intervistati si sono trovati d’accordo mostrando disapprovazione verso gli strumenti attualmente disponibili per le ricerche accademiche. Gli elementi trovati più deludenti sono stati: • La poca organizzazione dei materiali e la necessità di avere filtri più dettagliati 63 Sull’argomanto si è espresso anche Eli Pariser durante una sua presentazione al TedTalk del 2011. Pariser mette in discussione la tendenza attuale verso la personalizzazione delle informazioni in base alla propria attività online e ai propri interessi. Questo secondo Pariser impedirebbe di scoprire casualmente nuove cose e si rischia ciò che egli definisce una “gabbia di filtri”. [http:// www.ted.com/talks/ eli_pariser_beware_ online_filter_bubbles. html] 27 maggio 2013
• La comune sensazione di dover procedere alla cieca ossia senza suggerimenti iniziali che agevolino i primi passi della ricerca • Dover spendere una grande quantità di tempo per selezionare poche informazioni utili dentro un mare di informazioni poco rilevanti. Molte sono state anche le proposte di miglioramento, con idee originali e utili. Di seguito riporto quelle più interessanti: • Bilanciare tra personalizzazione e novità63 • Fare riferimento a ricerche fatte da altri sullo stesso argomento • Funzionalità d’archiviazione user friendly che permettano di gestire i documenti in maniera semplice e veloce
1.3
CAPITOLO 2
SVILUPPO DEL PROGETTO
2.1
2.1 Base progettuale
A partire dalle considerazioni teoriche espresse nel capitolo precedente sulle modalità rappresentative e i processi esplorativi, ho cercato di individuare un ambito e degli strumenti ben precisi su cui concentrare il mio lavoro. Gli esempi raccolti nel 1.2.3 e le interviste esposte nel 1.3, hanno contribuito a rafforzare i miei intenti progettuali e ad individuare alcuni contesti non ancora esplorati. Ho quindi deciso di definire il mio progetto come un servizio digitale a supporto della modalità esplorativa all’interno della ricerca scientifica, in cui strumenti di questo genere sono molto utili, ma ancora poco sviluppati dal punto di vista interattivo e grafico. 2.1.1 Target e intenti Andando a progettare un servizio, la prima domanda a cui mi sono sentita in dovere di rispondere è stata chi l’avrebbe utilizzato e in che situazioni ne avrebbe tratto vantaggio. Quando si tratta di attività di ricerca d’archivio, si possono distinguere diversi tipi di utenti coinvolti. Una prima distinzione si trova nell’esperienza e nelle conoscenze possedute: bibliotecari e archivisti utilizzeranno il servizio in maniera diversa rispetto studenti e ricercatori, che si differenziano a loro volta da utenti sporadici che poco o nulla sanno dei criteri standard di ricerca. Trattandosi inoltre di un servizio digitale, un altro aspetto importante è la familiarità con le nuove tecnologie e le piattaforme di accesso all’informazione. Si potrebbe tentare di realizzare un servizio adatto ad ognuna di queste categorie, ma la mancanza di un criterio di priorità porterebbe a in un progetto vago e mal focalizzato.
93
1
94
Termine che definisce il profilo dettagliato di un utente fittizio cui vengono attribuite delle caratteristiche essenziali del gruppo di riferimento. Saffer (2007, p.188)
Ho quindi scelto di indirizzare il mio progetto principalmente verso utenti con una discreta dimestichezza tra le più recenti tecnologie digitali e che hanno a che fare regolarmente con task di ricerca bibliografici. Utenti non professionisti saranno comunque parte del target, ma rimarranno in secondo piano rispetto a coloro che utilizzano il servizio per motivi di studio e lavoro. Ho deciso inoltre di lasciare da parte quella fetta di mercato molto specializzata come bibliotecari e archivisti, poiché necessitano di strumenti molto settoriali per condurre il proprio lavoro, utilizzando dati poco significativi per gli altri utenti. Per chiarire meglio quali potrebbero essere nello specifico i miei utenti, ho utilizzato delle persona1, stabilendo un ordine di priorità tra utenti primari e secondari e definendo le loro esigenze e bisogni.
2.1
ANTONIO 28 anni
Ricercatore universitario di storia medievale – Pisa IL DETERMINATO. E’ molto concentrato sul suo lavoro e s’impegna attivamente in iniziative no profit locali. Le sue ambizioni professionali lo portano ogni giorno a contatto con il mondo accademico e la sua letteratura. Ha una dettagliata conoscenza del suo campo e tiene sul proprio computer una bibliografia dettagliata degli ultimi articoli e saggi pubblicati. A volte però deve uscire dai confini della zona conosciuta per cercare autori e saggi in ambiti diversi. “Ogni giorno cerco e leggo articoli scritti da colleghi in tutto il mondo. Ho bisogno di precisione, ma anche di un sistema che sappia supportarmi nel poco tempo che ho a disposizione.”
SCHEDA 2
LUCIA 22 anni
Studentessa di storia dell’arte – Venezia L’ENTUSIASTA. Nell’ultimo anno molto è cambiato e ogni giorno è una nuova sfida. Come studentessa non è ancora molto esperta nell’uso dei vari strumenti di ricerca accademica. Spesso impiega molto tempo per cercare riferimenti bibliografici e trova i servizi offerti dalla biblioteca poco utilizzabili e ostici. “Vorrei che ci fosse un modo per esplorare il database della biblioteca in maniera più semplice, che fosse un sistema intelligente con suggerimenti relativi alla mia ricerca e non pretendere ogni volta una nuova query”
2.1
ANDY 31 anni
Designer freelance – Stoccolma LO SCOPRITORE. E’ una persona attiva, cerca sempre di sperimentare nuove cose, anche se il lavoro da freelance spesso lo impegna molto. Per lui la ricerca è un’attività che passa più che altro dai motori di ricerca online. Non è un fan della ricerca specialistica poiché trova le interfacce difficili da comprendere e con scarsi vantaggi. Raramente ha bisogno di cercare riferimenti testuali esatti, ma quando gli capita lo fa mal volentieri. “Il mio lavoro ha molto a che fare con l’esplorazione. Si tratta sempre di trovare nuovi spunti per coinvolgere i clienti e avere sempre qualcosa d’interessante da raccontare. Di solito mi affido ai consigli di amici per scovare nuovo materiale professionale.“
SCHEDA 2
MARCO 54 anni
Insegante di matematica - Roma L’APPASSIONATO. S’interessa da dilettante a molti ambiti diversi: la musica, l’arte, la storia ecc… Ama raccontare agli altri le proprie passioni. Sebbene non gli capiti spesso di utilizzare i motori di ricerca per lavoro, lo fa nei momenti liberi, cercando di approfondire argomenti che lo interessano al di fuori della propria professionalità. Non ha per nulla esperienza nell’uso di strumenti specifici, ma compensa con una forte voglia di scoprire. “Il mio lavoro mi permette di dedicare del tempo a coltivare i miei interessi, quindi quando incontro uno strumento nuovo, mi appassiono nel cercare di usarlo. Se mi offre una bella esperienza, posso anche accettare di dover spendere un po’ di tempo per capire come funziona.”
2.1
2.1.2 Scelta del supporto, dati e risorse disponibili Una delle considerazioni collegate alla definizione di target e contesto d’uso è la scelta del supporto per cui sviluppare il servizio. Attualmente, la quasi totalità dei progetti viene sviluppata come applicazione per laptop e desktop, supporti largamente diffusi tra gli utenti interessati e con una risoluzione adatta a fornire una buona quantità di informazioni. Sul piano delle nuovissime tecnologie portatili, invece, ancora poco è stato sviluppato. Alcuni studi di mercato affermano che nel giro di pochi anni, computer e laptop saranno completamente sostituiti dai dispositivi touch.2 Infatti, così come molti servizi si sono spostati dall’analogico al digitale alla fine degli anni ‘90, oggi la fruizione di sempre più contenuti avviene su dispositivi mobili, tablet e telefoni cellulari di ultima generazione. Nonostante questo, la scelta progettuale è ricaduta però, su una webapp. Per webapp s’intende un servizio digitale accessibile da un qualsiasi motore di ricerca tramite un dispositivo collegato alla rete. I dati e le istruzioni per il funzionamento del programma risiedono su un server remoto o su servizi cloud3, sollevando l’utente dalla responsabilità di scaricare e installare il programma. Questo permette di soddisfare una fetta più ampia di mercato. L’utilizzo esclusivo di dispositivi mobili, sebbene si collochi correttamente nel trend attuale del mobile marketing, rischiava di precludere alcuni aspetti importanti dell’interazione, come l’utilizzo combinato di più software durante task di ricerca complessi e la manipolazione diretta dei contenuti testuali. La compatibilità con tablet e touch non è stata comunque messa totalmente da parte. Infatti, il vantaggio di un servizio web rispetto ad applicazioni native è la possibilità di accedervi da qualsiasi dispositivo online e la compatibilità con le varie risuluzioni degli schermi.4 A questo punto, è il caso di definire quali tipi di dati il sistema avrà a disposizione. Conformemente al mio background accademico, il progetto sarà focalizzato sulla user experience e sulla visualizzazione grafica. Non sarà un progetto di data mining né di information architecture, sebbene questi due
2
International Data Corporation (IDC) [http://www.idc.com/ getdoc.jsp?containerId=prUS24129713] 3 giugno 2013
3
Per cloud computing si intende un insieme di tecnologie che permettono di accedere a risorse salvate online indipendentemente da vincoli fisici. Tipicamente i dati non sono salvati su un unico dispositivo, ma si tratta si una rete di computer tra i quali l’informazione è distribuita, così che in caso di guasto o danno fisico ad uno di essi, l’informazione viene comunque preservata. Wikipedia [http:// en.wikipedia.org/wiki/ Cloud_computing] 2 giugno 2013
4
Negli ultimi anni la comunità internazionale di sviluppatori web ha lavorato molto per rendere i contenuti online adattabili dinamicamente al dispositivo su cui vengono fruiti. Questo processo detto design responsivo, è possibile attraverso un mix di tecniche e linguaggi (Html5, css3 e javascript sono le più comuni)
99
aspetti siano importanti come base per costruire l’aspetto visivo e funzionale. La fattibilità del progetto, nonostante non sia uno dei principali fattori di valutazione, ha influenzato le ipotesi di funzionamento con osservazioni reali e credibili. I dati attualmente reperibili sono: • Dati di archiviazione. Le biblioteche digitali possiedono già una quantità ingente di dati strutturati sull’anagrafica della pubblicazione e sul suo soggetto. Ad oggi questi dati sono scarsamente sfruttati dai portali OPAC, complicando la ricerca invece di semplificarla (vedi 1.3.2). 5
[https://it.wikipedia. org/wiki/Elaborazione_ del_linguaggio_naturale] 30 giugno 2013
• Analisi diretta del testo. Nell’era del digitale, è possibile compiere analisi semantiche a partire dal testo stesso tramite tecnologia OCR. Esistono vari programmi open source che permettono di analizzare il contenuto di un testo e di estrarne metadati senza il bisogno di una pre-formattazione.5
6
[http://www.info. sciverse.com/scopus] 21 giugno 2013
• Indice di citazioni. Importanti database come Scopus6 e Science7 effettuano da anni la mappatura delle citazioni. Queste informazioni sono al momento private e accessibili a pagamento.
7
[http://ip-science. thomsonreuters. com/cgi-bin/jrnlst/ jloptions.cgi?PC=K] 21 giugno 2013
• Connessioni sociali. Sebbene lo scopo del progetto non sia quello di creare un social network, non si può prescindere dal tener conto della potenza dei dati comportamentali e sociali degli utenti. Osservando il comportamento dell’utente, il sistema può interpretare meglio le sue esigenze e proporre risultati migliori. Infine, è necessario precisare che, come è ovvio, la mole di dati analizzata influisce sul tipo di visualizzazione sviluppata. L’intento del progetto è di creare uno strumento che possa adattarsi alla scala del database utilizzato. Le funzionalità saranno sviluppate tenendo conto di un database di medie dimensioni, come può essere quello di una piccola biblioteca universitaria. Da un punto di vista ipotetico comunque, l’interfaccia è adattabile a database più grandi in maniera
100
2.1
FIG 1
Diversi contenuti uniti da vincoli di appartenenza
101
102
FIG 2
Link bibliografici uniscono gli elementi in una rete
2.1
proporzionale. Un prototipo (vedi A.2) verrà invece realizzato utilizzando un set di dati più ristretto, così da potersi concentrare direttamente sugli aspetti interattivi e grafici invece che sulla gestione e l’acquisizione di moli di dati troppo estese. 2.1.3 L’idea: riferimenti bibliografici come metodo esplorativo Tenendo presente il target, il tipo di supporto e gli esempi di strumenti già esistenti, ho connotato il progetto come un incrocio tra strumento professionale e di piacere, adatto sia all’utilizzo in situazioni lavorative, dove sono fondamentali precisione e efficienza, che a ricerche condotte per interesse personale, per il puro piacere dell’esplorazione. Per coniugare questi due aspetti è stato necessario semplificare al massimo elementi e processi interattivi, costruendo delle basi solide su cui progettare esperienze innovative. I contenuti base che compongono il servizio sono di tre tipi: autori, documenti e tematiche. Questi dati sono sempre presenti e collegati tra loro da relazioni di appartenenza (vedi FIG 1): un documento sarà sempre associato ad un autore e farà sempre parte di una categoria tematica. Esistono altri tipi di relazione che connettono i contenuti e permettono l’esplorazione: riferimenti semantici, statistici, sociali, ecc. (vedi 1.2.3). Sebbene ognuno di questi permetta di esplorare un aspetto specifico del database, un eccesso di possibilità contribuisce soltanto a disorientare l’utente. Per il mio progetto, ho scelto come mezzo esplorativo i collegamenti bibliografici (vedi FIG 2). Osservando visualizzazioni come la Eigenfactor (vedi SCHEDA 1B: WELL FORMED EIGENFACTOR) ci si rende conto dell’enorme quantità di riferimenti trasversali presenti nel solo ambito delle pubblicazioni scientifiche. Visualizzazioni come questa sono ottime per avere un’immagine d’insieme, ma non sono un vero e proprio tool esplorativo. Le citazioni presenti nei saggi accademici, infatti, sono usate di tanto in tanto per determinare la popolarità di una tematica o di un autore, ma sono
103
104
FIG 3
Diagramma del concept
2.1
105
ancora pochi i progetti che le pongono al centro del loro processo di ricerca. Con il mio progetto vorrei invece utilizzare i passi citati proprio come metodo esplorativo principale, permettendo all’utente di entrare nel dettaglio del contesto della citazione. I vantaggi di questo tipo di approccio sono sia di tipo funzionale (possibilità di interagire direttamente con il materiale e formulare delle query) sia di tipo concettuale, aumentando l’affidabilità percepita dei materiali online. Poiché il servizio si rivolge sia ad utenti professionisti che occasionali, ho ritenuto appropriato suddividere l’esperienza in due momenti. Una prima fase è dedicata all’esplorazione omnicomprensiva in cui è il sistema a offrire informazioni tramite un’interfaccia intuitiva e stimolante. Anche utenti inesperti possono sentirsi coinvolti e aiutati nel scoprire nuove informazioni. La seconda fase, invece, è dedicata all’analisi dettagliata di un singolo contenuto ed è qui richiesto all’utente di essere più attivo e fornire al sistema dati e informazioni per migliorare l’efficacia della ricerca. Questo tipo di interazione è più specifica e soddisfa il bisogno di precisione dei professionisti del settore. Per completare il quadro progettuale, l’aspetto sociale, identificato come importante da diversi utenti durante le interviste (vedi SCHEDA 1D), è stato inserito come elemento conclusivo del progetto. Sebbene il servizio rimanga utilizzabile da tutti gli utenti del web, il profilo personale, ottenuto registrandosi al sito, permette di tenere traccia delle proprie ricerche, utilizzare dati provenienti dai propri contatti e ricevere notifiche personalizzate. Con in mente questo concept (vedi FIG 3), ho cominciato ad esplorare vari modi in cui era possibile rappresentare un database di documenti e che tipi di interazione ne avrebbero agevolato l’esplorazione. A partire dalle interviste condotte tra studenti e professionisti, ho innanzitutto individuato alcuni punti critici da risolvere per migliorare l’esperienza dell’utente:
106
2.2
• Come iniziare a cercare senza dover andare alla cieca? • Che tipi d’interazioni permettono di orientarsi tra i risultati? • Come visualizzare i collegamenti e i contenuti dei documenti? • Quali espedienti grafici possono agevolare la scansione di testi lunghi? Nel prossimo paragrafo affronterò, punto per punto, le ipotesi d’interazione e gli esperimenti che mi hanno portato al progetto finale, Quadra, di cui si tratterà, nella sua veste definitiva, nel capitolo 3.
2.2 Definizione del concept: ipotesi ed esperiementi 2.2.1 Presentare i contenuti Il primo passo verso la definizione del progetto è stato capire come organizzare visivamente i contenuti. Inizialmente, studiando alcuni progetti esistenti (vedi 1.2.3) e tenendo a mente le riflessioni teoriche sulla ricerca esplorativa (vedi 1.1.1), mi sono orientata sull’utilizzo combinato di mappe concettuali e timeline (vedi FIG 4). In questa ipotesi, la visualizzazione principale sarebbe stata la mappa, mentre la timeline sarebbe servita da riferimento cronologico utile per contestualizzare i contenuti (vedi FIG 5). L’interfaccia che ipotizzai per questo tipo di visualizzazione trattava nello stesso modo tutte le tre tipologie di contenuto; documenti, autori e argomenti.
107
108
FIG 4
Primi esperimenti di visualizzazione dei contenuti
FIG 5
Primo esperimento di interfaccia a vista multipla. La parte superiore dello schermo è dedicata alla mappa concettuale dove tematiche ed elementi vengono ordinati in base al numero di elementi che condivivono. La tiemline visualizza gli stessi elementi in ordine cronologico.
FIG 6
Secondo tentativo di presentazione dei contenuti. La timeline diventa protagonista dell’interfaccia e visualizza in ordine cronologico sia i documenti selezionati che i loro collegamenti
FIG 7
Ipotetica schermata iniziale del servizio
109
Essendo i contenuti di varia natura, mappa e timeline utilizzavano icone e simboli per distinguere i diversi elementi e il risultato era un insieme eterogeneo d’informazioni. L’eterogeneità, sebbene possa favorire l’esplorazione, ha evidenziato, in fase di revisione, una serie di problemi strutturali: • Leggibilità dei contenuti: simboli, didascalie e icone sono ben distinguibili quando si tratta di poche decine di elementi ma se si applica la visualizzazione a un database più esteso si perde subito chiarezza. • Parametri di visualizzazione bidimensionale: nella mappa i contenuti si dispongono in base alla loro affinità semantica e ai collegamenti bibliografici condivisi. Questi parametri non sempre permettono di identificare una collocazione univoca del singolo contenuto. • Coinvolgimento dell’utente: nel tentativo di mitigare le prime due problematiche, i contenuti diventavano visibili solo in seguito a esplicita richiesta tramite il box di ricerca. Utenti insicuri riguardo al tema erano in questo modo svantaggiati.
8
Un’analisi dei vantaggi delle visualizzazione temporali è proposta in SCHEDA 1C:TIMELINE
110
Riscontrate queste problematiche, ho deciso di lasciare da parte la mappa concettuale, troppo incerta e complicata, e ho continuato a lavorare unicamente sulla timeline (vedi FIG 6), che nella sua semplicità permetteva di concentrarsi su un’interazione più semplice e chiara.8 Rimaneva però irrisolto il problema di cosa mostrare all’utente al primo accesso (vedi FIG 7). Le proposte fatte finora soffrivano dello stesso errore progettuale che cercavano di risolvere: erano poco esplorative. Era necessario trovare un modo per presentare i contenuti nel complesso e permettere all’utente di iniziare da qui l’esplorazione. Di tutti i parametri che si sarebbero potuti utilizzare, quello che mi è sembrato più significativo è stata la divisione in categorie tematiche. Come spiegato nel 1.3.2, questo tipo di dato è già presente in quasi tutti gli archivi di biblioteche digitali e soprattutto è uno standard internazionale e quindi coerente anche se applicato a database diversi.
2.2
FIG 8
Organizzazione di tutto il contenuto del database all’interno di una matrice
111
112
FIG 9
Quattro livelli di zoom permettono di passare gradualmente da una vista d’insieme a informazioni dettagliate sul singolo contenuto
2.2
113
9
114
A partire da metà anni ’90, Google fu tra i primi a lavorare alla rappresentazione geografica su supporti digitali. Di recente l’azienda americana ha rilasciato una nuova versione del software Maps, altamente personalizzata e responsiva. Le informazioni visualizzate sulla mappa tengono conto del comportamento dell’utente online, della sua posizione, del supporto da cui ha accesso al sito più altri innumerevoli parametri. Il risultato finale è un servizio in cui non serve quasi più cercare direttamente, ma è l’informazione a raggiungere l’interessato. [http://www.google.com/ help/maps/helloworld/ behind/history.html] 24 giugno 2013
Abbinando timeline e categorizzazione, in una nuova proposta ho disposto i singoli documenti, protagonisti dell’infografica, su una matrice bidimensionale con anno di pubblicazione in ascissa e categoria di appartenenza in ordinata (vedi FIG 8). In questo modo non solo i documenti vengono posizionati secondo in ordine chiaro e preciso, ma già da una prima analisi è possibile estrapolare informazioni utili. Ad esempio è possibile farsi un’idea dello sviluppo di una tematica nel tempo osservando la crescita o la decrescita delle pubblicazioni in quell’ambito. All’utente è offerta una struttura che lo introduce alla ricerca senza richiedere un’azione diretta. 2.2.2 Favorire l’esplorazione L’altra sfida del progetto è stata capire come agevolare l’esplorazione del database. Rappresentare una cospicua quantità di dati sia nel loro insieme che nel dettaglio ha reso necessario progettare un sistema scalabile, in cui l’utente potesse accedere su richiesta a contenuti specifici, mantenendo una visione generale d’insieme. Un modello di riferimento per questo tipo di interfacce sono i servizi di localizzazione geografica (Google Maps, Apple Maps, Ovi), che adattano il livello di dettaglio al livello di ingrandimento della mappa.9 Questa tecnica può essere applicata con successo anche ad altri ambiti. Dopo alcune prove, ho definito quattro livelli di dettaglio che si susseguono man mano che l’utente restringe l’arco temporale visualizzato. I documenti sono visualizzati come singole unità rettangolari posizionate una affianco all’altra su una griglia. Al primo livello d’ingrandimento, le unità sono troppo piccole per essere percepite singolarmente e creano così un’area uniforme. Più è stretto l’arco di tempo visualizzato, più dettagli vengono visualizzati per singoli documenti (vedi FIG 9). Per facilitare ulteriormente il processo di scoperta, ho aggiun‑ to un altro strumento che utilizza lo zoom graduale. Sovrapposta alla visualizzazione principale, l’utente ha a disposizione un’area circolare che anticipa il livello di
FIG 10 Diagramma di funzionamento dello strumento lente
116
FIG 11
Visualizzazione delle citazioni bibliografiche sulla griglia di contenuti
2.2
FIG 12
Livello di dettaglio progressivo
117
ingrandimento successivo e che può essere spostata, ingrandita o ridotta per visualizzare altri contenuti (vedi FIG 10). Questa sorta di lente di ingrandimento presenta dei vantaggi in termini di user experience, ad esempio la possibilità di verificare se una certa area è effettivamente rilevante prima di cambiare definitivamente visualizzazione, ma allo stesso tempo pone delle problematiche di utilizzo: • Come gestire il comportamento della lente. Essendo un elemento che va a sovrapporsi alla visualizzazione principale, è stato necessario pensare con cura che tipo di interazioni potessero essere utilizzate per controllarne il movimento senza interferire con altre funzioni.
10 Diversi sono i servizi e gli enti che si sono occupati di catalogare i vari tipi di interazioni gestuali. Una delle specifiche più complete è quella offerta da Google Android come supporto agli sviluppatori esterni [http://developer. android.com/design/ patterns/gestures. html] 3 giugno 2013
118
• Compatibilità desktop e touchscreen. È stata questa la prima volta durante il progetto che mi sono confrontata con la diversità di interazione tra mouse e gesti. Se infatti per i mouse valgono concetti come il roll over, il click e il doppio tasto, in situazioni touch si interagisce in maniera completamente diversa: indicando, trascinando e deformando. Ho sviluppato un numero ristretto di possibili interazioni specifiche per l’una e per l’altra piattaforma. Su dispositivi come desktop computer e laptop, la lente si centra sempre sulle coordinate del mouse quando questo si trova sopra la visualizzazione principale. Utilizzando la rotella di scroll si può ingrandire o ridurre l’area della lente. L’utente esplora la visualizzazione in maniera discreta, senza aver ancora cliccato nulla. Su dispositivi mobili touch invece, la lente viene visualizzata cliccando sul diagramma dei contenuti e può essere trascinata con il dito. Anche in questo caso la lente si posiziona centrata sul punto di contatto. Per allargare o ridurre l’area visualizzata sono disponibili interazioni multitouch oramai standard.10 In entrambi i supporti, se non utilizzata per un certo lasso di tempo, la lente diventa trasparente, evitando di nascondere il materiale sottostante. Per quel che riguarda l’effettiva esplorazione dei contenuti e dei loro collegamenti, come spiegato nel 2.1.3, fin dall’inizio ho scelto di sperimentare l’uso delle connessioni bibliografiche come metodo esplorativo. Da un punto di vista
2.2
grafico, la citazione mi permetteva di identificare contenuti inerenti in maniera semplice e offriva all’utente la possibilità di costruire dinamicamente un percorso di ricerca. Il primo aspetto da risolvere è stato come selezionare univocamente un documento. Dopo alcune prove d’interazione, ho scelto di unire lo strumento di selezione allo strumento lente: il documento che, di volta in volta, si trova al centro dell’area della lente assume lo stato “on focus”, mostrando alcuni dati essenziali come il titolo e l’autore. Questo nuovo stato fa si che l’intera visualizzazione si modifichi di conseguenza, mostrando quali documenti all’interno delle varie categorie sono stati citati o citano il contenuto selezionato (vedi FIG 11). A vari livelli di zoom corrispondono vari livelli di dettaglio per le citazioni; inizialmente i collegamenti vengono semplicemente identificati sul piano, ma gradualmente vengono visualizzate maggiori informazioni quali la posizione della citazione, la lunghezza nel testo originario e il tipo di pubblicazione (vedi FIG 12). 2.2.3 Ricerca mirata Fino ad ora ho esposto come gli sforzi progettuali si siano concentrati nel rendere l’interfaccia adatta anche ad utenti non esperti. Allo stesso tempo però il target e lo scenario d’utilizzo mi hanno fatto riflettere sull’importanza di considerare anche un tipo di ricerca più specifica. Parlando con Klaus Gasteier e Kris Krois della loro interfaccia AFlow (vedi A.1.1), è stata discussa la necessità, per le interfacce usate in ambito professionale, di implementare strumenti di ricerca più precisi e mirati. Infatti, poiché il risultato di una ricerca accademica è solitamente la produzione attiva di nuovi contenuti, è importante non solo la scoperta, ma anche l’effettiva capacità di trovare ciò che si cerca manipolando parametri e filtri. Ho quindi formulato delle ipotesi sulle tipologie di filtri e su come inserirli nell’interfaccia. Inizialmente, quando ancora la struttura finale della visualizzazione non era definita (vedi 2.2.1), avevo provato a utilizzare lo spazio bidimensionale come un’unica tavolozza su cui l’utente potesse sistemare dei “punti di interesse”. Questi, caratterizzati semplicemente da una parola chiave, avrebbero attirato a se dei contenuti rilevanti e, a seguito di
119
120
FIG 13
Primi esperimenti di interazione
FIG 14
Interfaccia di ricerca. L’utente può restringere il campo di ricerca a singole categorie o sottocategorie. Una bar chart visualizza la quantità di documenti relativi alla ricerca che si sta per compiere. In questo modo, l’utente può rendersi conto di quanti risultati una determinata parola chiave gli porterà
2.2
FIG 15
Funzione di salvataggio
121
11 Un sistema intelligente che modifichi le proprie performance in risposta al comportamento dell’utente è un’importante ingrediente dei sistemi di visualizzazione esplorativi (vedi 1.2.1)
12 “la ricerca è iterattiva, interattiva e sociale” Morville e Callender (2010, p. 20)
13 [http://homepages. inf.ed.ac.uk/rbf/ Fish4Knowledge/index. html] 21 giugno 2013
122
varie iterazioni, si sarebbe costituita una mappa concettuale complessa (vedi FIG 13). Per raffinare la ricerca, l’utente avrebbe avuto la possibilità di eliminare alcuni elementi e il sistema avrebbe progressivamente imparato che tipo di contenuti presentare.11 Una volta definita la presentazione dei contenuti, in seguito a dei brevi test con utenti target, ho preferito spostare le opzioni di ricerca in una sezione separata dalla visualizzazione, così che l’utente avesse un unico punto di riferimento per modificare i criteri di ricerca (vedi FIG 14). Inoltre, ricordando quanto suggerito dagli utenti intervistati (vedi SCHEDA 1D), ho dedicato del tempo alla progettazione di funzionalità d’archivio. In qualsiasi momento è possibile salvare la ricerca corrente con tutti i risultati e le modifiche fatte (vedi FIG 15). Pensata per utenti registrati, la possibilità di salvare e ritornare in seguito ad una specifica ricerca è fondamentale per professionisti e si posiziona in accordo con l’affermazione “search is iterative, interactive and social”12 di cui abbiamo già parlato nel 1.1.3. 2.2.4 Viste multiple: tra informazioni di contesto e di dettaglio La necessità di fornire strumenti di analisi precisi ad utenti professionisti mi ha portato a riflettere anche sulla presentazione dei contenuti singoli. Molti dei servizi già esistenti offrono un misero livello di dettaglio quando si tratta di risalire alla fonte originale (vedi SCHEDA 1B: WELL FORMED EIGENFACTOR e SCHEDA 1C: TIMELINE – Citeology). Come dimostrato da alcuni studi sperimentali13, l’utilizzo di tool digitali per l’analisi di grandi quantità di dati in ambito professionale solleva una serie di problematiche relative alla fiducia e alla credibilità del sistema. Il contrasto tra utenti esperti in un certo ambito e le tecniche di analisi applicate dal sistema, tipicamente appartenenti ad ambiti matematici o informatici, porta spesso ad una mancanza di comunicazione da entrambe le parti.
2.2
“We have to be careful when designing an interface to analyse big data and expecially when deciding how much of the processing algorithms to reveal to the users. Overwhealming them with too technical informations might distract or cause disconfort, while letting users access the data source from time to time helps in building trust and understanding of the visualization”.14 In contesti accademici, valutare di persona la rilevanza e la correttezza di un riferimento è estremamente importante. In particolare quando si tratta di valutare l’importanza di un documento per la propria ricerca, verificare il contesto e il contenuto preciso aiuta a estrarre informazioni sulla qualità della citazione, che un’analisi digitale non riuscirebbe a catturare. Ho quindi deciso di affiancare al documento e ai suoi riferimenti bibliografici una visualizzazione del testo originale. In un primo momento ho sviluppato un’interfaccia che potesse accogliere simultaneamente le due visualizzazioni, così da offrire informazioni multiple. Questa interfaccia era divisa in due aree, una dedicata al digramma tempo-categoria descritto in 2.2.1 e 2.2.2, e una che accoglieva di volta in volta il testo completo dell’elemento selezionato (vedi FIG 16). Poiché non era possibile visualizzare sempre tutte le informazioni, l’interfaccia era caratterizzata da un uso esteso di pop-up e roll over15 (vedi FIG 17). Dopo un periodo di affinamento, sebbene l’intenzione fosse quella di comunicare più informazioni possibili senza uscire dalla modalità di visualizzazione principale, questa proposta si è rivelata alquanto confusionaria in sede di revisione. Ho preso quindi la decisione di separare le due viste, dedicandone una all’esplorazione dei contenuti e un’altra all’analisi dettagliata di un documento. Questo nuovo approccio mi ha permesso di dedicare più attenzione alla cura dei dettagli sia per l’una che per l’altra visualizzazione. Non dovendo più accostare due visualizzazioni diverse nella stessa schermata, il diagramma dei contenuti poteva estendersi su tutta la dimensione dello schermo, permettendo un design più pulito e meno affollato (vedi FIG 18); il testo originale viene invece analizzato in una sezione completamente diversa, e i collegamenti bibliografici sono visualizzati in relazione alla loro posizione nel testo (vedi FIG 19).
14 “Bisogna stare attenti quando progettiamo un’interfaccia per l’analisi di grandi dati, specialmente nel decidere quanto rivelare all’utente delle tecniche utilizzate per processarle. Oberarli di informazioni specifiche potrebbe distrarre o causare disagio, mentre lasciare che l’utente abbia accesso alla fonte dei dati aiuta a sviluppare fiducia e comprensione nella visualizzazione” Elvira Arslanova, Designing for Big Data UX Research, intervento presso lo UXcamp Europe, Berlino, 23 giugno 2013
15 Entrambi i termini identificano contenuti che si sovrappongono alla visualizzazione principale su richiesta dell’utente, in seguito al click o al movimento del mouse
123
124
FIG 16
Primo progetto di interfaccia a vista multipla
2.2
FIG 17
In questa proposta, per tutte le citazioni bibliografiche correntemente visibili nel testo integrale, vengono disegnati dei collegamenti col diagramma principale. Al contrario, ogni volta che l’utente seleziona uno degli elementi, viene visualizzata la posizione della citazione nel testo e un’anteprima del contenuto
125
126
FIG 18
Struttura finale della sezione “Esplora”
2.2
FIG 19
Schermata di analisi del testo prima della definizione di uno stile grafico
127
2.2.5 Trattamento del testo L’ultimo aspetto progettuale che vorrei presentare è la possibilità di trattare graficamente il testo per migliorare l’esperienza di ricerca.
16 [http://www. alchemyapi.com/] 27 maggio 2013 17 [https://www.proxem. com/en/technology/ antelope-framework/?gclid=CKPBn-uT_7cCFYVV3god-3gAWA] 27 maggio 2013
Come spiegato nella SCHEDA 1C: VISUALIZZARE IL TESTO, tecniche di rappresentazione visiva di contenuti testuali possono essere molto utili nel migliorare i processi di ricerca. Spesso articoli e saggi accademici possono essere piuttosto lunghi e trattare diversi argomenti; è quindi importante che l’utente possa identificare abbastanza velocemente il paragrafo del testo relativo alla propria ricerca. Uno studio del genere può essere condotto sotto diversi punti di vista, ad esempio si può sviluppare un algoritmo matematico che analizzi il linguaggio utilizzato nell’articolo e faccia delle supposizioni sull’argomento trattato. È questo il caso di strumenti come AlchemyAPI16, o Antelope17, specificamente progettati per l’elaborazione del linguaggio naturale. Oppure, considerando i collegamenti bibliografici, è possibile suggerire il tema prevalente di una sezione del testo: se in un paragrafo vengono citati prevalentemente articoli di chimica organica, ci sono buone probabilità che quel paragrafo tratti un argomento inerente a questo tema. Per il mio progetto ho considerato attentamente le diverse tecniche di analisi del testo e, sebbene l’analisi semantica permetta teoricamente di avere risultati più precisi, ho deciso di lasciarla da parte vista la complessità degli algoritmi e concentrarmi, coerentemente con il resto del servizio, sull’uso delle citazioni bibliografiche. La sezione dedicata al testo integrale si presenta in questo modo: • Anagrafica del documento. Le principali informazioni bibliografiche comunemente collegate ad un documento sono ricapitolate in un’area specifica sempre alla portata dell’utente
128
2.2
FIG 20 Colori e icone sono utilizzati per evidenziare una citazione FIG 21
Timeline di riferimento per la cronologia delle citazioni e citazioni bibliografiche organizzate in sezioni
129
130
FIG 22
Comparazione di piÚ documenti in un’unica schermata
2.2
• Citazioni evidenziate. Solo una piccola parte del testo viene visualizzata contemporaneamente. Per continuare la lettura e vedere più citazioni, l’utente può scorrere l’area testuale verso il basso o verso l’alto (vedi FIG 20) • Anteprima della distribuzione di tutti i collegamenti: le citazioni vengono visualizzate cronologicamente su una timeline rispetto all’anno di pubblicazione e in ordine di comparsa all’interno del testo, divise per sezioni e capitoli (vedi FIG 21) • Analisi di più documenti: come spiegato nel 2.2.3, l’utente registrato ha la possibilità di salvare le proprie ricerche. I documenti parte di una ricerca possono essere visualizzati assieme e i loro collegamenti possono essere confrontati sia sul piano temporale che su quello tematico (vedi FIG 22) Nel corso di questo secondo capitolo ho spiegato come, attraverso studi teorici e esperimenti pratici, il progetto si sia sviluppato nella sua configurazione finale. Ho mostrato dai primi schizzi su carta alle wireframe18 dettagliate. Nel prossimo capitolo presenterò il prodotto finale, esponendone le funzioni in maniera ordinata e presentando le schermate con la grafica definitiva.
18 Rappresentazione schematica di una pagina web o altro software digitale in fase di progettazione. Wikipedia [http:// it.wikipedia.org/ wiki/Wireframe] 23 giugno 2013
131
CAPITOLO 3
QUADRA costruisci la tua ricerca
3.1
3.1 Un’applicazione per la ricerca accademica
Università, laboratori scientifici ed enti di ricerca privati, basano molta della loro attività e del loro prestigio sulla pubblicazione di articoli e saggi, al giorno d’oggi tipicamente in formato digitale, per illustrare i progressi ottenuti nel proprio settore. Queste pubblicazioni sono documenti di riferimento per studenti, dottorandi e professori per valutare lo stato dell’arte di una certa disciplina. Di norma, ogni istituto universitario o scientifico, utilizza degli strumenti per gestire queste pubblicazioni e poterle riutilizzare in seguito. Queste biblioteche digitali1, strutturate per soddisfare le esigenze di ricerca bibliografica professionale, sono molto spesso pubbliche e accessibili in rete da utenti anche non professionisti, mossi da curiosità momentanee. Manca, tuttavia, un servizio che unisca gli strumenti di ricerca professionali con l’esplorazione istintiva e l’utilizzo di mezzi grafici, che soddisfi in termini di user experience gli accademici e rimanga accessibile anche a utenti occasionali: un servizio efficace, utile e coinvolgente allo stesso tempo. A colmare questa lacuna s’inserisce Quadra, un servizio web progettato per migliorare l’esperienza di ricerca bibliografica. Quadra è progettato per soddisfare le esigenze di ricercatori professionisti senza togliere ricchezza all’esperienza esplorativa tipica di utenti neofiti, che non sanno esattamente cosa cercare né come2. Il progetto utilizza una rappresentazione grafica per visualizzare i documenti testuali, trasformando quella che di solito è un’analisi lunga e laboriosa di anonime liste di risultati, in un’attività leggera e soddisfacente3. L’interfaccia e le interazioni permettono di accedere all’informazione attraverso diversi percorsi, sia di tipo consultativo che di tipo investigativo. Pensato per adattarsi proporzionalmente a database di diverse dimensioni, il sistema sfrutta dati comunemente già presenti negli archivi digitali di università e biblioteche (vedi FIG 1). Distinguendosi invece da progetti simili preesistenti4, Quadra utilizza i collegamenti
1
Per una trattazione approfondita delle biblioteche digitali si veda 1.3
2
Paradigmi e processi di ricerca vengono trattati in dettaglio in 1.1
3
Un gruppo di utenti e stakeholders è stato intervisto sull’uso di strumenti di ricerca comunemente offerti da università e associazioni culturali. I risultati di questa indagine sono espressi in 1.3.2 e 1.3.3
4
Una panoramica di approcci progettuali alla ricerca accademica è presentata nel 1.2.3
135
bibliografici per la navigazione e l’esplorazione dei contenuti. L’utente ha la possibilità di manipolare direttamente le informazioni per ampliare o restringere il campo di ricerca in vista della creazione di contenuti originali.
5
Le caratteristiche dettagliate del target group a cui Quadra si rivolge sono esposte nel 2.1.1
6
Il percorso progettuale che ha portato alla scelta del supporto è stato determinato da diverse considerazioni. Si veda 2.1.2
Quadra è pensato per essere usato da studenti, insegnati e ricercatori come strumento di lavoro, durante lo svolgimento parallelo di altre attività. Allo stesso tempo però, soddisfa anche visitatori occasionali, appassionati di una qualche disciplina, che desiderano ampliare la propria cultura e che lo utilizzano durante il tempo libero. Nell’interesse di queste due tipologie di utenti5, Quadra è stato sviluppato sia per desktop, permettendo di combinare il suo utilizzo con quello di altre applicazioni, che per tablet, godendo della flessibilità di un dispositivo portatile e sempre connesso6. Sfruttando le tecniche di programmazione HTML5 e Javascript, è possibile accedere e visualizzare correttamente il servizio online, quindi da qualsiasi dispositivo. Infatti, l’interfaccia di Quadra è stata studiata per potersi adattare responsivamente alla risoluzione dello schermo su cui viene utilizzata. Inoltre sono state studiate delle interazioni applicabili sia all’una che all’altra piattaforma. Altri stakeholder coinvolti nel progetto sono i provider del servizio, coloro che gestiscono database e dati, e soprattutto le persone coinvolte nella scrittura e nella pubblicazione dei contenuti, ovvero autori ed editori. Il progetto ha la prospettiva di diventare una piattaforma di condivisione e scoperta di testi scientifici a livello internazionale. L’attenzione che è stata dedicata al design dell’esperienza e al flusso d’informazioni rende Quadra un’applicazione innovativa, immediata e funzionale.
136
3.1
FIG 1
Dati principali utilizzati da Quadra
137
3.2 Funzionalità e design
In Quadra, l’esperienza di ricerca è suddivisa in tre diverse sezioni, che corrispondono a tre diverse modalità di accesso ai contenuti: • Sezione “Esplora”. In questa sezione l’utente viene invitato ad interagire con una visualizzazione d’insieme dei dati. Ispirata all’idea di “scoperta”, ad ogni azione dell’utente il sistema risponde con suggerimenti e proposte di possibili percorsi di ricerca, permettendo all’utente di costruire il proprio.
7
8
Aspetti importanti della ricerca esplorativa sono sia la sua estensione nel tempo (tipicamente il processo ha una struttura circolare caratterizzata da diverse iterazioni) che l’aspetto sociale (lo scambio di informazioni tra individui porta ad un arricchimento reciproco). Per dettagli si veda 1.1.3 e 1.1.4 Nel campo del web, per flowchart s’intende una rappresentazione schematica dei passaggi e delle interazioni che permettono la navigazione di un servizio nel suo complesso. Saffer (2007, p.90)
140
• Sezione “Analizza”. Pensata per coniugare le esigenze di utenti novizi con quelle di utenti esperti, qui è possibile studiare più a fondo i singoli documenti, facendo riferimento direttamente al testo originale. • Sezione “Profilo”. Oltre alle due sezioni precedenti, accessibili a tutti, Quadra offre agli utenti di ritorno la possibilità di configurare un proprio profilo personale. Questo terrà traccia delle ricerche e sarà possibile farvi ritorno in seguito. Inoltre, un profilo personale permette lo sviluppo di una rete di connessioni sociali. Condividendo le proprie ricerche con amici e colleghi si moltiplicano le possibilità di scoprire nuovi contenuti.7 Alle tre sezioni principali si aggiungono altre funzionalità di contorno, come la ricerca per parole chiave e il salvataggio dei documenti. Le schermate definitive di ogni sezione verranno illustrate nel dettaglio nei prossimi paragrafi, con particolare attenzione agli elementi dell’interfaccia e alle interazioni. La flowchart8 riportata in FIG 2 offre un’anteprima della struttura dell’applicazione.
FIG 2
Screen flow definitivo dell’applicazione Quadra
3.2
3.2.1 Layout e navigazione Da un punto di vista grafico, Quadra è caratterizzata da uno stile innanzitutto serio, ma anche semplice e leggero. In accordo con il target cui si rivolge, gli elementi grafici sono studiati per essere chiari e intuitivi, senza per questo dare un’impressione di pesantezza. Questo risultato è ottenuto combinando forme geometriche, elementi monocromatici e accenti di colore, uno stile tipografico lineare e l’uso di icone minimali (vedi FIG 3). L’elemento grafico che caratterizza il layout dell’applicazione è il rettangolo, in analogia con la forma delle pagine di un libro: come rettangoli sono rappresentati i singoli contenuti; tipografia e icone sono state sviluppate seguendo questa caratteristica geometrica. Come font è stato scelto un sans-serif, il Berthold Akzidenz Grotesk9 nella versione condensed; le icone sono disegnate da una linea di contorno monocromatica, forme semplici e angoli retti. Anche la palette di colori sviluppata per identificare le tematiche è un filo conduttore di tutta l’applicazione ed è stata ripresa nella creazione del logo (vedi FIG 4). L’interfaccia di Quadra è dedicata quasi totalmente alla manipolazione dei contenuti. Pensata per adattarsi scalarmente alle dimensioni del dispositivo su cui è utilizzata, quasi il 95% dello schermo è a disposizione dell’utente per esplorare, confrontare e analizzare i documenti. Gli elementi della navigazione e le funzionalità aggiuntive sono state raggruppate in una barra laterale posta sulla sinistra dello schermo, sottraendo meno spazio possibile alle attività di ricerca.
9
Originariamente pubblicato nel 1896, l’Akzidenz è considerato il precursore dell’Helvetica e si adatta bene all’uso in titolazioni, manifesti e sullo schermo. L’unico testo a differenziarsi è quello del contenuto originale, per cui si utilizza un font graziato, il Seria, più adatto alla lettura di testi lunghi. Bringhurst (2010, p. 103-138)
Graficamente, la barra di navigazione si distingue dal resto dell’interfaccia per un forte contrasto cromatico. Mentre l’area dedicata alla visualizzazione e ai contenuti presenta
141
142
FIG 3
Elementi grafici e mood
FIG 4
Logo a colori e scala di grigi. Facendo riferimento alla rappresentazione dei documenti all’interno del sistema, il logo dell’applicazione Quadra è costituito da 90 quadrati, organizzati in una matrice, colorati con i colori utilizzati per le categorie
3.2
FIG 5
Layout generale e barra di navigazione. Le dimensioni sono calcolate su uno schermo standard 1280x800px
143
144
FIG 6
Alcune schermate informative
3.2
uno sfondo grigio chiaro e contenuti scuri, la sidebar utilizza questi colori al negativo: il grigio scuro dello sfondo garantisce uno stacco netto dal resto dell’interfaccia, gli elementi attivi sono evidenziati in bianco, mentre quelli inattivi utilizzano un grigio scuro, leggermente virato sul rosso. In questa sottile sidebar (vedi FIG 5) trovano posto il logo, il menu delle sezioni e altre tre icone di funzionalità aggiuntive sempre accessibili: • Ricerca per parole chiave e filtri. Attraverso questa icona l’utente può richiamare il pannello di ricerca che, come accade nei motori di ricerca classici, permette di inserire delle parole chiave e raffinare la ricerca. • Salvare la ricerca corrente. Icona pensata per gli utenti registrati, permette di dare un nome alla ricerca che si sta conducendo e salvare nel profilo i documenti che ne fanno parte. Quest’ultima e la funzione di ricerca verranno trattate dettagliatamente nel paragrafo 3.2.4 • Suggerimenti di utilizzo e aiuto. Quadra è stato progettato per diminuire al massimo il tempo di apprendimento, studiando interazioni ed elementi grafici per quanto possibile intuitivi. Tuttavia sono state inserite delle schermate esplicative a supporto dell’interazione. Attraverso l’icona “info” è possibile richiamare i suggerimenti relativi alla sezione in cui ci si trova (vedi FIG 6). Per gli utenti neofiti queste schermate potranno essere utilizzate come tutorial introduttivo, mentre utenti più esperti potranno comunque farvi riferimento di tanto in tanto per trovare conferma e supporto alle proprie azioni. I contenuti dettagliati delle schermate verranno analizzati nei paragrafi successivi nel corso della trattazione delle singole sezioni. 3.2.2 Esplorare Tutto ciò che serve per utilizzare Quadra è un browser connesso ad internet. Basta digitare l’indirizzo web dell’applicazione e si può subito cominciare a esplorare i contenuti, senza l’obbligo di registrarsi o configurare il sistema.
145
Una volta caricata l’applicazione, l’utente si ritrova nella sezione “Esplora” (vedi FIG 7). Qui i contenuti, rappresentati da piccoli rettangoli, sono organizzati orizzontalmente per anno di pubblicazione e verticalmente per categorie tematiche. Già da questa prima visualizzazione, senza ancora aver interagito in alcuno modo, l’utente può trarre delle prime conclusioni sui dati osservati: confrontando il numero di documenti pubblicati su un tema in un certo anno, si può comprendere il progresso o la stasi di alcune discipline nel tempo. 10 La divisione in categorie a cui si fa riferimento per la presentazione del progetto è la classificazione decimale Dewey [http://it.wikipedia.org/ wiki/Classificazione_ decimale_Dewey] 7 luglio 2013.
Per esplorare attivamente i contenuti sono disponibili tre tipi di interazione: • Selezionare una categoria. Per caratterizzare gli ambiti tematici10 è stata scelta una scala di colori dall’ocra al verde chiaro. Cliccando su ognuna delle bande verticali poste ai limiti della visualizzazione, è possibile isolare una categoria del resto del grafico e ricevere, tramite un pop up, informazioni dettagliate sul tema trattato e le eventuali sottocategorie presenti (vedi FIG 8 e 9).
11 Il processo e i riferimenti tecnici che hanno portato alla caratterizzazione degli slider temporali è descritto nel 2.2.2
• Controllare l’intervallo di tempo visualizzato. Secondo le dimensioni del database, la visualizzazione può risultare più o meno dettagliata. Aprendo l’applicazione per la prima volta, il diagramma viene automaticamente ridimensionato per rappresentare sullo schermo l’intero l’arco di tempo in cui sono presenti documenti pubblicati. Da questa configurazione, è possibile modificare dinamicamente il lasso di tempo che ci interessa tramite degli slider posizionati sul bordo inferiore dell’interfaccia (vedi FIG 10). A livello di zoom minimo, i singoli documenti sono troppo piccoli per essere distinti individualmente, e formano così un area di colore uniforme. Più si restringe il periodo selezionato, meno documenti saranno visibili sullo schermo e sarà quindi possibili distinguerli singolarmente, ottenendo informazioni sempre più dettagliate11 (vedi FIG 11). Durante lo spostamento dei cursori, sul diagramma vengono evidenziati i documenti
146
FIG 7
Schermata di apertura
FIG 8
Isolamento della categoria “Scienza”
FIG 9
Isolamento della categoria “Scienze Sociali”
147
148
FIG 10 Dettaglio slider temporali FIG 11
Passaggio dal livello di dettaglio minimo a quello massimo in quattro step consecutivi
FIG 12
Dettaglio cursore in movimento
FIG 13
Dettaglio diagramma di riferimento
149
150
FIG 14
Strumento lente in uso a livello di ingrandimento minimo
FIG 15
Utilizzato sul bordo della visualizzazione, lo strumento lente mostra anche il nome delle categorie
FIG 16
Strumento lente inattivo
3.2
pubblicati in uno stesso anno, così che l’utente possa sempre avere una scala di riferimento (vedi FIG 12). In alto a sinistra, a prescindere dal livello di zoom, è sempre visibile un’anteprima dell’intero diagramma. Terminata l’operazione di selezione, su questa anteprima viene evidenziata la porzione di diagramma attualemente visibile ( vedi FIG 13). • Strumento lente d’ingrandimento. La lente è una delle interazioni chiave di Quadra. Funge contemporaneamente da strumento di esplorazione, da selettore, e da veicolo di informazioni aggiuntive. Durante il processo esplorativo, la lente permette di valutare la rilevanza o meno di una piccola area del diagramma, mostrandone, in overlay, il livello di dettaglio successivo senza per questo modificare definitivamente l’intera visualizzazione (vedi FIG 14 e 15). Le interazioni associate a questo strumento sono state ottimizzate sia per l’utilizzo tramite mouse che per i dispositivi touch: su computer laptop e desktop, la lente segue sempre il movimento del mouse quando questo si trova sulla visualizzazione, comportandosi in pratica come un roll over; su tablet, dove non è possibile distinguere il click dallo spostamento, la lente può essere trascinata sulla visualizzazione fintanto che il contatto è attivo. Sollevando il dito, la lente rimane ferma sull’ultimo punto di contatto. Se per un certo tempo non vengono registrate nuove interazioni, lo strumento diventa semitrasparente, evitando di nascondere per lungo tempo parti della visualizzazione (vedi FIG 16). Sia su tablet che su desktop, il documento che si trova, di volta in volta, al centro della lente assume automaticamente lo stato “on focus”. Questo stato determina la visualizzazione d’informazioni dettagliate come titolo e autore, ma anche editore, tipologia di contenuto e numero di riferimenti bibliografici posseduti (vedi FIG 17). Tutti gli altri documenti cambieranno aspetto in relazione ai collegamenti condivisi con quello selezionato. Più è stretto l’arco di tempo visualizzato più informazioni è possibile rappresentare per ogni documento collegato (vedi FIG 18). Ad un livello massimo di zoom, i documenti citati, o che hanno citato il selezionato, mostrano quante e quali parti dei propri testi gli sono relative, se si tratta di documenti pubblicati in riviste specializzate del settore e, se è il caso, il punteggio attribuitogli dagli enti competenti.12 (vedi FIG 19).
12 Diversi enti accademici e commerciali si occupano di calcolare il prestigio e l’affidabilità di riviste e periodici. Per la presentazione del progetto sono stati utilizzati, di volta in volta, dati provenienti da diverse fonti, come l’Eigenfactor Project [http://www.eigenfactor. org/] 24 maggio 2013. Per l’implementazione del progetto finale si suppone l’esistenza di una fonte di riferimento unica collegata al database d’utilizzo.
151
152
FIG 17
Strumento lente e dettaglio informazioni bibliografiche
FIG 18
Rappresentazione delle citazione a diversi livelli di zoom
3.2
FIG 19
Dettaglio citazione
153
154
FIG 20 Schermate di tutorial e supporto della sezione “Esplora”
3.2
Questi tre modalità d’interazione sono descritte anche nelle schermate di aiuto, accessibili tramite l’icona “info” sempre visibile sulla sidebar (vedi FIG 20). La parola chiave della sezione “Esplora” è flessibilità. I contenuti sono presentati in modo né eccessivamente rigido né totalmente arbitrario. Vengono proposti dei percorsi di ricerca che possono in ogni momento essere combinati o modificati. Lo scopo di questa sezione è permettere all’utente di navigare tra i documenti con naturalezza, dimenticando le imponenti dimensioni del database. Da qui è naturale passare all’analisi del singolo documento. Una volta trovato un contenuto adatto, cliccando sul titolo o trascinandolo sull’icona di salvataggio (vedi FIG 21), l’utente lo caratterizza come “salvato” e lo ritroverà pronto per uno studio dettagliato nella sezione “Analizza”. 3.2.3 Analizzare: il testo originale Passando alla sezione “Analizza”, si abbandona il diagramma tempo-categorie per passare a un’interfaccia diversa. Qui lo scopo principale non è più esplorare i contenuti, ma condurre uno studio dettagliato di un singolo documento. In questa schermata (vedi FIG 22), il documento precedentemente selezionato occupa un quarto dello schermo e mostra diverse informazioni suddivise in un ordine preciso (vedi FIG 23): la parte alta è dedicata ai dati anagrafici e alla tipologia di contenuto, al centro è disponibile un’anteprima scorrevole del testo originale con i passi collegati ad altri documenti evidenziati a colori, e in basso sono presenti informazioni riguardo tutti i link disponibili. Il perimetro del documento ha il colore della categoria a cui appartiene. Lo spazio a destra del documento è sfruttato per offrire una serie di informazioni dettagliate sui collegamenti bibliografici presenti nel testo. Le citazioni, fatte e ricevute, sono organizzate secondo il loro ordine di comparsa nei capitoli che compongono il documento. Scorrendo il testo verso il basso
155
156
FIG 21
Scelta di un documento da analizzare
FIG 22
Schermata di analisi di un singolo documento
3.2
FIG 23
Dettaglio singolo documento
157
o verso l’alto, man mano che nuovi riferimenti diventano visibili, questi vengono evidenziati nello schema a destra, mostrando autore e anteprima del titolo (vedi FIG 24 e 25). E’ presente inoltre una timeline su cui tutti i collegamenti sono ordinati cronologicamente rispetto all’anno di pubblicazione del documento analizzato (vedi FIG 26). Nella parte inferiore dello schermo troviamo invece un’area dedicata a funzioni extra come l’aggiunta di altri documenti, i link per scaricare i Pdf originali e una legenda cromatica. Praticamente tutti gli elementi informativi presenti nella sezione analizza sono interattivi e consentono di affinare e proseguire la ricerca:
13 Siamo di fronte a un esempio di brushing su viste multiple, una tecnica che permette di veicolare diverse informazioni attraverso un’unica interazione. Per saperne di più si veda SCHEDA 1C: VISTE MULTIPLE
158
• Studio della distribuzione delle citazioni nel tempo. È possibile filtrare i collegamenti bibliografici in base al periodo cui si è interessati, interagendo con la timeline di riferimento. Selezionando un singolo anno verranno evidenziate tutte le citazioni pubblicate in quella data (vedi FIG 27). Inoltre, è possibile operare una distinzione tra i documenti citati, pubblicati in anni precedenti, e quelli che invece l’hanno citato in seguito. Per far questo basta cliccare sulle icone relative ai link bibliografici, in basso a sinistra (vedi FIG 28 e 29). In entrambi i casi, sia la timeline che l’organizzazione in capitoli vengono influenzate dalla selezione.13 • Selezione di un collegamento. La selezione diretta di un collegamento bibliografico fornisce informazioni sul documento cui appartiene (vedi FIG 30). Cliccando su uno dei riferimenti ordinati per capitoli, si apre un box informativo che si sovrappone momentaneamente alla visualizzazione. In questo pop up vengono indicati per esteso il titolo, l’autore, il tipo di pubblicazione e, se rintracciabile, l’estratto del testo cui la citazione fa riferimento. Inoltre sono indicati i possibili link bibliografici a cui questo nuovo documento da accesso e la categoria di appartenenza (vedi FIG 31). La selezione di una citazione comporta dei cambiamenti anche in altre parti dell’interfaccia: il testo scorre automaticamente fino al punto in cui è presente il riferimento, sulla timeline viene indicato l’anno di pubblicazione, e nello schema dei capitoli vengono evidenziate eventuali altre istanze dello stesso documento.
FIG 24 Le citazioni in evidenza corrispondono a quelle correntemente visualizzate nel testo originale
FIG 25
Dettaglio citazioni
159
160
FIG 26 Timeline delle citazioni FIG 27
Filtraggio delle citazioni in base all’anno di pubblicazione
FIG 28 Focus sui documenti citati FIG 29 Focus sui documenti che citano il selezionato
161
162
FIG 30 Selezione di una citazione FIG 31
Dettagli box citazione
3.2
• Aggiunta di un nuovo documento. Come spiegato nel 1.1.1, le ricerche esplorative non sono solitamente limitate all’analisi di un singolo contenuto. Tipicamente vengono combinati diversi dati per comprendere il tema della ricerca e produrre contenuti originali. Durante una ricerca con Quadra, è possibile salvare diversi documenti per analizzarli singolarmente e in sequenza. L’applicazione offre la possibilità sia di aggiungere alla lista documenti collegati a quelli già selezionati, sia di eseguire una ricerca completamente nuova, tornando alla sezione “Esplora”. Il primo caso vede lo scenario in cui, selezionata una citazione nel diagramma dei capitoli, si vuole analizzare più nel dettaglio il documento che la contiene. Per far questo basterà trascinare il pop up verso l’angolo in basso a sinistra dello schermo, sopra il tasto “+1”, perché il documento originale diventi disponibile per l’analisi (vedi FIG 32). La seconda possibilità invece è tornare alla sezione “Esplora” e continuare la ricerca come spiegato nel 3.2.2 (vedi FIG 33). 3.2.4 Analizzare: comparazione di più documenti Ricerche esplorative complesse possono contare un numero molto elevato di documenti (vedi FIG 34). La possibilità di analizzare il testo e le citazioni di ognuno di essi aiuta durante task di ricerca investigativi ed educativi (vedi 1.1.1), ma ad un certo punto può essere necessario considerare la ricerca nel complesso e tirare in un certo senso le somme del percorso che si sta intraprendendo. Per far questo, Quadra offre, all’interno della sezione “Analisi” una funzione specifica di comparazione. Cliccando sullo switch in basso nella barra di navigazione, il contenuto di ogni documento viene condensato in un’unica barra colorata, mostrando solo le informazioni principali: titolo, categoria e tipo di documento (vedi FIG 35 e 36). In questo modo, in un’unica schermata sono visibili fino a 15 documenti. L’utente ha la possibilità di farsi un’idea generale dei contenuti selezionati e cominciare a trarre delle conclusioni sul percorso della ricerca. Ad esempio, già da questa prima visualizzazione, ci si può fare un’idea della quantità di documenti analizzati e della loro distribuzione tematica.
163
164
FIG 32
Passaggi necessari per aggiungere un documento citato a quelli salvati
3.2
FIG 33
Ritornando alla sezione “Esplora” dopo aver salvato dei documenti per l’analisi, fa si che questi risultino evidenziati nel diagramma tempo-categorie, e che lo strumento lente sia posizionato automaticamente sull’ultimo analizzato
165
Per sfruttare al meglio questo strumento, è possibile riorganizzare i contenuti in base a parametri diversi, indicati in alto a sinistra. Arricchendo ulteriormente l’esperienza di analisi, è possibile visualizzare i riferimenti bibliografici cliccando su ognuno dei documenti disponibili (vedi FIG 37). Un grafico mostra la distribuzione delle citazioni nel tempo, utilizzando una timeline il cui funzionamento è familiare all’utente già dalla sezione “Esplora” (vedi 3.2.2). Ogni citazione è selezionabile singolarmente per ottenere dei dettagli, anche questi rappresentati utilizzando un formato già incontrato durante l’analisi del testo (vedi FIG 38). Inoltre, per rendere le possibilità di studio davvero complete, l’utente ha la possibilità visualizzare i riferimenti bibliografici di più documenti assieme (vedi FIG 39). Le funzioni descritte in questo paragrafo e in quello precedente sono pensate per soddisfare le esigenze di utenti che utilizzano lo strumento durante il processo lavorativo per scopi professionali. Le interazioni, sebbene studiate per risultare semplici anche ad utenti inesperti, richiedono un minimo di dimestichezza in più ed è probabilmente necessario un periodo di apprendimento. Come supporto sia per il primo utilizzo che in seguito, sono state studiate delle schermate introduttive, accessibili con il tasto “info”, che illustrano nel dettaglio i principi su cui si basa l’interfaccia di analisi (vedi FIG 40). 3.2.5 Ricerca, salvataggio e profilo Nelle sezioni “Esplora” e “Analizza” si svolge gran parte dei processi di ricerca per cui Quadra è stato progettato. L’unione delle funzionalità offerte dall’una e dall’altra sezione permette a ricercatori professionisti e occasionali di vivere un’esperienza di ricerca ampia, bilanciando l’esplorazione con la consultazione e la precisione.
166
FIG 34
Sezione “Analizza” con molti documenti in memoria
FIG 35
Dettaglio switch comparazione
FIG 36 Schermata comparazione e dettagli: i documenti possono essere organizzati per ordine di inserimento, per data di pubblicazione e in base al sistema di categorie utilizzato
167
168
FIG 37
Selezione di un documento e visualizzazione delle citazioni
FIG 38 Selezionando una citazione si apre un pop up simile a quello illustrato nel 3.2.3
3.2
FIG 39 Comparazione di pi첫 documenti
169
170
FIG 40 Schermate di supporto all’interazione accessibili cliccando sull’icona “info”
3.2
171
Per rendere l’esperienza completa, Quadra include una serie di funzionalità aggiuntive:
14 Vedi 3.2.2 per dettagli sul funzionamento della sezione “Esplora”
• Parole chiave e filtri di ricerca. Nel 2.2.3 si è discusso della necessità di offrire strumenti di ricerca specifica per un uso professionale dell’applicazione. Queste considerazioni si sono tradotte, nel prodotto finale, in una micro-sezione dedicata interamente alla ricerca specifica. Tutti gli strumenti di ricerca e filtraggio si trovano in un pannello apposito a cui si accede cliccando sull’icona “cerca” presente nella barra di navigazione (vedi FIG 41). Qui l’utente ha la possibilità non solo di inserire delle parole chiave e selezionare dei filtri, ma anche di vedere subito un’anteprima dei risultati che la ricerca fornirà. Andando con ordine, nell’interfaccia troviamo: un campo di testo in cui l’utente può scrivere tramite tastiera, dei menu dropdown e dei pulsanti che permettono di selezionare specifiche categorie. Una bar chart visualizza quanti e che tipi di documenti produrrà la ricerca (vedi FIG 42) e permette di rendersi conto, prima di avviarla, se la quantità di risultati incontra le aspettative. Una volta avviata la ricerca, i documenti non interessati diventano trasparenti, mentre quelli che rispettano i filtri vengono evidenziati nel colore della categoria a cui appartengono (vedi FIG 43). Se l’utente attiva dei filtri di ricerca ad un livello di zoom diverso dal minimo14, e i documenti al momento visualizzati non soddisfano i criteri, vengono offerti dei suggerimenti su come visualizzare più risultati (vedi FIG 44). • Salvare una ricerca. Tramite l’icona “salva” presente nella barra di navigazione, è possibile dare un nome e salvare la ricerca corrente (vedi FIG 45). Questo permette di tenere in memoria tutti i documenti aggiunti alla sezione “Analizza” e potervi far ritorno in seguito. L’iterazione è un elemento fondamentale dei processi di ricerca esplorativi in quanto permette di elaborare i dati e comprenderne i contenuti. Le ricerche salvate andranno a far parte del profilo personale.
172
3.2
FIG 41
Pannello di ricerca
FIG 42 Dettaglio pannello di ricerca compilato. La bar chart sulla destra mostra quanti documenti verranno trovati per ogni tipologia di contenuto
173
174
FIG 43 Risultati di ricerca evidenziati sul diagramma tempo-categorie
3.2
FIG 44
Se nell’area visualizzata nessun documento è tra quelli trovati, il sistema consiglia all’utente di spostarsi in un’altra zona
175
176
FIG 45 Processo di salvataggio di una ricerca
3.2
• Sezione “Profilo”. Chiunque può utilizzare Quadra, senza bisogno di registrarsi precedentemente. La creazione di un profilo personale offre però una serie di vantaggi di cui beneficerebbero sia gli utenti professionisti che i visitatori abituali. L’integrazione di funzionalità simili a un social network può inoltre incoraggiare anche utenti occasionali a far ritorno più volte. Il contenuto principale del profilo è la cronologia di ricerca. Tutte le ricerche effettuate e salvate, come descritto nel punto precedente, vengono organizzate, nella sezione “Profilo”, su una linea del tempo simile a quella incontrata in altri punti dell’applicazione (vedi FIG 46). Di ogni ricerca è visibile il titolo, la data del primo inserimento, e un’anteprima della quantità di documenti al suo interno, divisi in categorie. Inoltre, nella parte inferiore dello schermo sono visibili le ricerche condotte dai propri contatti, amici e colleghi. Cliccando su una di esse, questa viene messa in evidenza e sono rese disponibili alcune funzioni utili per il proseguimento della ricerca (vedi FIG 47).
177
178
FIG 46 Sezione “Profilo” FIG 47 È possibile ritornare ai documenti salvati sul diagramma esplorativo oppure analizzare nel dettaglio i contenuti testuali. Inoltre è possibile scaricare la versione pdf di tutti i testi per usi esterni
CONCLUSIONI
CONCLUSIONI
“Wenn mann eine neue App entwickelt, hat man nicht morgen Facebook” 1
L’idea per questa tesi è nata da un desiderio personale, dal bisogno di approcciare l’ambiente accademico in maniera diversa. Il risultato finale del progetto si è rivelato molto vicino a quelle che erano le mie intenzioni iniziali, anche se, in corso d’opera, non sono state poche le revisioni e i ripensamenti.
1
“Quando progetti una nuova applicazione, non hai certo Facebook l’indomani” (TdA) Anonimo
Sebbene mi ritenga soddisfatta del livello di dettaglio concettuale e grafico raggiunto con Quadra, non tutte le idee che avrei voluto sviluppare hanno poi trovato posto nell’interfaccia finale. Alcune, sebbene solide e utili, avrebbero richiesto l’esplorazione di strade completamente diverse rispetto alla direzione scelta per l’applicazione, con un dispendio di tempo ed energie non compatibili con il termine della tesi. Altre, che sembravano tanto promettenti in fase iniziale, si sono rivelate erronee o non sufficientemente definite. Nella fase di ricerca preliminare, esposta nel primo capitolo, ho voluto dedicare maggior spazio alla varietà di approcci e declinazioni che un progetto del genere può assumere. Ho cercato di illustrare il contesto di applicazione e il background teorico quanto più accuratamente possibile, soffermandomi ora sugli aspetti psicologici, ora su quelli storici e pratici.
183
Durante la fase di definizione progettuale ho dovuto prendere delle decisioni chiare sugli elementi che avrebbero fatto parte del progetto e quelli che ne sarebbero stati esclusi. Non tutte queste decisioni sono state in assoluto la scelta migliore, ma solo quella che, in quel momento, risultava più saggia per la prosecuzione del progetto. Se si dovesse portare avanti lo sviluppo di Quadra inserendolo in un contesto reale, sarebbe certamente necessaria la revisione e il miglioramento di alcune interazioni. Un esempio è il binomio desktop e tablet. Per queste due piattaforme, molto diverse tra loro in termini di modalità d’uso, è stata sviluppata un’unica interfaccia compatibile con entrambe. La scelta di non progettare, in questa fase, due applicazioni pensate ad hoc risiede nella necessità di ottenere una prima versione stabile e solida del progetto. In una seconda fase, sarebbe d’obbligo ripensarle e sviluppare le due interfacce separatamente, sfruttando al meglio le caratteristiche di una e dell’altra piattaforma. Sul piano personale, lavorando a questo progetto ho avuto la possibilità di imparare molto e confrontarmi con diversi punti di vista progettuali. Sono particolarmente contenta e grata della interviste condotte nel settore bibliotecario e con designer professionisti che mi hanno aiutato ad avere una visione d’insieme più completa del mio lavoro.
184
APPENDICE
A.1
APPENDICE 1 Interviste integrali
A.1.1 Intervista telefonica a Kris Krois e Klaus Gasteier 19.02.2013 Ornella: Hi Kris, hi Klaus! I’m very pleased to meet you!
1
Kalus Gasteier, professore di comunicazione audiovisiva presso la Universität der Künste di Berlino
2
Kris Krois, designer, docente di comunicazioni visive presso la Libera Università degli Studi di Bolzano
3
Gillian Crampton Smith, interaction designer, docente presso l’Università Iuav di Venezia
Klaus1: Hi Ornella! It’s very nice for us too! Kris2:
So it’s a nice coincidence this connection, that Gillian3 made in this moment on our side and on the other end on Klaus side with his students at the University of Arts who are targeting in a similar direction. They have just being finishing a semester project, so Klaus is much more into this topic of semantic search. So we can just have a conversation to see what you are heading for, what you are doing what we are doing and let’s see where we come without any precise expectation at least from my side as far as I can see.
Ornella: Yes, as I said, I’m in the beginning of the research part so I’m looking for what has been done before and I came across a lot of things which have been done in this field and Gillian was so kind to give me your contact. I want to realize some kind of visualization to help finding scientific papers, and when I was looking at the Academic Flow project I was thinking that maybe it could be interesting to work also on the visualization of the text itself, I don’t know if you have done something in this direction. Also it would be interesting for me to know how you came to realization of the original AFlow project.
189
Kris:
Ah long story! But coming back to the simpler point, the graphic representation of a scientific paper is defenetly very interesting, which we did not address yet at all. We discussed some basic ideas but nobody really worked on in at all.
Ornella: Because looking at the Academic Flow, It’s great how it works and how it structure information, but also I was thinking that maybe when the user is delivered with this result/document, maybe it could be interesting to understand where inside the document is related to what you were looking for, does it make sense? Kris:
4
Kris e Klaus hanno, in questa circostanza, condiviso con me il link al prototipo del loro progetto. Essendo coperto da copyright non lo riporto qui, ma i risultati della loro riceca saranno resi publici qui: http:// aflow.tv/#!news
190
Absolutely. At the moment we are working in parallel on a project which is applying the AFlow process to the domain of news, which in a way is very similar because is also text based information in the first place (you never know about the quality of an image and how far they are really representative). We are a bit more advance with this application for news. There is a running application. We have a development prototype that is already working. One thing that is missing is the visual/interface question. If you see4- this you get another view on how we structure information and how we map it. Here opposed to movies we don’t have a structured metadata but we have just text, and also opposed to scientific paper. So as a first we do a natural languages processing to analyze the text, the result of this process are entities, for example location but also concepts or tags. So based on this we build up a dataset where we have the article class and then we have the basis on which we can operate with our mapping algorithm, which distributes the contact on the mash.
HIGHLIGHT 1
Ho considerato questo metodo di analisi come strumento di esplorazione nel 2.2.2
A.1
Ornella: Where are the news coming from? Kris:
Either from the Google News or the Tech News. Enter any kind of tech news and the mash is filled automatically. So what you see here is related to these 8 dimension represented by a color square in the center. Each of these direction includes other directions so is kind of metadirection. In relation to how far one entity is similar to the center entities in one of these directions the positioning of each entities is calculated.
Ornella: And what I see on the right is what has being taken from the text. Kris:
Not only. It takes the whole text but what you see on the right is just a short description and also the metadata which has being analyzed by the text processor.
Klaus: The colors identifies in relationship to the color in the center. After the analysis is through we take the text and use algorithms like natural language processing so the machine knows who is a person which location is inside the text or which keyword and categories and everything. Kris:
So you see on the left side of the mash the direction for authorship, so there tend to be the article which are from the same author but not exclusively, it also maybe that there are no other content from same articles, or maybe some article are from the same author, but also talk about the same people so where to put it it’s a kind of optimization. It’s like a puzzle where you arrange all the pieces in a way that is never going to be the perfect way but a best way given the concrete content which is there, so it’s always a try to find the best way to map things which somehow fit together and order into directions with the idea
191
to always fill the mash. Conceptionally one basic idea is that we don’t do the usual faceted growing to end down to the three perfect results, we do kind of the contrary. We always fill the mash to offer a lot of variety but we order it loosely into direction. And when it comes to the two domains we have online, movies and ted, which are domains where exploration and serendipity it’s fine, they are not in the first place for target research. You want to explore for the fun of exploring and now the interesting is that the student of Klaus did when they apply it to academic paper. They introduced a more target research by adding feature of something we could call faceted navigation. Because in the academic field you might want to specify, you have a better knowledge of the domain so you are able to specify what you are looking for. It’s not a leisure oriented application.
Klaus: Also student in my seminar, agreed that they want a sort of serendipity but more targeted, they wanted this explorative search in finding paper and relevant information. Some sort of compromise between the flow of serendipity and to direct it more when you find what you are looking for. Ornella: That’s actually very interesting because I concentrated a lot on the exploration side but now this reflection brings back the more targeted search which is actually very important when looking for paper. Klaus: Did you already tried the Ted version of AFlow? There is a mixture of the news domain and the movie domain. We have to movie with a lot of given data and then we have the full text of the lecture which gets analyzed and so it sometimes it gets already in the scientific direction. And you get an idea what faceted search might do there.
192
HIGHLIGHT 2
Nel 2.2.3 ho applicato questa considerazione alla funzione di ricerca di Quadra
A.1
Ornella: The directions, how are they ordered? How did they came up? Klaus: We put a lot of thought into it, what might be the most prominent dimensions in this domain because there are a lot of possibile direction. We defined 8 or 4 directions. We decide we wanted this 8 direction and so we think about in which degrees they are ordered. They could be arrange in any order. Kris:
So basically we do what we call an ontomap, which is defining this meta direction which usually are 8 but not necessarily. We then are looking at what kind of metadata is available because if not the direction would be just visual thinking. So it’s a mixture of visual thinking when we think what would be nice to have as direction and, on the other side, we look on all available data and sometime we see we have to get more metadata to get meaningful directions. So that a kind of a challenge in the news domain. So then we try to order into cluster in this directions, playing around, not using a very severe structure. On one hand we can configure this direction, easy we can change the composition of each direction on the other hand also we can change the direction of each direction so have for example people go to the right side and on the bottom the collective. And we are trying to find the ideal setup of this directions.
Klaus: I give you one example why this is important. Take the movie domain. You also have here directors, actors ecc. and we found out that if there are conflicting roles of a person that could be a director and a producer. Or it could be a director and an actor, so if you put director of the opposite of production how do we locate this conflicting results. So we arranged it so that he is placed in a area where we are looking for both. So separate direction that are really separate and put together direction that might have some overlaps.
193
Kris:
And we do this in two ways in the first place we do it by hand, configuring and seeing the results and reconfiguring and so on, on the other hand with the news browser our collaborator who is doing the algorithms development, he did some analysis in how far objects are connected via which kind of metadata. So in this way you could automatically find directions which are the one who are based on the metadata and have the highest number of objects in common. But this is not the point we are starting from, this is what our colleague is finding out: that what we configure by trial and error is not fully wrong. Because sometimes what you think is really wrong. We thought that maybe it could be nice to have the opposites, like the good things on the right, the bad on the left, this did not work.
Klaus: Because the system didn’t know where to place it. It could be either on the top or on the bottom so if it’s somewhere in between it’s more natural. Ornella: The analysis of the data you are doing yourself? I was wondering if these are standard procedures. Klaus: It’s a standard technology. We use Alchemy, the Alchemy API is one of the largest semantic analysis API for the analysis of text. Kris:
Basically none of this natural languages processing such Alchemy is perfect. We use more of them and then we pick the intersection because sometime they are really nonsense so by using the intersection we get rid of most of the nonsense. It works quite well.
Ornella: What do you think is the thing that has to be researched more in this field?
194
HIGHLIGHT 3
Valutando le modalità esplorative sono stata influenzata da questa affermazione che mi ha portato a lasciare da parte i software di interpretazione del testo. Si veda 2.2.3
A.1
Kris:
I think that as far as I know the research in interfaces for search which use a kind of visualization. None of them is really successful except in some niche of expert search. because most of them make you think too much, they require that you know what you are looking for, that you have knowledge in the field you are operating. And so what we ended up with is still a list based visualization like visual search engines like Google. Google gives you already on the surface what data he found for you but not in which way they relate to each other and also it doesn’t give you the possibility to go more into one direction. This is something we want to deliver with a very simple user interface where you don’t have to first select a lot of option but just type in a search and drift in one direction or the other. And on top of this I think it’s a nice idea to add a kind of expert label for example academic paper. And also it’s more difficult for context that is not visual in the first place and so i think it’s a nice challenge for graphic designer to represent on a small space what it is all about.
Ornella: Going back to your application how does it actually decide what goes to the center? Kris:
You have the option to choose which result to open. That requires you to express your activity. But actually the topic of how do you start the mash is kind of always being kind of a weak point. on one hand if you see it from the search engines interface it’s good to start empty, on the other hand if you think this the interface of a movie vendor, than obviously it would be nice to start with a full mash where search is an option but not a must.
Ornella: I got a much clearer idea now. Thanks for you time!
HIGHLIGHT 4
Questa riflessione corrisponde per molti versi agli studi sui comportamenti di ricerca e sulle interfacce esplorative riportati nel 1.1.1
HIGHLIGHT 5
Durante lo sviluppo di Quadra è stata dedicata molta attenzione allo stato iniziale del sistema. Dettagli sull’origine dell’interfaccia sono riportati nel 2.2 e la visualizzazione finale è presentata nel 3.2
195
A.1.2 Intervista alla dott.ssa Paola Chiara Barsotti, presso la Biblioteca Universitaria dello Iuav a Venezia 26.02.2013 5
Paola Chiara Barsotti, responsabile dei servizi bibliotecari al pubblico presso la Biblioteca Universitaria Iuav, Venezia
Paola5: Salve Ornella, è un piacere conoscerti. Ornella: Salve dottoressa, la volevo intanto ringraziare per l’opportunità di incontrarla e spiegarle in breve la mia idea progettuale. Io vorrei realizzare uno strumento digitale che permetta, quando si fa una ricerca bibliografia, di visualizzare i risultati in maniera visiva e grafica per accentuare diciamo l’esplorazione e comportamenti diversi da quello che potrebbe essere scegliere un risultato da una lista. Paola: Quindi con una prevalenza sull’aspetto grafico. Ornella: Si. Ovviamente però mi serve sapere anche come funziona le parte tecnica, quali dati sono disponibili, per renderlo più realistico come progetto. Paola: Noi ci muoviamo all’interno di un settore in cui questi prodotti che usiamo ci vengono forniti da agenzie esterne tipo DataManagement, Exilibri che molto spesso sono anche editori.
196
Purtroppo pochi usano le nostre risorse. Come mai non c’è da parte dell’utenza un interesse per gli strumenti che abbiamo? Perché mettiamo a disposizione una mole di informazione organizzata, e questa è la principale differenza rispetto a quello che si trova su Google, che vengono utilizzate abbastanza poco se non da laureandi, docenti… Questo è un periodo che stiamo vivendo noi come biblioteche e che riguarda tutto il mondo delle biblioteche di grande trasformazione perchè ovviamente subiamo l’impatto del digitale, così come sta diventando più forte nelle librerie con gli
HIGHLIGHT 6
Questa riflessione mi ha spinto ad indagare più a fondo il comportamento degli utenti target. Si veda la SCHEDA 1D.
A.1
ebook, come tutti i fenomeni di tipo economico (è anche questo un fenomeno di tipo economico e non culturale, cominciato negli stati uniti e quindi sta investendo l’europa per il momento più nel settore della narrativa però mano a mano sta invadendo anche il settore accademico). I servizi della biblioteca sono organizzati ovviamente in un front e un back office. cioè tutto quello che voi vedete dietro ha tutto un lavoro. Un libro che viene comprato cartaceo tramite un fornitore unico, viene catalogato in maniera cooperativa a livello nazionale.
Ornella: E questa catalogazione è fatta da una persona? Paola:
Più di una. C’è una persona che si occupa della acquisizione e la catalogazione. Se io acquisto questo libro e sono la prima a farlo in italia, la mia catalogazione viene catturata e se qualche altra biblioteca del sistema nazionale lo acquista, viene riutilizzata. Diciamo che c’è questo vantaggio.
Ornella: Quindi il modo in cui funziona la biblioteca dello Iuav è uguale al modo in cui funziona la biblioteca Marciana Paola: Assolutamente si. Qui c’è la descrizione del libro, come una carta di identità, c’è il titolo, l’ISBN che è un codice internazionale che identifica come un codice fiscale, poi editore ecc. C’è un linguaggio standard per il titolo che è un linguaggio/punteggiatura che viene utilizzata in tutto il mondo, quindi anche se un utente non conosce questo linguaggio però riesce a capire quali sono i campi.
HIGHLIGHT 7
Nel 2.1.2 ho basato su questa informazione la possibilità di Quadra di adattarsi a diversi database.
197
Ornella: Quindi questo potrebbe anche essere utilizzato da un programma di lettur automatica. Paola: Assolutamente. Il fatto che ci sia la punteggiatura internazionale è ciò che permette lo scambio. Quindi qui siamo a livello di descrizione dell’oggetto. Tutte queste informazioni vanno in un archivio, una grandissima base di dati. Per accedere a questa base di dati è vero che adesso ci sono tutti gi strumenti possibili e immaginabili tipo le smart search che ti recuperano qualsiasi cosa in qualsiasi campo no, però è anche vero che il materiale non è organizzato. Quindi per costituire delle chiavi di accesso, si vanno a costituire degli altri archivi dove ci sono questi authority file che sono i metadata tipo autore, curatela, prefazione, collana, titolo e poi c’è tutta la parte della semantica. Perché ovviamente la maggioranza delle ricerche avvengono per argomenti. Ci sono la stragrande maggioranza degli studenti che vengono da noi, magari vengono con le bibliografie dei docenti e dicono “Volevo questo libro che si intitola Scappo dalla città...” (e questa è l’ipotesi migliore, nel senso che a volte vengono dicendo “Volevo quel libro verde…”). Questo ad esempio è il nostro catalogo e ci sono vari tipi di ricerca. La ricerca per liste è quella che si consiglia solo a chi ha idee molto chiare ad esempio io conosco l’autore o io conosco il titolo, o addirittura la collocazione…. Ma se non ho le idee chiare posso fare una smart search o una ricerca per campi. Ornella: Ma e tra le liste e il campo che differenza c’è? Paola: La ricerca per liste ti da proprio l’elenco come è strutturalo questo authority file e il totale dei documenti collegati.
198
A.1
Invece la ricerca per campi diciamo che da spazio anche quando non hai tutte le informazioni precise.
Ornella: La sematica mi interesserebbe per capire come vengono aggregati i documenti simili Paola: Allora qui ci addentriamo in un altro argomento. Ci sono i soggetti e le classi. Il soggetto è l’argomento preciso del libro. Ovviamente anche qui ci sono delle regole ma sono meno standardizzabili. Noi tutte le regole che seguiamo sono di livello internazionale o nazionale come la soggettazione perché seguiamo la Biblioteca Nazionale di Firenze che cura la bibliografia nazionale. C’è un manuale di soggettazione e un thesaurus loro del 20076. Ogni termine è strutturato in questa maniera qua; ha un’appartenenza ad una categoria, ha una nota d’ambito cioè una spiegazione, il termine superiore, etichette di noto, non utilizzabili per la soggettazione ma vuol dire che fa parte all’interno del top term di questo ambito e poi i termini inferiori, e poi i related term. Ovviamente questo tutto è implemetabile
6
http://thes.bncf.firenze. sbn.it/ricerca.php
Ornella: E questi termini dove posso cercarli all’interno della biblioteca Iuav? Paola: Ecco nella ricerca per liste ce l’hai ma tieni conto che nella ricerca per liste bisogna andare precisi con la parola. Noi non soggettiamo con parola chiave come fanno in molte biblioteche del mondo, cioè ogni libro gli do per esempio il soggetto città ecc. Invece noi andiamo più dentro e sintetizziamo l’argomento del libro in una stringa di soggetto. Ha poco senso oramai perché ci porta via tantissimo tempo e non viene apprezzato dall’utente.
199
Ornella: E quindi se uno volesse definire il soggetto di questo libro? Paola: Qui è stata fatta quella che si chiama l’analisi concettuale del libro. Si fa una lettura tecnica, parte più difficile ma anche interessante. Ovviamente non si soggetta mai sul titolo ma si prende in considerazione il complemento, l’indice e l’abstract. Se questi elementi non sono sufficienti si va ancora più dentro e si legge l’introduzione. Spesse volte i libri di architettura ad esempio sono molto semplici. I libri attorno al settore della sociologia sono molto complessi. I soggetti non finiscono alla banca dati nazionale, allora questi soggetti non sono puliti, perché ogni biblioteca si fa il suo, quello di Firenze è una guida. Se ne devo per necessità inserirne uno perché Firenze non lo ha, allora facciamo la proposta di inserirlo. Ornella: E possibilità di fare questo lavoro in maniera automatizzata? Paola: Allora fino a un certo punto. C’è sempre qualcuno che li inserisce. Ci sono delle agenzie che caricano questi dati. Per fare i grandi numeri bisogna comprarli. Noi facciamo anche lo spoglio degli articoli. Vedi la struttura è la stessa. Gli abstract sono di solito molto tecnici e non vale la pena spesso. Vale la pena se si tratta di riviste tipo Urbaistica che è in forma di saggio, tra l’altro è una elle poche riviste che ha la tripla A, molto autorevole da un punto di vista degli standard internazionali, ha le note, ha le informazioni sugli autori ha molte immagini.
200
HIGHLIGHT 8
Chiarezza e presentazione dei dati in diversi modi sono stati punti chiave dello sviluppo di Quadra. Dettagli possono essere trovati nel 2.2.1
A.1
Ornella: E qui stiamo parlando di materiale cartaceo... Paola: Per ora si. L’altra parte della semantica sono le classi che è quella che usiamo è la Classificazione Decimale Dewey che praticamente fa riferimento non all’argomento specifico ma alla disciplina. Ornella: Come utente come faccio a sapere quali termini posso usare? Paola: Questa è una bella domanda. Il nuovo thesaurus è più vicino al linguaggio naturale. però è vero che esiste il problema. Un’altra ricerca si può fare tramite i titoli del libro che è stato scansionati e letti a OCR. Nessuno ha fatto un analisi semantica però torna molto utile. Invece con la soggettazione hai ragione perché uno non sa cosa chiedere. Ornella: Non esiste una maniera per esaminarlo per intero? Essendo strutturato ad albero... Paola: Si. per termine apicale, per categorie. Cosa ne pensi dal punto di vista grafico? Ornella: Mi sembra che ogni tanto manchino dei punti di riferimento. Che i dati che sto veramente cercando non vengono messi in rilievo. Paola: Chi ci supporta in queste piattaforme sono le stesse che fanno tutte le altre biblioteca. Ora noi andremo a poter interrogare tutti i database assieme, mentre prima erano tutti diversi. Abbiamo organizzato le banche dati per argomento e rimanda a tutto. articoli periodici ecc. invece di fare tante ricerche ne faccio una, perché prima dovevi fare una ricerca per libri , una per articoli e quindi ti passa il tempo. mi estrapola lui gli argomenti, creare dei facet.
201
Ornella: Invece dal punto di vista delle citazioni bibliografiche tra i vari libri come vengono trattate. Vengono indicizzate? Paola: Allora noi non facciamo questo lavoro. Sono fatte dalle banche dati che sono citazzionali dove sono contenuti tutti i dati, Scopus, e Web of Science. dicono ogni articolo quante volte è stato citato da chi ecc. Ornella: A me interessava vedere se poteva essere interessante dire, tale libro è stato citato da ques’altro libro in questo contesto. Paola: Il problema è che le riviste italiane non entrano perchè non rispettano gli standard. ad esempio non facciamo gli abstract. Ovviamente qui lavorano sui grandi numeri quindi non c’è un’uniformità di cataloghi. Ornella: Per gestire database di documenti già digitali. tipo articoli digitali ebook ecc.? Paola: Vengono indicizzati con lo stesso sistema Ornella: E analisi del testo con OCR? Paola: Per ora no. Noi facciamo solo copertine e indici. però non c’è la possibilità di fare delle ricerche dentro il testo. Il che per me è un limite. Ornella: E quando arriva un dottorando qua, l’assistente lo aiuta nella ricerca tramite questo tipo di strumenti. Paola: Si. Di solito ci vengono rivolte domande che nel giro di pochi minuti si risolvono. ma cmq vedo che gli utenti si arrangiano per conto loro. A me è capitato di rado di fare ricerche dentro i database. Ornella: Ok dottoressa, io la ringrazio per il suo tempo, mi ha chiarito diversi aspetti che mi saranno sicuramente utili nel corso del progetto!
202
A.2
APPENDICE 2 Prototipo e user test
Se inserito nel mercato reale, il progetto Quadra, così come presentato nel capitolo 3, sarebbe da considerarsi una versione beta: una prima fase completa, pronta per essere testata. Conclusa, quindi, la fase di progettazione grafica e funzionale, mi sono dedicata allo sviluppo di un prototipo funzionante e al suo utilizzo con alcuni utenti target ancora estranei al progetto, per valutare il lavoro svolto. A.2.1 Finalità del prototipo La prototipazione è uno strumento importantissimo quando si tratta di progetti di interaction design. L’autore Dan Saffer, parlando di metodologia del progetto, include sessioni di rapid prototyping in stadi di sviluppo molto precoci, abbinandole allo studio del target group e alla user research.1 I vantaggi di questo tipo di approccio sono molteplici:
1
Saffer (2009, p.93)
2
Stedry Petr, Design without Critique, intervento durante UXcamp Europe, Berlino, 23 giugno 2013
• Feedback. Testare anche solo parti del progetto con utenti esterni permette di rendersi conto, già in fase progettuale, se un particolare tipo di interazione è efficace o meno. Inoltre è possibile sfruttare i suggerimenti e le opinioni degli utenti per indirizzare il progetto verso le loro esigenze. • Velocità. La quantità di tempo spesa su un progetto è inversamente proporzionale alla disponibilità a modificarne delle parti.2 Se la fase di test viene rimandata troppo avanti, e nel frattempo il progetto assume caratteristiche definitive, ascoltare le inevitabili critiche dei partecipanti e modificare elementi sostanziali del proprio lavoro provocherebbe delusione e frustrazione più che comprensione e accettazione. • Comunicazione. Una stretta collaborazione tra design e sviluppo tecnico permette di individuare subito punti di contrasto e forzature, evitando scontri pensanti in fasi di sviluppo già avanzate.
203
204
FIG 1
Fasi di prototipazione
A.2
FIG 2
L’integrazione tra HTML e Processing.js è possibile grazie all’elemento canvas, introdotto con HTML5. La canvas è come una tavolozza di pixel, indipendente dal resto della pagina, su cui è possibile disegnare liberamente, includendo il file sorgente, in questo caso il file Javascript di Processing
205
Ovviamente, a seconda dell’esperienza e dello stadio del progetto, possono essere utilizzate diverse tecniche per creare delle versioni interattive dei propri progetti, più o meno simili a quello che sarebbe il prodotto finale. Nel caso di Quadra, ho scelto di utilizzare un insieme di tecniche digitali eterogenee, che mi permettessero di ricreare agevolmente le esperienze che avevo progettato, valutare di persona l’effettiva fattibilità ed efficacia di certe interazioni, e osservare le reazioni di utenti target esterni al progetto. Non è stato invece obbiettivo principale del prototipo la riproduzione fedele delle qualità grafiche e soprattutto dinamiche di Quadra, al di la delle mie capacità teniche. A.2.2 Problematiche e stadi di sviluppo Quando si tratta di implementazione tecnica, Quadra implica diversi elementi di sviluppo. Si tratta innanzitutto di un servizio web, ed è quindi importante collocare il prototipo all’interno del contesto del browser e strutturarlo in modo da avvicinarsi per quanto possibile al comportamento di un sito web. La sezione che offre sicuramente più sfide dal punto di vista tecnico è la sezione “Esplora”. Qui si sommano infatti una serie di elementi interessanti: • Diagramma dinamico tempo-categorie. Questa visualizzazione, che sta alla base del progetto, vede i contenuti ordinati su due assi e offre la possibilità di controllare dinamicamente le due dimensioni. • Provenienza dei contenuti. Sebbene non sia fondamentale ai fini dello user test, un altro elemento importante del progetto Quadra, è la sua capacità di adattarsi al database che gli viene fornito. I dati sono letti da un link esterno e poi inseriti nell’algoritmo di rappresentazione. Ho indirizzato ognuno di questi fattori singolarmente, seguendo una sequenza ordinata che mi ha portato da una versione molto semplice ad una quasi completa e rifinita (vedi FIG 1).
206
A.2
Entrando brevemente nel dettaglo del prototipo, questo è stato realizzato unendo HTML3 e CSS, con cui sono stati realizzati gli elementi della navigazione e il layout generale dell’app, con codice Javascript compilato tramite Processing.js4 (vedi FIG 2). Questo espediente è stato utilizzato sia per la sezione “Esplora”, che per “Analizza”, realizzando due file Javascript diversi. Nella sezione “Esplora” è stato particolarmente stimolante prototipare l’interazione tra gli slider temporali e il diagramma dei contenuti in maniera soddisfacente. Ho prima di tutto programmato il comportamento dei due selettori temporali in modo che potessero essere azionati separatamente e la loro posizione determinasse il periodo temporale da visualizzare (vedi FIG 3). In seguito mi sono occupata di modificare la visualizzazione dei contenuti in base al periodo selezionato. I documenti vengono divisi per anno di pubblicazione e per ogni anno viene effettuato un check booleano (“Quest’anno è attualmente selezionato?”) per poi rappresentare i contenuti distribuiti proporzionalmente allo spazio disponibile (vedi FIG 4). Per prototipare il roll over della lente, ho semplificato leggermente l’interazione, visualizzando al suo interno sono l’elemento attualmente selezionato. La lente segue sempre il mouse all’interno dell’area del diagramma e mostra i dettagli del documento selezionato.
3
Il linguaggio di markup HTML è globalmente accettato come standard di formattazione per documenti ipertestuali ospitati sul web. Ideato nella sua prima versione da Tim Berners-Lee al CERN di Ginevra, ha attraversato negli anni diverse ripubblicazioni, fino all’ultima versione in fase di revisione: l’HTML5 [https://it.wikipedia. org/wiki/HTML] 4 luglio 2013
4
Processing.js, progetto spin off del software Processing, è un tool di prototipazione dedicato a designer e programmatori non professionisti per la creazione di applicazioni web. La sintassi molto semplice e la l’affidabilità degli algoritmi di esportazione ne fanno uno strumento ideale per testare progetti di interaction e information design. [http://processingjs. org/] 4 luglio 2013
5
[http://rice.iuav. it/] 20 luglio 2013
La seziona “Analizza” risulta relativamente più semplice rispetto all’altra poiché tutti gli elementi si trovano già sullo schermo e non necessitano di ridimensionamenti o interazioni particolari (vedi FIG 5). Per entrambe le sezioni è stato necessario confrontarsi con il processo di lettura dei dati. Ho voluto concentrarmi anche su questo aspetto perché, sebbene sarebbe stato possibile utilizzare un set di dati fittizi per ottenere una rappresentazione graficamente più simile all’effetto presentato nel capitolo 3, mi sembrava importante capire come il sistema si sarebbe comportato con dati diversi, presi da un database reale. La scelta è caduta sui dati offerti dal portale D-Library5, un progetto di pubblicazione di materiale accademico realizzato
207
208
FIG 3
Ad ogni movimento dei cursori sulla linea del tempo, viene chiamata la funziona visibleYears(), che si occupa di ricalcolare il periodo di tempo interessato dalla selezione. Questi dati vengono poi utilizzati per caratterizzare in maniera diversa il testo visualizzato.
A.2
FIG 4
Le dimensioni di ogni elemento vengono calcolate dividendo la larghezza dello schermo per il numero di documenti da visualizzare
209
210
FIG 5
L’interazione principale della sezione “Analizza” è il roll over sui vari elementi, facilmente programmabile unendo il tracking del mouse con variabili di stato
FIG 6
Esempio di record XML
FIG 7
Codice utilizzato per importare i dati dall’XML nel programma
A.2
dall’Università Iuav di Venezia. Su D-Library sono archiviati circa 300 documenti tra materiali di ricerca, didattici, di studio e saggistica, pubblicati da docenti e dottorandi dell’università veneta. Il database è pubblico e redato nel formato open source OAI6: ogni documento è corredato dei propri dati anagrafici ed è identificato univocamente da un id numerico (vedi FIG 6). Sia le dimensioni ridotte ma comunque importanti che l’accessibilità del formato sono stati criteri decisivi nella scelta di questo database come base del prototipo. La lettura del file è stata facilitata da alcune funzioni specifiche offerte dalla piattaforma Processing.js. Il linguaggio XML viene analizzato seguendo dei percorsi precisi tipo record/metadata/dc:title e le informazioni trovate vengono associate a dei nuovi oggetti Documents, organizzati in un array (vedi FIG 7).
6
OAI sta per Open Archive Initiative ed è un progetto che supporta la pubblicazione libera di documenti d’archivio in formati XML standard per favorirne l’utilizzo da parte di sviluppatori esterni [http://www. openarchives.org/] 4 luglio 2013
7
Andrews (2008, p.20)
Procedendo così, affrontando una sfida tecnica dopo l’altra, ho raggiunto, dopo alcune settimane di lavoro, un livello accettabile di robustezza e affidabilità, con una discreta fedeltà al progetto originario. Il prototipo così realizzato è stato reso disponibile online, in un ambiente simile a quello che sarebbe stata la webapp definitiva, ed è stato utilizzato in alcuni user test per valutare l’usabilità e le reazioni al progetto. A.2.3 User Test Lavorare per lungo tempo ad un singolo progetto fa spesso perdere le capacità critiche e valutative. Invitare degli utenti esterni all’uso del proprio prodotto aiuta a ricollocare il progetto nella giusta prospettiva e a evidenziare problemi di usabilità a cui prima non si prestava attenzione. Lo studio delle reazioni e del comportamento degli utenti davanti a nuove interfacce è un campo d’indagine molto vasto che si è grandemente sviluppato nel corso dell’ultimo decennio, a supportare l’avanzamento tecnologico.7
211
8
9
Nel 2.1.1 è stata utilizzata la tecnica della persona per identificare meglio i tratti caratteristici degli utenti coinvolti dal progetto Un gruppo di utenti più esteso rispetto a quello utilizzato in questa fase era stato coinvolto nella fase di ricerca per capire come venivano utilizzati i servizi di ricerca e quali reazioni predominavano tra gli utenti. Si veda la SCHEDA ID per dettagli.
212
Nel piccolo del mio progetto, ho avuto la possibilità di testare Quadra con alcuni utenti target, uno per ogni persona8, che non erano stati coinvolti durante il processo di sviluppo ed erano perciò estranei al progetto.9 Ho incontrato ognuno di loro separatamente, all’interno del proprio contesto di lavoro o di studio, e li ho invitati all’uso del prototipo (vedi FIG 8) spiegando brevemente ciò di cui trattava il progetto e per quale utilizzo era stato pensato, senza però scendere nei dettagli dell’interazione. Li ho quindi lasciati liberi di esplorare autonomamente le schermate chiedendo di commentare le loro azioni ad alta voce. Verso la fine del test ho posto delle domande specifiche su alcuni elementi dell’interazione e ho lasciato che i partecipanti esprimessero opinioni e idee.
FIG 8
QR Code con link al sito web che ospita online il prototipo. Il codice funziona come un codice a barre e può essere letto da qualsiasi smartphone. [http://www.ornellagiau.com/quadra] 24 settembre 2013
A.2
APPROCCIO GENERALE Tutti i partecipanti al testi si sono mostrati interessati e in atteggiamento positivo rispetto a Quadra. Durante la breve introduzione iniziale hanno espresso approvazione per gli intenti del progetto e hanno confermato che un tool del genere avrebbe semplificato e migliorato la propria esperienza di ricerca. Durante l’utilizzo, la quasi totalità degli utenti ha iniziato esplorando il diagramma tempo-categorie con lo strumento lente. In un secondo momento hanno interagito con gli slider temporali, reagendo con ravvivata attenzione alle modifiche sullo schermo. Nel profilo molti hanno cercato di accedere a ricerche precedenti, e hanno espresso curiosità sugli aspetti social. La sezione “Analizza”, come dopo tutto era già previsto dal progetto, è stata quella che più spesso ha richiesto un chiarimento verbale ma, dopo qualche minuto, gli utenti riuscivano ad orientarsi facilmente nell’interfaccia appena incontrata.
SCHEDA APPENDICE
PUNTI CRITICI Osservando lo user test nel complesso, sono stati principalmente due momenti dell’interazione a sollevare perplessità e disorientamento, uno previsto e uno imprevisto: • Primo impatto. Uno degli aspetti più problematici e che ho cercato di curare di più è stata la creazione di un’interfaccia accessibile già dal primo incontro, che non generasse sensazioni di panico ne smarrimento come spesso accade in progetti di visualizzazione di grandi dati. Tempo ed energie sono stati spesi per trovare il giusto compromesso tra insieme e dettaglio. Gli utenti messi a confronto con l’interfaccia sono riusciti ad orientarsi e capirne le intenzioni, ma hanno espresso talvolta delle perplessità sulle schermate iniziali, definendo la presentazione dei contenuti un po’ difficile da interpretare. Questi commenti mi hanno fatto riflettere sulla necessità, in un ipotesi di sviluppo futuro, di indagare ancora in questa direzione, avvalendosi della collaborazione più stretta di utenti esterni. • Metafore di utilizzo. Come spiegato nel paragrafo 3.2.3 e 3.2.4, soprattutto nella sezione “Analizza”, Quadra fa un modesto uso di metafore e astrazioni. La rappresentazione delle citazioni in sezioni e capitoli richiede un periodo di apprendimento e l’ausilio di qualche aiuto per comprenderne pienamente il funzionamento. Questo aspetto concorda con il target di specialisti a cui l’app è rivolta, mentre è di più difficile assimilazione per utenti occasionali. Durante i test ho osservato, come mi aspettavo, reazioni contrastanti tra utenti incuriositi e non.
A.2
NUOVE IDEE E DESIDERATA Come di solito accade quando si presenta il proprio progetto a nuovi utenti, gli aspetti di cui ci si preoccupava di più non suscitano grandi reazioni, mentre vengono alla luce problematiche e mancanze a cui, come designer, non si era affatto pensato in fase progettuale. Anche per Quadra è stato così: passaggi concettuali complessi, come l’interazione temporale, sono stati superati con facilità, mentre elementi secondari sono stati commentati a lungo. Un esempio sono le schermate di aiuto, a cui alcuni utenti hanno dedicato una grande quantità di tempo, suggerendo modifiche e miglioramenti. Tutti i partecipanti al test, chi più chi meno, hanno proposto funzionalità aggiuntive per migliorare l’esperienza. Alcuni hanno espresso interesse verso il trattamento delle immagini spesso contenute negli articoli accademici, altri hanno osservato che Quadra, nel suo stato attuale, non offre la possibilità di consultare altri tipi di contenuti oltre quelli testuali. La cosa inaspettata è che questi desiderata non erano stati espressi durante la prima fase di user research, ma sono comparsi solo in seguito, quando agli utenti è stata data la possibilità di esplorare il sistema di persona.
FONTI
LIBRI E ARTICOLI
Bertin Jacques, Semiology of Graphics: Diagrams, Networks, Maps, ESRI Press, 2010 Börner Katy, Chen Chaomei, Boyack Kevin, Visualizing Knowledge Domains, in Annual review of information science & technology, volume 37, Medford, 2003, p. 179-255. Bringhurst Robert, Gli elementi dello stile tipografico, Edizioni Sylvestre Bonnard, 20106 Cai Guoray, GeoVIBE: A visual interface for geographic digital libraries, in Visual interfaces to digital libraries, Springer Berlin Heidelberg, 2002, p. 171–187 Greenstein Daniel e Thorin Suzanne, The Digital Library: a Biography, Council on Library and Information Resources, Washington D.C., 2002 Himberg Johan, From insights to innovations: data mining, visualization, and user interfaces, Tesi di laurea, Helsinki University of Technology, 2004 Keim Daniel, Andrienko Gennady, Fekete Jean-Daniel, Görg Carsten, Kohlhammer Jörn e Melançon Guy, Visual Analytics: defnition, process, and challenges, in Information Visualization. Human-centered issues and perspective, Springer-Verlag Berlin Heidelberg, 2008, p. 154-175 Kuhlthau Carol Collier, Learning in digital libraries: an information search process approach, in Library Trends, volume 45 - n° 4, The Board of Trustees, 1997, p. 708-724 Lima Manuel, Visual Complexity: mapping patterns of information, Princeton Architectural Press, New York, 2011
217
Mangold Christoph, A survey and classification of semantic search approaches, in. Metadata, semantics and ontology, volume 2 - n° 1, 2007, p. 23–34. Marchionini Gary, Exploratory search: from finding to understanding, in Communication of the ACM, volume 49 - n°4, 2006 Matejka Justin, Fitzmaurice Georg, Grossman Tovi, Citeology: visualizing paper genealogy, in CHI ‘12 Extended Abstracts on Human Factors in Computing Systems, ACM, New York, 2012, p. 181-190 Morridge Bill, Designing Interactions, The MIT Press, 2007 Morville Peter e Callender Jeffery, Search Patterns, O’Reilly Media, Sebastopol, 2010 Newell Lucy Terry, France Robert, Hix Deborah, Heath Lenwood e Fox Edward, Visualizing search results: some alternatives to query-document similarity, ACM, 1996 Pietsch Theodore, Trees of Life: a visual history of evolution, The Johns Hopkins University Press, Baltimore, 2012 Quaggiotto Marco, Knowledge cartographies: tools for the social structures of knowledge, Changing the Change, Torino, 2008 Roberts Jonathan, State of the Art: coordinated & multiple views in exploratory visualization, in Coordinated and multiple views in exploratory visualization, Zurigo, 2007, p. 61-71 Saffer Dan, Designing for Interaction: creating innovative applications and devices, New Riders, 2007 Shneiderman Ben, Feldman David e Rose Anne, Visualizing digital library search results with categorical and hierarchical axes, in HCIL Technical Report n° 99-03, ACM, 1999
218
FONTI
Spoerri Anselm, InfoCrystal: A visual tool for information retrieval & management, ACM, 1993 Stab Christian, Nazemi Kawa, Breyer Matthias, Burkhardt Dirk e Kohlhammer Jörn, Semantics visualization for fostering search result comprehension, in Lecture Notes in Computer Science, volume 7295, Springer Berlin Heidelberg, 2012, p. 633-646 Stefaner Moritz, Projection techniques for document maps, Tesi di laurea, University of Osnabrück, 2005 Stefaner Moritz, Visual tools for the socio–semantic web, Tesi di laurea magistrale, University of Applied Sciences Potsdam, 2007 Tufte Edward, The Visual Display of Quantitative Information, Graphics Press, Cheshire, 2001 Vuarnoz Patrick, StudyScape, Tesi di laurea, Hochschule für Gestaltung und Kunst, Zurigo, 2005 White Howard e McCain Katherine, Visualizing a discipline: an author co-citation analysis of information science, 1972–1995, in Journal of the american society for information science, volume 49 - n° 4, John Wiley & Sons, 1998, p. 327–355 White Ryen e Roth Resa, Exploratory search: beyond the query–response paradigm, in Synthesis lectures on information concepts, retrieval, and services, Morgan & Claypool Publishers, 2009 Wilson Max, Kules Bill, Schraefel M. C. e Shneiderman Ben, From keyword search to exploration: designing future search interfaces for the Web, in Web Science, volume 2 - n°1, 2010, p. 1–97 Zamir Oren, Visualization of search results in document retrieval systems, University of Washington, SIGTRS Bulletin, 1998
219
SITI WEB
AFlow http://aflow.tv/ Andrews Keith: information visualization lectures http://courses.iicm.tugraz.at/ivis/ivis.pdf Bible Cross Reference http://www.chrisharrison.net/index.php/ Visualizations/BibleViz Citeology http://www.autodeskresearch.com/projects/citeology D-Library http://rice.iuav.it/ Eigenfacor score http://www.eigenfactor.org/motion/ Facebook Graph Search https://www.facebook.com/about/graphsearch Jer Thorp http://blog.blprnt.com/ Max Plank Research Networks http://max-planck-research-networks.net/ Moritz Stefaner http://stefaner.eu/ Nuovo Soggettario - Biblioteca Nazionale di Firenze http://thes.bncf.firenze.sbn.it/ricerca.php Poetry on the Road http://www.poetry-on-the-road.com/
220
FONTI
Processing.js http://processingjs.org/ Science Archive http://www.popsci.com/content/wordfrequency#internet Search Patterns http://searchpatterns.org/ SemaVis http://www.semavis.net/ The Noun Project http://thenounproject.com/ Total Interaction http://www.munterbund.de/visualisierung_ textaehnlichkeiten/essay.php Two Sides of the Same Story http://blog.blprnt.com/blog/blprnt/two-sides-of-thesame-story-laskas-gladwell-on-cte-the-nfl UXCamp Berlin 2013 http://www.uxcampeurope.org/ Visual Complexity http://www.visualcomplexity.com/ Well-Formed Eigenfactor http://well-formed.eigenfactor.org/
221
Font testo e bibligrafia Unit Slab Pro (Regular, Regular Italic) corpo 10 pt interlinea 13 pt Font didascalie e note Unit Slab Pro (Regular, Regular Italic) corpo 8 pt interlinea 11 pt Font titoli e numeri di pagina Unit Slab Pro (Light) corpo 12 - 16 pt interlinea 18 pt Font sottotitoli Unit Slab (Regular) corpo 10 pt interlinea 13 pt Software Adobe InDesign CS6 Adobe Illustrator CS6 Adobe Photoshop CS6
3.2
UNIVERSITÀ IUAV DI VENEZIA FACOLTA’ DI DESIGN E ARTI
DICHIARAZIONE DI CONSULTABILITA’ O NON CONSULTABILITA’ DELLA TESI DI LAUREA (da inserire come ultima pagina della tesi di laurea) Ornella Giau 273074 Il/La sottoscritto/a ………………………………………….matr. n. ...…………….
Design laureando/a in ………………………………………………... II Settembre 2013 2012/2013 sessione ………………………… dell’a.a. …………….………….
DICHIARA
che la tesi di laurea dal titolo: Quadra: esplorazione visiva di database e biblioteche digitali …………………………………………………………………………………………. ………………………………………………………………………………………….
è consultabile da subito potrà essere consultata a partire dal giorno ………………….. non è consultabile (barrare la casella della opzione prescelta)
data …………………..
firma ………………………
Link al prototipo: http://www.ornellagiau.com/ quadra