Università degli Studi di Modena e Reggio Emilia Facoltà di Scienze della comunicazione e dell’economia
Alla ricerca del libro perduto Google book search
di Simone Strozzi 10 – settembre – 2007
Realizzato nell’ambito dell’insegnamento di Dati e testi on-line tenuto da Corrado de Francesco per il corso di Laurea specialistica in Nuovi media e comunicazione multimediale (Reggio Emilia marzo-maggio 2006).
Alla ricerca del libro perduto Google book search
titolo: Alla ricerca del libro perduto. Google book search autore: Strozzi Simone e-mail 22978@unimore.it sommario Letteratura liquida ..............................................................................................2 Biblioteca globale ...........................................................................................2 Google book search ............................................................................................4 La storia ........................................................................................................4 Come funziona ...................................................................................................6 Da dove provengono i libri visualizzati? ........................................................... 6 La ricerca ......................................................................................................7 Come ci appaiono i volumi? ............................................................................ 8 Cosa possiamo fare ...................................................................................... 13 Ipotesi di sviluppo ............................................................................................ 14 Passaggi necessari ....................................................................................... 14 Utilità .......................................................................................................... 15 Scenari ........................................................................................................ 15 Riferimenti ....................................................................................................... 16 Siti .............................................................................................................. 16 Articoli......................................................................................................... 16 Altro materiale ............................................................................................. 16
abstract Il futuro del libro passa attraverso Internet. L’ambizioso progetto di Google di creare una biblioteca contenete tutti i volumi al mondo e renderli immediatamente fruibili è destinato a cambiare le regole del mercato librario e a rivoluzionare il rapporto con l’oggetto libro. Quali partner ha al suo fianco? Quali sono le insidie? Che cos’è, allo stato attuale, Google book search? keyword digital library copyright eBook
parole chiave biblioteca digitale diritto d’autore libro elettronico
data: 10 settembre 2007
p. 1
Alla ricerca del libro perduto Google book search
Letteratura liquida Biblioteca globale Una biblioteca immediatamente consultabile tramite Internet, accessibile a tutti, che contenga tutti i libri del mondo? Non è fantascienza. Le grandi realtà dot.com si sfidano con progetti diversi. La creazione di una biblioteca globale è un progetto ambizioso, destinato a cambiare le abitudini di produzione, acquisto, fruizione del libro. Sono in molti a prevedere una rivoluzione simile a quella musicale: la possibilità di scaricare su un “lettore” digitale apposito, il libro preferito, magari dopo averne letto l’anteprima, smaterializzando l’oggetto libro così come sta avvenendo per il cd musicale. Quali vantaggi? La scannerizzazione e la conseguente gestione del libro in formato digitale scongiura l’usura del tempo, agevola il processo di indicizzazione facilitando la ricerca dei volumi, apre a nuove possibilità di fruizione. A che punto siamo Per le opere di pubblico dominio ci sono gia realtà importanti come il Gutenberg Project o la nascente Open Library. Google ha sviluppato, per il momento ancora in versione Beta, il progetto “Google book search”, motore di ricerca per libri che mira alla digitalizzazione di tutti i volumi esistenti, per renderli in seguito immediatamente disponibili alla visualizzazione on line da parte degli utenti. Un progetto ambizioso e di sicura utilità, non privo di problemi. Non sono certo problemi tecnologici, Google si può permettere le migliori menti e le migliori tecnologie al mondo, ma che riguardano i diritti d’autore delle opere. Gli editori, memori della sorte toccata al settore musicale e cinematografico, sospettano violazioni di copyright, sviluppo della pirateria e conseguente calo drastico delle vendite. Google risponde che solamente le opere di pubblico dominio sono scaricabili o interamente consultabili, mentre per quelle soggette a copyright la visualizzazione riguarda solo un numero limitato di pagine. Così facendo, secondo Google, non solo non si viola il copyright ma anzi si incrementano le vendite dando la possibilità all’utente di trovare facilmente un li-
p. 2
Alla ricerca del libro perduto Google book search
bro e di poterlo consultare parzialmente, indicandogli dove lo si può acquistare. E-book Versione digitale di un libro. “È errato confondere un qualunque documento in formato digitale con un e-Book, dato che l'e-Book non si limita a presentare la sostanza del documento cartaceo ma cerca anche di replicarne la forma, in modo da rendere la lettura il più possibile simile a quella che si avrebbe sfogliando le pagine di un libro.[…] tutte le azioni che in un normale libro cartaceo sono immediate e scontate, come ad esempio, lo scorrere le pagine o l'inserimento di un segnalibro devono essere opportunamente emulate dal software.” Fonte: Wikipedia (30.08.2007)
Il mercato degli e-Book è inevitabilmente legato allo sviluppo dei reading device (strumenti che permettono la lettura degli eBook). In 2005, the last year for which full annual statistics are available, digital copies of books brought in a measly $12 million. That's less than 0.5% of the $25 billion generated by the industry that year,according to the Association of American Publishers (AAP). Fonte: Catherine Holahan, Business Week, 23.01.2007
Nonostante le cifre siano ancora modeste, le grandi case di produzione di hardware sembrano disposte a rischiare. Hopes for e-books began to revive last year with the introduction of the widely marketed Sony Reader. […] the size of a trade paperback, has a six-inch screen, enough memory to hold 80 books and a battery that lasts for 7,500 page turns, according to the company. It uses screen display technology from E Ink, a company based in Cambridge, Mass., that emerged from the Media Lab at the Massachusetts Institute of Technology and creates power-efficient digital screens that uncannily mimic the appearance of paper. Fonte: Brad Stone, The New York Times, 05.09.2007
Anche Ron Hawkins (vice president for portable reader systems at Sony) non ha dubbi a riguardo: “Digital readers are not a replacement for a print book; they are a replacement for a stack of print books” (The New York Times).
p. 3
Alla ricerca del libro perduto Google book search
Google book search La storia 2002 “How long would it take to digitally scan every book in the world?” E’ la domanda che si pone un piccolo gruppo di ricercatori Google quando inizia a sviluppare l’idea di una biblioteca globale, ispirandosi a grandi progetti di digitalizzazione come American Memory, Project Gutenberg, the Million Book Project e Universal Library, per meglio organizzare il lavoro. 2004 Il team Google visita la Bodleian library all’ Oxford University formalizzando un accordo per la digitalizzazione di più di un milione di opere non protette da copyright del IX secolo, in tre anni. In ottobre debutta alla fiera del libro di Francoforte il progetto “Google Print” con l’annuncio dei fondatori Larry Page e Sergey Brin. Circa quindici editori si uniscono al progetto tra cui Blackwell, McGraw-Hill, Penguin, Perseus, Princeton University Press. In Dicembre nasce “Library Project”che coinvolge importanti biblioteche di università come Harvard, Michigan, Oxford, Stanford e la New York Public Library per un totale di circa 15 milioni di volumi. 2005 “Google Print” sbarca in Europa e apre a possibili accordi con partner di diversi paesi: Austria, Spagna, Italia, Belgio, Olanda, Germania, Francia e Svizzera. Iniziano però i problemi con i libri protetti da copyright: l’ Association of American Publishers (AAP) richiede di bloccare per sei mesi la digitalizzazione delle opere protette da copyright in attesa di spiegazioni convincenti su Google Library (i libri scannerizzati da biblioteche). Anche per questi motivi Google decide di cambiare nome al progetto: nasce “Google book search” che definisce meglio l’utilizzazione del motore di ricerca. “Google Print” diffondeva l’idea errata della possibilità di stampare interamente tutti i volumi visualizzati. 2007 Per le opere di pubblico dominio, “Google book search” offre la possibilità, oltre che di scaricare l’intera opera, anche di visualizzarla direttamente on line in formato testo, consentendo il copia incolla.
p. 4
Alla ricerca del libro perduto Google book search
Fig.1 – Google, i libri a portata di mouse
Piattaforma per e-book? Attualmente “Google book search” non ha una piattaforma di vendita e non visualizza i volumi composti direttamente in versione elettronica per i quali non esiste la versione cartacea. Vengono digitalizzati solo volumi a partire dal supporto cartaceo. L’autorevole New York Times ipotizza i prossimi sviluppi “Google plans to start charging users for full online access to the digital copies of some books in its database, according to people with knowledge of its plans. Publishers will set the prices for their own books and share the revenue with Google. Fonte: Brad Stone, The New York Times 05.09.07
Non solo la visualizzazione on line a pagamento dei libri, ma anche la possibilità di scaricarli direttamente su diversi device, un po’ come si fa adesso per i brani musicali. “Book publishers also seem to be preparing for the kind of disruption that hit the music business when Apple introduced the symbiotic combination of the iPod and its iTunes online service” Fonte: Brad Stone, The New York Times, 05.09.2007
p. 5
Alla ricerca del libro perduto Google book search
Come funziona Da dove provengono i libri visualizzati? Sono due le fonti da cui Google attinge volumi: Editori – “Partner Program” Biblioteche “Library Project” Editori A seconda del tipo di autorizzazione concesso dall’editore “Google book search” visualizza il libro in diverse tipologie: Anteprima non disponibile, con la visualizzazione delle sole informazioni di base del volume. Visualizzazione frammento (snipped view), che riporta alcune frasi circostanti il termine cercato Visualizzazione limitata (limited view), con la possibilità di vedere alcune pagine complete del libro. visualizzazione completa (full view) del volume se non protetto da copyright Inoltre, in qualsiasi momento l’editore può scegliere di rimuovere il volume da “Google book search”. Il “Partner Program” consente all’editore di avere una promozione gratuita dei propri titoli grazie alla presenza di link al proprio sito, a quello di librerie e a negozi on line per l’acquisto. Biblioteche Le biblioteche aderenti a “Library Project” sono in continuo aumento, molte delle quali di grande prestigio. “Lo scopo del Progetto Biblioteche è semplice: aiutare gli utenti nella ricerca di libri pertinenti, in particolare quelle opere che sarebbero altrimenti introvabili, come i libri fuori stampa, rispettando allo stesso tempo il copyright di autori ed editori” Fonte: Google ricerca libri (30.08.2007)
Anche in questo caso si possono trovare libri protetti da copyright la cui visualizzazione sarà limitata a frammenti di testo e informazioni di base sul volume. Per i libri non soggetti al copyright la visualizzazione sarà completa, sia in formato immagine sia in formato testo, unitamente alla possibilità di effettuare il download del volume.
p. 6
Alla ricerca del libro perduto Google book search
Fig. 2 – Biblioteche coinvolte in “Library Project”
La ricerca Google style La pagina di ricerca libri utilizza la stessa impaginazione tipica di tutti gli altri servizi Google, cioè un bassissimo clutter (percentuale di spazio occupata da testo e immagini). Fig. 3 – Homepage “Google book search”
Fonte: Google book search
http://books.google.com
L’ “advanced search” offre la possibilità di selezionare tra quale tipo di visualizzazione cercare il volume. All books Limited preview. Visualizzazione limitata ad alcune pagine del libro. All’interno di questo tipo di ricerca si trovano anche vo-
p. 7
Alla ricerca del libro perduto Google book search
lumi visualizzati tramite “snipped view”, che mostra la sola pagina informativa del volume. Full view. Visualizzazione dell’intero libro. Library catalogs. In questo caso attraverso il software WorldCat appariranno i link delle biblioteche che contengono la versione cartacea del volume cercato.
Fig.4 – “Advanced search” e visualizzazione risultati “Library catalogs”
Fonte: Google book search
http://books.google.com
Oltre alla scelta della visualizzazione, si possono scegliere diversi criteri di ricerca: Titolo Autore Editore Soggetto Data di pubblicazione Codice ISBN
Come ci appaiono i volumi? Full view Per i libri non più soggetti a copyright la visualizzazione è completa con la possibilità di leggere tutte le pagine.
p. 8
Alla ricerca del libro perduto Google book search
Fig.5 – Divina commedia
Fonte: Google book search
http://books.google.com
Alla sinistra della schermata che mostra il volume, c’è sempre una colonna che presenta diversi link. “About this book”: informazioni generali sul volume “Write review”: possibilità di scrivere la recensione “Review”: recensioni già presenti in Rete sul volume. “Add to my library”: si può aggiungere, previa registrazione, il libro alla propria “Library” on line “Contents”: link alle varie sezioni interne al volume “Popular passages”: vengono visualizzati i brani del volume più citati da parte di altri autori in altri volumi. “Buy this book”: collegamenti ai negozi on line per l’acquisto (Amazon.com, Burners&Noble, Booksense.com) “Search in this book”: ricerca i termini all’interno del volume “Publisher info”: link al sito web dell’editore.
p. 9
Alla ricerca del libro perduto Google book search
Fig 6 – Link
Fonte: Google book search
http://books.google.com
Per i volumi non protetti da copyright c’è la possibilità di visualizzare il volume in formato testuale (“view plain text”) permettendo il copia-incolla di parti di testo oppure scaricare l’intera opera (“download”) in formato pdf. Fig. 7 – Da immagine a testo
Fonte: Google book search
http://books.google.com
Una nuova funzionalità, solo per testi non soggetti al diritto d’autore, permette di selezionare una parte del testo e gestirla sia in formato immagine che testuale.
p. 10
Alla ricerca del libro perduto Google book search
Limited preview Solo alcune pagine sono visualizzabili, in base all’accordo con l’editore. Le pagine sono visualizzate come immagini e non è possibile ne selezionare parti testuali ne scaricare l’opera. All’interno delle pagine, in basso a destra, è presente la scritta “Copyrighted material”. Fig. 8 – Collected tales and poems of Edgar Allan Poe
Fonte: Google book search
http://books.google.com
Snipped view Visualizza solamente tre frammenti di testo. Non ci sono pagine visualizzabili e i tre frammenti testuali vengono proposti all’interno della pagina informativa “About this book”. Fig. 9 – Snipped view
Fonte: Google book search
http://books.google.com
p. 11
Alla ricerca del libro perduto Google book search
Fig. 10 – Visualizzazione della pagina “about this book” L’immagine mostra come si struttura la pagina delle informazioni generali riguardanti il volume. Il box in alto alla pagina contiene un breve sommario con il nome dell’autore, dell’editore e spesso sia la data di pubblicazione che quella di digitalizzazione. Molti box contengono link già presenti nella pagina di visualizzazione dell’opera come “other editions” e “search in this book” e quelli riguardanti le recensioni. Inoltre sono presenti link a pagine web ed altri volumi che contengono i termini cercati.
Fonte: Fonte: Google book search
http://books.google.com
Sinergia Mentre leggiamo un libro tutti viaggiamo con la mente all’interno dei luoghi descritti, lavorando d’immaginazione. Fig. 11 – “Book search” + “Maps”
Fonte: Google book search
http://books.google.com
p. 12
Alla ricerca del libro perduto Google book search
Ora non serve più, grazie all’interazione tra “Google book search” e “Google Maps”. In alcuni libri digitando “about this book”, entrando così all’interno della pagina informativa, si trova un box (“Place mentioned in this book”) con cartina geografica che mostra tutti i luoghi citati all’interno dell’opera e il numero di pagina in cui si trovano.
Cosa possiamo fare Sintetizziamo quali operazioni sono possibili con “Google Book serach”. Fig.12 – Operazioni possibili in base alla tipologia del volume
Informazioni generali sul volume Sfogliare pagine
Visualizzazione intero volume Selezionare parti del testo – copia/incolla Download in pdf dell’intera opera Acquisto del volume
Volumi soggetti a copyright
Volumi di pubblico dominio
Si
Si
In base all’accordo con l’editore
Si possono sfogliare tutte le pagine del volume
No. Sono visualizzabili le solo le pagine concesse dall’editore
Si
No
Si
No
Si
No
No
p. 13
Alla ricerca del libro perduto Google book search
Ipotesi di sviluppo Passaggi necessari Editori Il rapporto con gli editori sarà fondamentale per lo sviluppo del motore. Il sospetto delle case editrici verso il libro digitale è in parte condivisibile se si guardano altri settori più sviluppati in questo ambito (musicale e cinematografico), dove la pirateria rappresenta un problema. Credo, però, che “Google Book search” porti con sé più opportunità che problemi. Permette la comoda consultazione dei volumi, l’opportunità di trovare libri altrimenti difficili da scovare, ci indica dove possiamo comprarli e in quali biblioteche tradizionali consultarli in formato cartaceo. Tutto questo non può che giovare alle vendite degli editori, offrendogli strumenti di promozione gratuiti. Inoltre, “Google book search” offre pagine dedicate all’editore per la gestione dei propri volumi con diverse funzioni tra le quali quella opt-out che permette all’editore di eliminare immediatamente il proprio volume dalla googleteca. Scannerizzazione I libri soggetti a copyright vengono visualizzati in formato immagine perdendo in qualità. Questo problema non si presenta con i volumi visualizzati completamente, nei quali c’è la possibilità di scegliere il formato testuale. Un altro problema riguarda i libri molto antichi presenti all’interno delle biblioteche: il processo di scannerizzazione potrebbe rovinare il volume e quindi questi volumi non vengono digitalizzati. E’ auspicabile, in linea generale, che Google migliori la qualità della digitalizzazione dei volumi. Google over the world E’ fondamentale che “Google book search” coinvolga più paesi garantendo sempre maggiore varietà linguistica. In questo senso qualcosa è già stato fatto: in poco più di un anno si è passati da 5 prestigiose università americane a 17, coinvolgendo diversi soggetti fuori USA: Bavarian State Library, Ghent University Library, Keio University Library, University Complutense of Madrid, University Library of Lausanne.
p. 14
Alla ricerca del libro perduto Google book search
Utilità Didattica La possibilità odierna di scaricare gratuitamente testi o parti testuali di pubblico dominio e la possibilità futura che questo avvenga (a pagamento) anche ai libri protetti da copyright non può che facilitare il lavoro didattico. Biblioteche La digitalizzazione gratuita da parte di Google consente alle biblioteche di avere copie digitali dei volumi per usi interni. Lettori Attraverso “Google book search” gli utenti possono consultare i volumi trovando quelli che più gli interessano o scoprirne di nuovi, favorendo così l’acquisto. Inoltre con lo sviluppo di una possibile piattaforma di vendita si potranno scaricare direttamente i volumi senza dover aspettare le spedizioni.
Scenari Piattaforma e-Book Come già si accennava in precedenza, pareri autorevoli prevedono per “Google book search” un futuro da piattaforma di vendita per libri digitali. “We are working on a platform that will let publishers give readers full access to a book online.” Fonte: Jens Redmer, direttore Google Book Search per l’Europa, Timesonline, 21.01.2007
I libri di pubblico dominio rimarranno visibili e scaricabili gratuitamente mentre per il “copyrighted material” gli editori potrebbero fissare un prezzo per il download dividendo con Google una percentuale dei ricavi. Utilissima sarebbe la possibilità di scaricare anche solo le parti che ci interessano del volume pagando una percentuale del costo totale del volume. Questi sviluppi si legano inevitabilmente al mondo dell’hardware, cioè alla diffusione degli strumenti per la lettura degli e-Book (e-Book digital device). Un futuro, quello del libro, che sembra percorra la strada già battuta dalla musica, con la possibilità di scaricarci album (ma anche semplici canzoni) all’interno di lettori mp3.
p. 15
Alla ricerca del libro perduto Google book search
Riferimenti Siti GOOGLE BOOK SEARCH
http://books.google.com Motore di ricerca per libri ancora in versione Beta (di prova). Progetto sviluppato a partire dal 2004 da parte del team Google con l’intenzione di creare una biblioteca globale immediatamente consultabile da chiunque. Nel corso di tre anni ha visto crescere il numero di partner aderenti.
GOOGLE RICERCA LIBRI
www.google.it/books
Versione italiana del motore di ricerca per libri.
WIKIPEDIA
http://it.wikipedia.org Enciclopedia libera on line sviluppata con il contributo degli stessi utenti.
Articoli “The New York Times” Envisioning the Next Chapter for Electronic Books
“Times” Google plots e-books coup
“BusinessWeek” Google Download: No iTunes for Books
“Il sole 24 ore” Microsoft contro Google: “Viola sistematicamente il copyright”
Altro materiale Luci e ombre di Google. Futuro e passato dell’industria dei metadati
p. 16