Costruire il Data Warehouse Testuale

Page 1

LA TECHNOLOGY TRANSFER PRESENTA

BILL INMON COSTRUIRE IL DATA WAREHOUSE TESTUALE ROMA 10-11 MAGGIO 2010 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231

info@technologytransfer.it www.technologytransfer.it


COSTRUIRE IL DATA WAREHOUSE TESTUALE

DESCRIZIONE Per anni le decisioni aziendali sono state prese sulla base di dati trovati nei sistemi basati sulle transazioni. I dati orientati alle transazioni si adattano bene agli standards dei Database Management Systems perché la struttura dati del database è ripetitiva e ogni occorrenza dei dati ha la stessa struttura di tutte le altre occorrenze dei dati nella tabella. Ma in azienda c’è un’altra vitale e importante sorgente di dati che è l’informazione trovata in forma di testo. Nelle aziende ci sono molte forme di testo: emails, spreadsheets, contratti, autorizzazioni, informazioni mediche ecc. Poiché il testo non è ripetitivo, mal si adatta agli standards dei Database Management Systems. Tuttavia oggi esiste l’ETL testuale e l’abilità di costruire databases e Data Warehouses che contengono informazione testuale. Quando i dati testuali sono in grado di essere trasformati in modo tale che il testo può essere collocato in un tradizionale Database Management System, ecco che si sono create nuove opportunità per l’analisi e il Decision Making. Questo seminario/workshop spiega quello che è richiesto per creare il Data Warehouse Testuale e non strutturato.

PARTECIPANTI Il seminario/workshop si rivolge a Professionisti che sono interessati a produrre un database analitico partendo dal testo. In particolare si rivolge a: • Data Architects • Project Managers • Business People


PROGRAMMA PRIMA GIORNATA Una Introduzione ai Dati non Strutturati Questa presentazione mostra quali sono gli aspetti problematici dei dati non strutturati, le possibilità e le opportunità che offrono. Il partecipante verrà introdotto all’ETL testuale e alla creazione di un database non strutturato. Sono inoltre discussi ampiamente gli aspetti di integrazione. Aspetti di Integrazione Testuale Ci sono molti aspetti da considerare nell’integrazione di dati non strutturati e nella loro trasformazione. Alcuni di questi aspetti sono: • La terminologia • Le divisioni logiche parentali dei dati in un documento • Il clustering • La prossimità • Il filtraggio di dati non necessari Questi e molti altri aspetti saranno discussi nel contesto di leggere in testo grezzo e creare un possibile database analitico. Forme di Testo Uno dei maggiori problemi dell’ETL testuale è quello della forma di testo grezzo che deve essere processato. Qualche testo è ben formato nel senso di scritto in modo appropriato con nomi, verbi preposizioni, ecc. Ma altro testo è, per esempio, in formato IM (Instant Message). Infatti ci sono molte forme di testo e per fare un ETL testuale efficace bisogna tener conto di tutte le forme di testo.

Spreadsheets Un caso speciale è quello di leggere spreadsheets Excell. La lettura fisica di uno spreadsheet Excell non è difficile, ma l’interpretazione del significato di molte celle è completamente un’altra storia. Inoltre gli spreadsheets Excell sono un’altra sorgente valida di informazione testuale. Indici Diversi I risultati dell’ETL testuale sono diversi. L’ETL testuale produce molte forme differenti di indirizzamento basate sul tipo di documento che è stato processato. Fra i diversi tipi di indice citiamo: • Indice di parola specificata dall’utente • Indici di dati fratturati • Indice named value • Indice di dati fratturati e semistrutturati • Indice named value e semistrutturato • Document Metadata index • Indice composto da un merge fra dati fratturati e named value Ciascuno di questi tipi di indice verrà discusso e saranno spiegati il loro uso e le loro peculiarità.

SECONDA GIORNATA Workshop Si svolgeranno tante esercitazioni che produrranno una varietà di databases/Data Warehouses usando molte caratteristiche dell’ETL testuale. I partecipanti osserveranno e parteciperanno alla trasformazione del testo in un database pronto per il processing analitico. Il workshop comincia esaminando qualche dato testuale. Dopo verrà discussa una strategia per catturare e organizzare il testo. Quindi si continua effettuando dinamicamente diversi tipi di processing. Fra i tipi di processing citiamo: • La cattuta dei Metadati • Il frazionamento del documento • Named value indexing • Indirizzamento semplice • Indirizzamento semi strutturato • Merged indexing In dipendenza dei dati testuali che sono stati selezionati verranno creati e scelti alcuni tipi di indici. Durante il workshop verranno usate molte delle features di ETL. Alla fine del workshop i partecipanti potranno processare alcuni documenti che si sono portati per vedere quale tipo di processing ETL testuale possono usare.


INFORMAZIONI € 1200 (+iva) La quota di partecipazione comprende documentazione, colazioni di lavoro e coffee breaks.

LUOGO Roma, Residenza di Ripetta Via di Ripetta, 231

DURATA ED ORARIO 2 giorni: 9.30-13.00 14.00-17.00

MODALITÀ D’ISCRIZIONE Il pagamento della quota, IVA inclusa, dovrà essere effettuato tramite bonifico, codice Iban: IT 34 Y 03069 05039 048890270110 Banca Intesa Sanpaolo S.p.A. Ag. 6787 di Roma intestato alla Technology Transfer S.r.l. e la ricevuta di versamento inviata insieme alla scheda di iscrizione a: TECHNOLOGY TRANSFER S.r.l. Piazza Cavour, 3 00193 ROMA (Tel. 06-6832227 Fax 06-6871102) entro il 26 Aprile 2010 Vi consigliamo di far precedere la scheda d’iscrizione da una prenotazione telefonica.

È previsto il servizio di traduzione simultanea

BILL INMON COSTRUIRE IL DATA WAREHOUSE TESTUALE

CONDIZIONI GENERALI In caso di rinuncia con preavviso inferiore a 15 giorni verrà addebitato il 50% della quota di partecipazione, in caso di rinuncia con preavviso inferiore ad una settimana verrà addebitata l’intera quota. In caso di cancellazione del seminario, per qualsiasi causa, la responsabilità della Technology Transfer si intende limitata al rimborso delle quote di iscrizione già pervenute. SCONTI DI GRUPPO Se un’azienda iscrive allo stesso evento 5 partecipanti, pagherà solo 4 partecipazioni. Chi usufruisce di questa agevolazione non ha diritto ad altri sconti per lo stesso evento. ISCRIZIONI IN ANTICIPO I partecipanti che si iscriveranno al seminario 30 giorni prima avranno uno sconto del 5%.

Quota di iscrizione: € 1200 (+iva)

Ai sensi dell’art. 13 della legge n. 196/2003, il partecipante è informato che i suoi dati personali acquisiti tramite la scheda di partecipazione al seminario saranno trattati da Technology Transfer anche con l’ausilio di mezzi elettronici, con finalità riguardanti l’esecuzione degli obblighi derivati dalla Sua partecipazione al seminario, per finalità statistiche e per l’invio di materiale promozionale dell’attività di Technology Transfer. Il conferimento dei dati è facoltativo ma necessario per la partecipazione al seminario. Il titolare del trattamento dei dati è Technology Transfer, Piazza Cavour, 3 - 00193 Roma, nei cui confronti il partecipante può esercitare i diritti di cui all’art. 13 della legge n. 196/2003.

nome ...................................................................... cognome ................................................................ funzione aziendale .................................................

Roma 10-11 Maggio 2010 Residenza di Ripetta Via di Ripetta, 231

TUTELA DATI PERSONALI

QUOTA DI PARTECIPAZIONE

Timbro e firma

azienda .................................................................. partita iva ............................................................... codice fiscale ......................................................... indirizzo ..................................................................

In caso di rinuncia o di cancellazione dei seminari valgono le condizioni generali riportate sopra.

città ........................................................................ cap ......................................................................... provincia ................................................................ telefono .................................................................. fax ..........................................................................

È previsto il servizio di traduzione simultanea

e-mail .....................................................................

Da restituire compilato a: Technology Transfer S.r.l. Piazza Cavour, 3 - 00193 Roma Tel. 06-6832227 - Fax 06-6871102 info@technologytransfer.it www.technologytransfer.it


DOCENTE Bill Inmon, esperto rinomato in tutto il mondo, speaker e autore di Data Warehousing, è riconosciuto internazionalmente come “il padre del Data Warehousing”. È anche il creatore della Corporate Information Factory e più recentemente della Government Information Factory. Ha più di 35 anni di esperienza nella tecnologia database. Come autore, Mr. Inmon ha scritto più di 650 articoli tecnici e 46 libri tradotti in molte lingue. Fa consulenze per molte importanti aziende offrendo servizi di Data Warehouse Design e di Database Management.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.