Paolo Calvetti
L’uso di corpora bilanciati nella compilazione di dizionari bilingui. Il caso del progetto del grande dizionario giapponese-italiano
Introduzione Lo sviluppo di software dedicato al trattamento di dati testuali, la presenza di computer sempre più potenti e veloci, e la creazione, per le principali lingue nazionali, di banche-dati testuali di ampie dimensioni, hanno determinato negli ultimi decenni un’attenzione maggiore per le potenzialità della “linguistica dei corpora” (corpus linguistics) sia in ambito teorico, sia nei suoi usi pratici nella didattica delle lingue straniere, nella traduzione automatica, nella lessicografia. Nel caso della lingua giapponese, grazie alle iniziative di istituti di ricerca di eccellenza,1 sono stati realizzati corpora linguistici di dimensioni notevoli, comparabili al British National Corpus (BNC), al Corpus di Italiano Scritto contemporaneo (CORIS/CODIS), al Corpus de Referencia de la Lengua Española Contemporánea (CREA) o al Corpus Storage, Maintenance and Access System (COSMAS) dell’Institut für Deutsche Sprache. L’utilizzazione di tali risorse può essere di grande aiuto anche per la compilazione di dizionari bilingui, permettendo un agevole reperimento di esempi testuali da inserire nelle fraseologie esemplificative dei lemmi e facilitando lo studio delle collocazioni lessicali, particolarmente importanti in quei dizionari bilingui destinati a fruitori che non siano madrelingua dell’idioma di partenza, quale è il caso di un dizionario giapponese-italiano destinato a lettori italiani. In precedenza, presentando il Progetto del Grande Dizionario Giapponese-Italiano, vi è stata occasione di descrivere lo stato della lessicografia bilingue italiano-giapponese2 e lamentare la carenza di dizionari raffinati che possano venire incontro alle sempre più articolate necessità di quanti in Italia utilizzano il giapponese per motivi di studio, lavoro, ricerca. Non è quindi necessario ritornare in questa sede sull’argomento. Vale piuttosto la pena di chiarire brevemente i vantaggi della linguistica dei corpora e soffermarsi sui progressi del trattamento dei dati testuali della lingua giapponese, per analizzare le potenzialità che questa metodologia può avere anche nel campo della lessicografia bilingue.
1
Basti ricordare il Departement of Corpus Linguistics del National Institute for Japanese Language and Linguistics (Kokuritsu Kokugo Kenkyūjo) di Tokyo o il Computational Linguistics Laboratory del NAIST (Nara Sentan Kagaku Gijutsu Daigakuin Daigaku) di Nara. 2 Paolo Calvetti, “Perché un nuovo dizionario giapponese-italiano”, in Luisa Bienati e Matilde Mastrangelo (a cura di), Un’isola in Levante. Saggi sul Giappone in onore di Adriana Boscaro, ScriptaWeb, Napoli 2010, pp. 389-403.