Introduction LES NOMS DE FAMILLE CORSES EXISTENT-ILS ?
La grande similitude entre les systèmes anthroponymiques corse et italien se traduit notamment par le fait que les noms de famille ont souvent la même forme des deux côtés de la mer Tyrrhénienne. Cela n’est pas surprenant étant donné les affinités au plan historique, linguistique et culturel, et surtout la formation de ce système sous l’égide de l’administration toscane, puis génoise (qui a utilisé le toscan comme langue officielle). L’administration française qui a suivi, n’a pas (profondément) changé les noms de famille corses devenus héréditaires et pratiquement immuables par la force de la loi. On mesure en revanche l’impact de la culture dominante sur les prénoms actuels des Corses, qui ont fini par remplacer ceux de l’époque toscane, et dont les vestiges fossilisés ne subsistent plus que dans les noms de famille insulaires. Si l’on se base sur leur forme écrite « officielle », les Corses ont porté des prénoms « latins », puis « italiens », et aujourd’hui « français ». Cela ne dit rien sur leur origine. Cela est simplement révélateur de la nature des langues (et des classes) dominantes, notamment à l’époque où les (pré)noms individuels sont devenus noms de famille. Aujourd’hui au contraire, la forme des prénoms dans la Corse française n’a plus aucune incidence sur celle des noms de famille. On a souvent dit et écrit, y compris dans des ouvrages sérieux, que tous les noms de famille corses se retrouvent en Italie. Cette opinion ne correspond pas tout à fait à la réalité, bien qu’elle continue à tenir le haut du pavé, notamment sur « la toile », dans les forums de discussion, déclinée dans toutes les langues. On affirme par exemple que « Tutti i cognomi che vengono portati in Corsica sono diffusi nella penisola » 1, tout en indiquant des liens vers des sites qui permettent de vérifier que le postulat ne résiste pas à l’épreuve des faits. Dire qu’un nom a la même forme en Corse et en Italie ne signifie pas forcément qu’il s’agit d’un nom italien, même si cela correspond à l’opinion majoritaire. Certains noms de famille ont la même forme en France et en Italie. 1. http://www.webzinemaker.com/admi/m6/page.php3?num_web=3988&rubr=4&id=24270
10
La légende des noms de famille
Un nom « français » comme ALBERTIN est aussi un nom « italien » (typique notamment de la Vénétie[Cb] 2). Bien que les différences de fréquence et de distribution des patronymes soient souvent significatives, ALBERTIN ou ALBERT ne sont pas forcément des noms français, et ALBERTINI n’est pas forcément un nom italien (ni corse d’Albertacce). La majeure partie des noms de famille ont en effet la même forme en Corse et en Italie : soit parce qu’ils sont effectivement d’origine italienne, soit parce qu’ils ont été « traduits » en italien ou italianisés par l’administration de l’époque. Certains auraient aujourd’hui une forme francisée si la « normalisation » ébauchée après le « rattachement à la France » avait été poursuivie. Ainsi en Corse le prénom Francescu, avec un diminutif Francischettu, a donné un nom de famille attesté sous plusieurs formes : FRANCESCHETTI (toscanisé) s’est imposé, mais on a aussi FRANCISCHETTI (avec un vocalisme corse, de même pour FRANCISCHINI, FRANCISCONI dans les actes anciens). On a aussi FRANCISQUÈS (au XVIIIe siècle dans les archives départementales des Bouches du Rhône) qui serait aujourd’hui la forme « normale » du nom de famille corse si l’administration avait poursuivi la francisation de manière cohérente (la toponymie « officielle » de l’IGN n’est pas plus logique: on a San Francescu à côté de San Francesco ou Saint-François). Si la langue officielle en Corse avait été espagnole à l’époque où les patronymes se sont fixés, on aurait des noms de famille corses hispanisants : c’est ainsi qu’au nom de famille corse SANTUCCI correspond chez certains Corses émigrés à Porto Rico la forme SANTUCHI, adaptation conforme à la graphie de l’espagnol. Il s’agit ici des « petites différences » graphiques entre langues romanes, qui peuvent aussi être plus flagrantes pour des noms de famille issus d’un lexique typiquement local (voir plus loin des cas comme MUFRAGGI, spécifiquement corse par son radical et son suffixe, et donc inconnu en Italie). Malgré les «normalisations» successives, force est de constater que 20 % des noms de famille corses ne sont pas attestés en Italie comme on le verra plus loin. À la question posée lors de l’une de nos récentes conférences 3 : (« les noms de famille corses existent-ils ? »), les participants au débat (« corsistes » convaincus, francophiles ou « citoyens du monde »), ont répondu « non » sans hésiter. Une des conséquences remarquables de ce type de préjugé est l’absence presque totale d’études sérieuses dans un domaine qui suscite pourtant un 2. Les ouvrages auxquels nous avons le plus fréquemment recours sont cités de manière abrégée par une ou deux lettres entre crochets dans le corps du texte (ex.[Cb]). Les informations complètes sont regroupées en fin d’ouvrage (=> « Abréviations bibliographiques »). 3. « Le printemps du livre 2011 », Biguglia (2B).
Introduction
11
véritable engouement. En 1951 le corse, classé comme « dialecte allogène », est exclu du bénéfice de la loi Deixonne et donc interdit d’enseignement sans que cela provoque un émoi particulier. De même, l’onomastique corse n’est encore l’objet d’aucun travail approfondi : historiquement construite sous administration toscane, on considère qu’elle est donc dépourvue de tout caractère spécifique, dès lors que « tous les noms de famille corses sont italiens » (ou que « tous les prénoms corses sont français »). Aujourd’hui, il n’est plus possible de persister dans de tels jugements sans les nuancer. Les moyens modernes d’investigation aujourd’hui disponibles grâce aux technologies modernes d’information permettent notamment de constater que de nombreux noms de famille présents dans l’annuaire téléphonique corse (c’est notre base de référence) ne figurent pas dans l’annuaire italien. Si l’on examine par exemple les 100 noms les plus fréquents dans l’île (entre 100 et 700 inscriptions dans l’annuaire corse), on constate que pour une dizaine d’entre eux, ils sont absents ou très rares (moins de 10 inscriptions) dans l’annuaire italien. Un principe essentiel de la linguistique est qu’on peut attester la présence d’un élément mais jamais son absence. Quand on constate qu’un patronyme présent en Corse n’est pas recensé dans les annuaires téléphoniques italiens on ne peut évidemment jamais être totalement sûr qu’il n’existe pas (ou n’a jamais existé) en Italie. Cependant, étant donné la diffusion du réseau des télécommunications dans l’Europe d’aujourd’hui, on a de fortes présomptions pour dire que le nom de famille en question (par exemple TERRAMORSI) est selon toutes probabilités « d’origine corse ». Nous expliquerons plus loin ce que nous entendons par « nom d’origine corse ». Une base de données constituée aujourd’hui à partir de la liste des abonnés au seul téléphone fixe serait un peu moins fiable, en raison de l’évolution du paysage des télécommunications (présence de nouveaux opérateurs, progression du téléphone mobile). Certains noms apparaissent, d’autres disparaissent. On peut cependant raisonnablement supposer que les éléments statistiques ne s’en trouvent pas encore bouleversés, comme le pensent aussi les auteurs du récent dictionnaire des noms de famille italiens[Cb], qui exploite les « pagine gialle » de 1999-2000 4. 4. La fonte del dizionario sono i titolari di utenze telefoniche fisse di Seat-Pagine Gialle relative al 1999-2000. Un dato significativo, sostiene Caffarelli, « perchè rappresenta il massimo valore Telecom. Dopo, tra cellulari, gestori concorrenti e soprattutto utenze riservate, il repertorio italiano si è dimezzato ed è assai poco attendibile. È evidente – prosegue Caffarelli – che l’anagrafe del Comune di Parma darebbe valori differenti, anche se le graduatorie dovrebbero rimanere le medesime ». (http://www.gazzettadiparma.it/primapagina/dettaglio/1/12202/ Parma_la_classifica_dei_cognomi: _Ferrari_al_primo_posto.index.htm)
12
La légende des noms de famille
UN DICTIONNAIRE (ONOMASTIQUE) CORSE ?
Généralement, les dictionnaires de noms de famille mentionnent l’étymologie et le sens de la forme de base, en se contentant de signaler une éventuelle origine toponymique, sans préciser l’origine du nom de lieu en question, en renvoyant le cas échéant à des travaux d’orientation toponymique. C’est ce que nous faisons dans le présent ouvrage, en attendant l’avènement d’ouvrages de référence qui présentent et analysent à la fois noms de famille et noms de lieux en Corse (souvent en étroite relation comme nous l’avons vu), à l’instar de ce qui a été fait pour la Sicile dans un « Dizionario onomastico[Cd] » qui inventorie et étudie les noms de personne et de lieux locaux, et se contente pour les autres de renvoyer aux dictionnaires de référence concernés. De même pour les noms de famille issus de prénoms, on peut se contenter de mentionner (quand elles existent) les formes correspondantes en français, en italien, et en corse, sans forcément indiquer l’étymologie et le sens des prénoms. Pour les noms de personne aujourd’hui rares ou disparus qui survivent dans les noms de famille, on pourra donner (quelle que soit leur origine) la forme latine ou latinisée, médiévale en général, qui a servi de base aux variantes romanes. Des noms comme CONSALVI ou GONZALES sont issus d’un nom de personne d’origine germanique qui a pénétré la Romania sous la forme latinisée Gundisalvus, Gunsalvus. Pour des noms comme LODOVICI, il semble suffisant de renvoyer aux correspondants de Ludovic sans pour autant indiquer l’étymon et le « sens » (?) que ce nom d’origine germanique avait au départ. On sait que la langue des envahisseurs (« barbares », lombards notamment), n’était déjà plus parlée au VIIIe siècle dans les pays latins, et que les porteurs de prénoms « germaniques » n’ont probablement jamais « compris » leur signification (étymologique), qui n’est d’ailleurs pas toujours claire pour les spécialistes du domaine. Nous renvoyons donc à une bibliographie abondante dans ce domaine, que nous citons au fur et à mesure en note. Les ouvrages auxquels nous avons le plus fréquemment recours sont cités de manière abrégée par une ou deux lettres entre crochets dans le corps du texte (les informations complètes sont regroupées en fin d’ouvrage, voir in fine => « Abréviations bibliographiques »). En revanche pour DEVICHI ou LOVICHI par exemple (qui font partie de la même « famille » que LODOVICI), il est utile de mentionner les variantes corses Luicu ou Divicu (prénom encore vivant « traduit » dans les actes officiels par la forme singulière Devicus) ainsi que les attestations des documents anciens (Ludivicus à Bonifacio, Ludivica à Cargese, Lodevico, Devicorso, Devicorsu en Balagne au XVIIIe siècle). Une Loviga Corsa est attestée en Sardaigne au XIVe siècle[Mb]. Les Annexes de notre partie finale présentent sous formes de tableaux un certain nombre de synthèses concernant diverses catégories de noms que nous aurons eu l’occasion d’évoquer dans le corps du texte.
Introduction
13
VERS UN « RÉPERTOIRE DES NOMS DE FAMILLE DE LA CORSE »
Dans le prolongement de notre précédente étude consacrée aux noms de lieux[Cj], le présent travail a pour but d’éclairer le domaine des noms de famille insulaires, avant une étude plus systématique à paraître (« Répertoire des noms de famille de la Corse ») qui devra s’attacher à présenter de manière ordonnée des éléments statistiques et linguistiques largement interdépendants ; à partir d’un inventaire aussi complet que possible. Voici en résumé les informations (« fiches onomastiques ») qui seront données pour chacun des noms de famille traités dans le « Répertoire » annoncé. a) Données statistiques : – Fréquence et rang en Corse ; – les 3 communes de plus grande diffusion, le nombre de communes et les arrondissements où le nom est présent ; – comparaison avec l’annuaire italien, pourcentage respectif Corse-Italie (valeur relative). *** Exemple : [¨MUFRAGGI* : Moyennement fréquent en Corse (rang 983). Présent dans 5 communes (surtout à Afa ; Sarrola Carcopino ; Villanova ; arrond. : Aj). Ne figure pas dans l’annuaire italien (%2,16~0)]. b) Données linguistiques : – variantes issues de la même base (étymon) ou formes similaires ; – catégorie et forme(s) de base (latin et/ou italien, français, corse) ; attestations (anciennes notamment) de l’aire corse ; – toponymes corses de forme ou base similaire (en graphie « officielle Ign » et corse le cas échéant) : (Aiacciu/Aghjacciu). Les informations sont ici disséminées dans le corps de l’ouvrage pour illustrer notre propos (voir notre index final) ; elles seront présentées de manière plus systématique et ordonnée dans notre prochaine publication (« Répertoire des noms de famille de la Corse »). Pour ce qui concerne le présent travail, nous donnerons au fur et à mesure et selon les besoins de notre exposé les informations onomastiques essentielles qui s’imposent concernant la base linguistique (nom de personne, toponyme, surnom…) et qui peuvent être multiples pour le même nom. Par exemple COSTA peut renvoyer à un toponyme (spécifique ou générique), et aussi à un prénom dans certaines régions du monde comme nous aurons l’occasion de le préciser plus loin. Notre index final répertorie par ordre alphabétique les formes citées, noms de famille, noms de lieux, noms individuels (prénoms), ainsi que les données statistiques essentielles (fréquence et distribution en Corse, confrontation avec les données de l’annuaire italien).
Chapitre I Les chiffres DONNÉES QUANTITATIVES Combien de noms de famille ?
« Aussi surprenant que cela paraisse, il est encore impossible aujourd’hui de se faire une idée correcte du nombre de noms de famille portés par des Françaises ou des Français. En attendant qu’un ordinateur national nous le dise, ce qui n’irait pas sans bien des inconvénients parallèles, on peut estimer qu’il se situe entre deux et trois cent mille, plus près sans doute de ce dernier chiffre ». C’est ce qu’on écrivait en 1983 1, et que nous pourrions reprendre à notre compte une trentaine d’années après. Quant à lui, l’Institut National de la Statistique et des Études Économiques (Insee) recense 1 300 000 patronymes différents à partir d’un fichier statistique contenant près de 66 millions de personnes nées en France entre 1891 et 1990. Le titre de « champion du monde de la diversité » est revendiqué par d’autres pays. La dernière publication basée sur l’annuaire du téléphone inventorie en Italie 330 000 noms de famille différents, « une extraordinaire variété sans égale en Europe »[Cb]. Ce qui peut ressembler à une « bataille de chiffres » s’explique notamment par la diversité des sources utilisées (population d’un territoire donné ou nombre d’abonnés au téléphone) ainsi que par d’autres paramètres plus ou moins pris en compte. La variation du nombre de patronymes aux différentes époques a plusieurs causes : différentes conditions socio-historiques, épidémies et guerres, mouvements de populations, etc. Les phénomènes migratoires (exode rural et immigration) concernent tous les territoires, y compris la Corse qui est l’objet de ce travail sur les noms de famille insulaires. Les modifications de l’état civil postérieures à la naissance (reconnaissance d’un enfant naturel, adoption, légitimation par mariage, changement de nom, de commune) ne sont pas prises en compte. En outre « jusqu’à la Seconde Guerre mondiale, l’accouchement a lieu le plus souvent dans la commune du 1. CELLARD J., 1983 : « Trésors des noms de famille », Paris, Belin.
16
La légende des noms de famille
domicile des parents. À partir des années 1950, l’accouchement en maternité se généralise. Ce phénomène génère un biais statistique lorsque l’on s’intéresse à l’origine géographique du nom de famille 2 ». Les sources
Les données quantitatives que nous venons d’évoquer n’ont bien évidemment qu’un caractère indicatif, c’est pourquoi on se gardera de les prendre pour argent comptant, même lorsqu’elles émanent d’Instituts officiels. Le site « Geopatronyme.com » exploite le « fichier des communes de naissance réalisé par l’Institut National de la Statistique et des Études Économiques (Insee). Créé à partir des données envoyées à l’Insee par les mairies, le fichier patronymique comptabilise pour chaque commune le nombre de naissances par patronyme ». En guise d’avertissement, il est précisé que « le fichier patronymique connaît certaines carences. L’Insee a été créée en 1946 et l’informatisation de son fichier patronymique date de 1970-1972. Aussi, les personnes nées avant 1946 et mortes avant 1970 ne figurent pas sur le fichier. Les 1,3 millions de morts de la Première Guerre mondiale et les 530 000 de la Seconde ne sont donc, par exemple, pas comptés dans les statistiques (…) Cependant, ce fichier demeure un formidable outil d’étude patronymique, riche en renseignements 3 ». Les spécialistes du domaine ont maintes fois souligné les carences des données disponibles, même quand elles émanent d’Instituts nationaux disposant des moyens du service public. Il est difficile par exemple de retracer l’évolution démographique, qui par ailleurs n’est pas ici notre centre d’intérêt. Le manque d’accessibilité est aussi un obstacle. Nous ajouterons pour notre part que les conditions financières d’obtention des données sont souvent prohibitives. Au moment où nous écrivons ces lignes, le cédérom du « fichier des noms » (avec les carences évoquées plus haut) est disponible dans la « boutique en ligne » moyennant la (modique !) somme de 1 200 euros. Pour se procurer le « fichier des prénoms », il faut ajouter 1 200 euros supplémentaires. Apparemment, la commercialisation de telles données ne pose aucun problème, contrairement aux « données statistiques détaillées pour les chercheurs » dont l’obtention requiert l’avis du « Comité du secret statistique » 4. Dans le domaine qui nous intéresse, les données ne sont donc pas exhaustives. Les fichiers de l’Insee ne recensent pas toutes les naissances ; et l’annuaire téléphonique n’est pas non plus un recensement.
2. http://www.insee.fr/fr/themes/document.asp?ref_id=11906 3. http://www.geopatronyme.com/insee.htm 4. http://www.webcommerce.insee.fr/liste.php?idFamille=6
Les chiffres
17
La consultation des annuaires téléphoniques (c’est notre principale source dans ce travail) est donc un complément indispensable, mais à manier aussi avec précaution. On sait aussi qu’une « informatisation mal maîtrisée dans les années 1980 fera également varier quelques orthographes en supprimant indûment les signes diacritiques 5 » (voir aussi plus loin notre « critique des diacritiques »). Dans notre première partie, nous commencerons par les « chiffres », en donnant quelques éléments quantitatifs indispensables, avant d’en venir aux « lettres », c’est-à-dire aux aspects linguistiques qui restent pour nous essentiels. Cela est vrai de l’onomastique en général, qui étudie les noms propres : noms de lieux (toponymie), anthroponymie (noms, prénoms, surnoms…). Bien d’autres catégories sont envisageables : noms de rues, d’animaux, etc. Nous nous intéressons ici surtout aux patronymes ou noms de famille, en référence à un corpus principal constitué par l’annuaire téléphonique (19992000) de la région Corse, en portant une attention particulière à ses relations avec l’annuaire italien. Nous aurons l’occasion d’expliciter les raisons d’une telle approche comparative, qui peuvent paraître a priori plus ou moins évidentes ou justifiées. Corse : 23 000 noms de famille différents (abonnés au téléphone)
Notre corpus de base est donc constitué par l’ensemble des abonnés au téléphone (fixe) de la région Corse en 1999-2000. L’inventaire de départ comprenait environ 125 000 inscriptions (et beaucoup de doublons). Ce nombre a été réduit à 100 000 (environ) après divers « toilettages », essentiellement en raison de la présence dans les « pages blanches » de données disparates : l’annuaire des « particuliers » ne comprend pas seulement des noms de famille mais aussi des noms génériques d’activité professionnelle ou d’autres inscriptions qu’il a fallu écarter (Urgence, Mairie, Pharmacie, Restaurant…). Une analyse plus fine serait nécessaire car il n’est pas toujours possible de distinguer si une inscription dans l’annuaire correspond au nom de famille de l’abonné ou à un nom de marque lié à une activité professionnelle. Dans l’annuaire des particuliers (« pages blanches »), Corsica correspond le plus souvent à un nom de commerce ou de société qu’on s’attend à trouver dans les « pages jaunes », mais c’est aussi un nom de famille (en Italie ou aux ÉtatsUnis par exemple). Le tri doit donc être fait au cas par cas, avec toujours un certain degré d’incertitude. Toujours avec les mêmes réserves à l’égard des chiffres (qui correspondent à un instantané représentatif mais partiel), on aboutit à quelque 23 000 noms de 5. http://fr.wikipedia.org/wiki/Nom_de_famille_en_France
18
La légende des noms de famille
famille différents pour une population (en 1999) d’environ 260 000 habitants, ce qui représente une « diversité » considérable. La fréquence relative, exprimée en pourcentage, serait d’environ 9 noms pour 100 habitants. Les ordres de grandeur mentionnés ici sont comparables avec d’autres résultats concernant la « fréquence des patronymes corses » et aboutissant à près de 22 000 noms différents dans les années 80 : « Selon l’Insee et le fichier électoral de la Corse, l’île comptait (en 1984) 21 389 noms différents 6 ». L’auteur cité liste les 50 noms les plus fréquents « avec le nombre d’abonnés France Télécom en Corse au printemps 1997 » (c’est-à-dire à quelques années près la même période que celle qui nous sert ici de référence). Bien entendu, comme c’est le cas un peu partout, il existe en Corse des noms très fréquents, qui sont portés par un grand nombre d’individus (ils tendent à se multiplier), et d’autres qui sont rares et tendent à l’être de plus en plus. En fait, le stock de noms de famille est largement similaire dans les pays de langue romane, avec toujours des spécificités locales. Nous n’insisterons pas ici sur les différences entre les divers annuaires téléphoniques, qui ont tous une certaine utilité malgré leurs inconvénients. Les listes de patronymes portés par des personnes nées en Corse (basées sur le fichier Insee) d’une part, et d’autre part celles des abonnés au téléphone de la région Corse (annuaire des Télécoms) constituent deux ensembles différents bien qu’ils se recoupent. Cependant les chiffres sont globalement comparables malgré la diversité des sources. « Il y a en Corse 19 000 noms de famille différents aujourd’hui[Pb] » affirmait-on en 2009 en citant un ouvrage paru 10 ans auparavant 7. FRÉQUENCE ET DISTRIBUTION DES NOMS DE FAMILLE EN CORSE Nord et Sud
Les données extraites des annuaires téléphoniques permettent d’observer la distribution des noms dans les 2 départements, dans les 5 arrondissements (Ajaccio ; Bastia ; Calvi ; Corte ; Sartène) et les quelque 360 communes corses. Nous n’insisterons pas ici sur le caractère indicatif des données numériques, sur leur validité limitée à la période retenue (1999-2000), et sur la nécessité de ne pas confondre l’origine familiale et la présence dans l’annuaire téléphonique ou dans l’espace géographique régional. Concernant les départements, on constate que près de 20 % des noms de famille sont présents dans les deux départements corses (20), les 80 % restants 6. http://damien.jullemier.pagesperso-orange.fr/jul/freq-patro-corse.htm 7. FORDANT L., 1999 : « L’Atlas des noms de famille en France », Paris, Archives & Culture.
Les chiffres
19
étant limités à un seul département : 40 % en Corse-du-Sud (2A) ; 40 % en Haute-Corse (2B) environ. Dép.
Nom
(%)
20
3 854
17
2A
9 809
42
2B
9 674
41
23 337
100
Total
Communes et arrondissements
Dans le cadre de la présente étude, nous renonçons à donner systématiquement la liste exhaustive des communes (par ailleurs consultable dans les annuaires). Comme pour ALBERTINI (117 communes), il n’était pas envisageable de le faire pour des noms comme CASANOVA (144 communes), MATTEI (128), LUCIANI (121)…, sauf à alourdir l’exposé et rendre indigestes les données présentées. On se bornera donc la plupart du temps à indiquer, outre des statistiques globales sur l’ensemble de la Corse, les arrondissements où le nom est présent, ainsi que les 3 communes où il est le plus fréquent (voir in fine les fiches statistiques simplifiées de notre « Index général des formes citées »). Par exemple : ANTOMARCHI : attesté dans les 5 arrondissements et 22 communes, surtout à Bastia ; Loreto di Casinca ; Ersa. BOCCHECIAMPE : attesté dans 4 arrondissements et 10 communes, surtout à Oletta ; Bastia ; Saint-Florent. MONDOLONI : attesté dans 4 arrondissements et 50 communes, surtout à Ajaccio ; Propriano ; Sartène. PASQUALAGGI : attesté dans 4 arrondissements et 8 communes, surtout à Ajaccio ; Cuttoli Corticchiato ; Zicavo. Nous avons vu que même en tenant compte de l’évolution à partir de 1891 (données Insee), les statistiques globales pour la Corse entière ne varient pas beaucoup. Quant à la prise en compte de l’évolution dans chacune des communes, elle serait problématique et exigerait la multiplication de monographies sur des aires et des périodes restreintes. Le domaine en question est généralement dominé par des idées reçues qui ne correspondent pas toujours à la réalité. On a tendance à confondre origine du nom et origine de la famille. Or, il est clair que le même nom peut être porté par des familles distinctes, originaires de communes de lieux distincts, en Corse et hors de Corse. C’est évidemment le cas pour les noms « polygénétiques » que nous venons de citer (ALBERTINI, CASANOVA, MATTEI, LUCIANI…)
20
La légende des noms de famille
comme pour beaucoup d’autres noms, quelle que soit leur forme écrite, qui résulte la plupart du temps d’une « normalisation » administrative (pas toujours cohérente). Le Rang
Malgré les difficultés évoquées plus haut (y compris par les instituts de statistiques), on peut observer certaines constantes dans la fréquence et la distribution des noms de famille en Corse. Les mêmes noms se retrouvent en tête du classement aux diverses époques, quelles que soient la méthode et les sources. Les 10 premiers rangs Nous présentons ci-dessous la liste des 10 premiers noms de famille classés par ordre de fréquence décroissante. Le tableau permet de comparer les données de l’Insee (naissances en Corse à partir de 1891) et celles de l’annuaire téléphonique de la Corse (1999-2000).
Rang
(A) Naissances (1891-1915)
(C) Abonnés au téléphone (1999-2000)
(B) Naissances (1966-1990)
1
CASANOVA
ALBERTINI
393
ALBERTINI
649
2
PIETRI
799
LUCIANI
348
CASANOVA
586
3
ALBERTINI
780
MATTEI
344
LUCIANI
632
4
LUCIANI
767
ROSSI
305
MATTEI
581
5
MATTEI
752
CASANOVA
305
AGOSTINI
387
6
POLI
716
POLI
256
ROSSI
514
7
ROSSI
703
PAOLI
255
SANTONI
513
8
BARTOLI
668
SANTONI
241
BARTOLI
439
9
SANTONI
660
BARTOLI
241
PIETRI
481
10
PAOLI
658
LECA
236
POLI
420
Total
1 038
7 541
2 924
5 202
On constate peu de changements entre les diverses listes. PIETRI, au second rang dans la liste A passe au rang 12 dans la liste B pour revenir au « Top ten » dans la liste C (rang 9). En ce qui concerne LECA, il passe du rang 11 (liste A) au rang 10 (liste B) pour redescendre au rang 14 (liste C). Quant à AGOSTINI, il fait son entrée au rang 5 dans la liste C : mais il avait déjà les rangs 14 et 13 dans les listes A et B.
Les chiffres
21
Du premier rang au dernier (=> Annexe 1) Le classement des noms de famille de l’annuaire (environ 23 000 au total) par ordre de fréquence décroissante permet de déterminer leur rang. Certains noms totalisent le même nombre d’inscriptions dans l’annuaire. Par exemple, MAESTRACCI et TOMMASINI avec 118 inscriptions partagent le rang 87 ; CASALTA, le nom suivant (117 inscriptions), occupe donc le rang 89. En queue de tableau on trouvera (rang 10237) les noms qui ont une seule inscription, mais qui n’en sont pas pour autant dépourvus d’intérêt. Ce groupe comprend des noms plus ou moins « déformés » lors de l’inscription à l’état civil mais également des noms visiblement « conformes » au système insulaire (comme DONGRAZI, ANDRIOLI, OGLIASTRI, CARDOLACCI, BELROMANI…). Nous présentons les noms des 100 premiers rangs (pour la période de référence), depuis ALBERTINI, Rang 1 (649 abonnés) à FRANCESCHINI (108 abonnés) dans un tableau en annexe (« Annexe 1 : Le top 100 de l’annuaire corse »). Groupes de fréquence (Corse)
Nous avons distribué les noms de famille en 5 groupes de fréquence. Les patronymes très fréquents (260) représentent 1 % des noms mais totalisent 33 % du total des inscriptions dans l’annuaire. Les patronymes très rares (entre 1 et 5 inscriptions) sont beaucoup plus nombreux (20 000 environ, soit environ 90 % des noms) mais représentent à peu près le même pourcentage d’inscriptions (34 %). Le tableau suivant résume les données essentielles Rang 1 à 256
Groupes de fréquence
Nombre de noms différents
(%)
Nombre d’inscriptions
(%)
1TF
260
1
33 424
33
261 à 283
2F
283
1
10 132
10
544 à 1255
3MF
832
4
13 116
13
1376 à 2227
4R
1 255
5
9 381
9
2631 à 10237
5TR
Total
20 707
89
33 733
34
23 337
100
99 786
100
ALBERTINI est très fréquent (1TF), il occupe le rang 1. MARANINCHI est fréquent (2F), il occupe le rang 295. PASQUALAGGI est moyennement fréquent (3MF) : rang 544. POMONTI est assez rare (4R) : rang 1376. SIACCI est très rare (5TR) : rang 2631.
22
La légende des noms de famille
Arrondissements : le « top 10 »
Le tableau ci-dessous concerne la distribution par arrondissement 8. Les dix premiers noms de famille de chaque arrondissement sont classés par ordre de fréquence décroissante, du rang 1 au rang 10. 2B
Bastia
Calvi
Corte
1
ALBERTINI
COLOMBANI
ALBERTINI
2
MATTEI
SAVELLI
LUCIANI
3
AGOSTINI
ACQUAVIVA
CASANOVA
4
LUCIANI
ORSINI
SANTONI
5
ROSSI
MARTELLI
MARIANI
6
FILIPPI
ALBERTINI
COLOMBANI
7
GRAZIANI
LUCIANI
PIERI
8
CASANOVA
MATTEI
GIUDICELLI
9
PAOLI
FRANCESCHINI
BATTESTI
10
PASQUALINI
GUGLIELMACCI
PAOLI
Corse (annuaire 1999-2000) : Les 10 premiers noms de famille par arrondissement
2A
Ajaccio
Sartène
1
LECA
MONDOLONI
2
SANTONI
NICOLAI
3
CASANOVA
BARTOLI
4
BARTOLI
LUCCHINI
5
COLONNA
PIETRI
6
POLI
TRAMONI
7
CECCALDI
ANDREANI
8
PIETRI
LEANDRI
9
PAOLI
SUSINI
10
ROSSI
CESARI
Tous les noms cités dans le tableau sont présents (avec des fréquences diverses) dans les 5 arrondissements, à l’exception de GUGLIELMACCI (introuvable en Italie) qui n’est présent que dans 2 arrondissements (Bastia, Calvi). 8. Carte : http://en.wikipedia.org/wiki/File:Corsica.jpg
23
Les chiffres
Certains noms sont classés dans les dix premiers rangs au niveau de l’ensemble de la Corse ainsi que dans 1, 2 ou 3 arrondissements : 3 arrondissements : ALBERTINI, LUCIANI (dans les 3 arrondissements du Nord), et CASANOVA (Ajaccio, Bastia, Corte) ; 2 arrondissements : COLOMBANI et MATTEI (2 arrondissements du Nord) ; BARTOLI et PIETRI (2 arrondissements du Sud) ; 1 arrondissement : FILIPPI (Bastia), POLI (Ajaccio). On trouvera le détail dans le tableau suivant.
NOM
ALBERTINI
3 arrond.
CASANOVA
LUCIANI
PAOLI
BARTOLI COLOMBANI 2 arrond.
MATTEI PIETRI ROSSI
Rang (arrond.)
Arrond.
Rang (Corse)
1
Bastia
1
1
Corte
1
6
Calvi
1
3
Ajaccio
3
3
Corte
3
8
Bastia
3
2
Corte
2
4
Bastia
2
7
Calvi
9
Ajaccio
11
9
Bastia
11
10
Corte
11
2
3
Sartène
8
4
Ajaccio
1
Calvi
17
8
6
Corte
17
2
Bastia
4
8
Calvi
4
5
Sartène
7
8
Ajaccio
7
5
Bastia
5
10
Ajaccio
5
SANTONI
2
Ajaccio
6
SANTONI
4
Corte
6
24
La légende des noms de famille
LECA
1 arrond.
1
Ajaccio
13
MONDOLONI
1
Sartène
21
NICOLAI
2
Sartène
16
SAVELLI
2
Calvi
58
ACQUAVIVA
3
Calvi
33
AGOSTINI
3
Bastia
14
LUCCHINI
4
Sartène
43
ORSINI
4
Calvi
18
COLONNA
5
Ajaccio
23
MARIANI
5
Corte
12
MARTELLI
5
Calvi
83
FILIPPI
6
Bastia
10
POLI
6
Ajaccio
9
TRAMONI
6
Sartène
57
ANDREANI
7
Sartène
15
CECCALDI
7
Ajaccio
39
GRAZIANI
7
Bastia
22
PIERI
7
Corte
31
GIUDICELLI
8
Corte
20
LEANDRI
8
Sartène
50
BATTESTI
9
Corte
28
FRANCESCHINI
9
Calvi
100
SUSINI
9
Sartène
24
CESARI
10
Sartène
19
PASQUALINI
10
Bastia
35
GUGLIELMACCI
10
Calvi
275
STATISTIQUES ET SCIENCES HUMAINES
L’usage de méthodes quantitatives pour l’analyse de données sociales pose évidemment des questions de technique statistique. La première difficulté tient à l’inventaire des unités onomastiques, en l’occurrence des noms de famille. Variantes graphiques : 1 forme de référence (=> Annexe 8)
La variation des graphies peut engendrer plusieurs formes différentes pour le même nom. L’usage incohérent des accents fausse les données quantitatives (voir plus loin : « critique des diacritiques : la faute à l’ordinateur »). Notre choix a été de cumuler les occurrences de ce que nous avons considéré comme les variantes (graphiques) du même nom, par exemple CESARI et CÉSARI.
Les chiffres
25
Si l’on cumule les fréquences des deux variantes, la « forme de référence » CESARI occupe le rang 10 dans l’arrondissement de Sartène (le rang 19 pour l’ensemble de la Corse). Pour les noms à « consonance corse » (BEVERAGGI ; BÉVERAGGI ; BÉVÉRAGGI), il semble raisonnable de considérer que la forme de référence est celle qui ne comporte pas d’accent, et qui est d’ordinaire la plus fréquente. Le phénomène concerne des noms d’origine diverse, on a par exemple 4 LEVEQUE ; LÉVÈQUE ; LEVÊQUE ; LÉVÊQUE (les 4 variantes sont présentes dans l’annuaire corse). Plusieurs noms pour le prix d’un
Pour les noms doubles en revanche (GENTILI CESARI) nous aurons deux formes de référence : GENTILI et CESARI. Les deux parties peuvent être séparées par un tiret (ROCCA-SERRA) ou un espace (GENTILI CESARI). La même forme peut être employée seule, avec ou sans accent (ALLEGRINI et ALLÉGRINI), ou associée à un deuxième élément avec ou sans tiret (ALLEGRINI CASTA et ALLEGRINI-CASTA). Le même nom peut être associé à plusieurs noms existant également de manière indépendante : ALLEGRINI-SIMONETTI. Dans les cas cités, on aurait plusieurs formes de référence, c’est-à-dire plusieurs entrées dans le dictionnaire onomastique : ALLEGRINI ; CASTA ; CESARI ; GENTILI ; ROCCA ; SERRA ; SIMONETTI. La solution n’est donc pas toujours simple. À côté des accents abusifs il y a aussi l’omission d’accents. L’annuaire et l’Ign donnent la seule forme SOLLACARO qui correspond au toponyme Suddacarò (2A). Le cas est analogue pour SARTE (forme la plus fréquente, donc « de référence ») et SARTÉ : les deux graphies sont en usage dans la même famille, même si le nom est prononcé comme le toponyme corse Sartè (Sartène 2A) qui constitue probablement la base du nom de la famille insulaire (mais on a aussi la forme indépendante SARTE, plus fréquente hors de Corse). Nous n’avons pas opté pour la facilité. Il aurait été beaucoup plus simple de laisser le choix à l’ordinateur qui aurait traité séparément chaque variante graphique (chaque enregistrement de l’annuaire), et accru considérablement l’inventaire. Il existe par exemple plus de 4 000 noms dont les composants sont séparés par un tiret. Ils sont de plus en plus fréquents (voir plus loin => « les noms doubles »). On trouvera en annexe (=> « Annexe 8 : Avec ou sans accent(s) ? ») une liste de noms qui comportent des variantes graphiques dues à l’usage des diacritiques (accents, tréma…)
26
La légende des noms de famille
ONOMASTIQUE COMPARÉE (CORSE/ITALIE)
De nombreux sites web s’intéressent aux « noms les plus portés en France », c’est-à-dire au « classement de tous les noms en France par région et par nombre de naissances entre 1891 et 1990 ». Il est à peine besoin de préciser qu’il s’agit ici de « noms portés en France », indépendamment de l’origine géographique ou génétique (généalogique) des personnes et des familles. Comment comparer ?
La comparaison entre deux ensembles aussi différents que la Corse (environ 300 mille habitants) et l’Italie (environ 60 millions, c’est-à-dire 200 fois plus) peut paraître incongrue, mais est incontournable s’agissant notamment du domaine onomastique. Les noms de famille constituent un reflet historique, social, culturel et linguistique. La question des rapports entre l’île et le continent le plus proche sont omniprésents dans le débat, en filigrane ou de manière explicite. C’est une des questions les plus fréquemment posées : il suffit pour cela de parcourir les divers « blogs », « forums » qui fourmillent sur la « toile ». Nous rappelons ici que les chiffres ne peuvent remplacer l’analyse qualitative, et ont pour but essentiel de guider la réflexion sans s’y substituer. Nous avons déjà signalé que la comparaison entre deux ensembles quantitativement trop dissemblables peut produire des résultats contestables. Notre base de données ayant comme source les annuaires téléphoniques de 1999 (essentiellement), il s’agit donc d’une photographie de l’ensemble des noms de famille obtenue à un instant T. Bien que forcément sujettes à variation, ces données ont pour nous une valeur heuristique considérable. En attirant l’attention sur certaines zones d’un ensemble, les chiffres permettent une première catégorisation « brute » qui doit être ensuite affinée à l’aide d’autres outils, dans notre cas surtout – mais pas seulement – linguistiques. Valeurs absolues et valeurs relatives
À notre époque, la population de l’Italie est 200 fois plus importante que celle de la Corse (300 000 habitants contre 60 millions). Si l’on se base sur la liste des abonnés au téléphone en 1999 (celle qui sert de référence au présent travail), la proportion est semblable (125 000 contre 25 millions). Nos calculs sont basés sur ces deux dernières valeurs. Afin d’atténuer les inconvénients dus à la disparité évoquée des 2 ensembles (en Corse les noms les plus fréquents ne dépassent pas le millier, contre près de 50 000 en Italie), on peut comparer des pourcentages plutôt que des valeurs absolues. D’après les annuaires, FERRALI est en valeur absolue 2 fois moins fréquent en Corse qu’en Italie (69 abonnés contre 30) ce qui représente en pourcentages
27
Les chiffres
(arrondis) respectivement 0,02 % et 0,0003 % des abonnés : on considère donc que le nom est (relativement) plus fréquent en Corse. Des éléments qualitatifs viennent appuyer les chiffres : si le nom pourrait représenter en Toscane une variante de FERRARI (dissimilation[Cb]), sa présence en Sardaigne où il est attesté dès le XIVe siècle[Mb] plaide en faveur d’une référence au corse ferrale « forgeron ». En revanche, CONTI est nettement plus fréquent en Italie aussi bien en valeur absolue (15 503 contre 30) qu’en pourcentage (0,02 % contre 0,06 %). Valeur (relative) de référence
Mais les chiffres restent peu « parlants », surtout dans la zone des basses fréquences. Afin de faciliter les comparaisons et rendre les tableaux plus lisibles, on peut prendre comme valeur de référence le pourcentage du nom de rang 1 (ALBERTINI), auquel nous avons appliqué un coefficient multiplicateur pour le porter à 100 9. Les autres fréquences ont été modifiées de la même manière en respectant les proportions, y compris pour les valeurs extraites de l’annuaire italien, (colonnes Vrc et Vri), ce qui donne un tableau du type suivant : 1
2
3
4
5
6
7
Nom
Vac
Vai
C%
I%
Vrc
Vri
649
2 505
0,52
0,01
100,00
1,93
85
0
0,07
0
ALBERTINI LOVICHI
13,1
0
GIANNUCCI
2
8
0,04
0,03
7,4
0,64
MOLINARI
7
5 889
0,01
0,02
1,08
4,53
Légende : Vac Vai C% I% Vrc Vri
Valeur Absolue Valeur Absolue Pourcentage Pourcentage Valeur Relative Valeur Relative
(Corse) (Italie) (Corse) (Italie) (Corse) (Italie)
Notons que les valeurs absolues sont toujours récupérables à partir des valeurs relatives par le moyen d’une formule « inversée ». Le coefficient multiplicateur est 6,49 pour la Corse, 1298 pour l’Italie. Ainsi pour PIETRI en Corse : si l’on multiplie la valeur relative (74,11) par 6,49, on obtient 481 (nombre d’inscriptions dans l’annuaire en 1999). De même pour PIETRI en Italie : 0,331 x 1298 = 430 inscriptions dans l’annuaire. 9. Nous nous inspirons de la méthode de E. Caffarelli, par exemple pour la région Abruzzo : http://www.primadanoi.it/documenti_link/cognomi_abruzzo.pdf
28
La légende des noms de famille
Nombres d’abonnés et nombre d’habitants
Il ne faut évidemment pas confondre nombre d’abonnés en Corse (125 000) et nombre d’habitants (300 000). En se basant sur le rapport entre ces deux ensembles, on peut se faire une idée du nombre de porteurs d’un nom en multipliant le nombre d’abonnés par un coefficient fixé à 2,5 (environ). Par exemple, on peut estimer que les porteurs du nom SANTONI (environ 500 abonnés d’après l’annuaire) sont en réalité 1 250 en Corse. Une méthode analogue a été utilisée dans le domaine italien[Cb], de façon beaucoup plus fine cependant puisque le calcul du coefficient a été modulé en fonction des disparités régionales : il est par exemple plus élevé dans certaines régions du Sud où le nombre d’abonnés est faible par rapport au nombre de résidents. De telles distinctions auraient sans doute moins d’intérêt dans le cas d’une région comme la Corse, beaucoup moins peuplée, et où les disparités calculées sur des ensembles de quelques dizaines d’habitants (c’est le cas de la plupart des 360 communes insulaires) seraient sans doute peu significatives. Diffusion comparée en Corse et en Italie : 3 catégories
Toujours pour faciliter la lecture des données quantitatives, on peut procéder à une simplification ultérieure en répartissant les noms de famille en trois catégories. La catégorie « C+ » comprendrait les noms de famille relativement plus répandus en Corse qu’en Italie. La catégorie « I+ » réunirait les noms relativement moins répandus en Corse qu’en Italie. La catégorie « I~C » comprendrait les noms de famille qui ont une fréquence relative comparable en Corse et en Italie. Nous avons corrigé le classement (indicatif !) pour les basses fréquences (moins de 9 inscriptions en Corse). Par exemple, les noms qui auraient été classés « C+ » en fonction du pourcentage ont été déplacés dans le groupe « I~C ». Il y a environ deux fois moins de SUSINI en Corse (254) qu’en Italie (470) : il est raisonnable de considérer que ce nom est relativement plus fréquent dans l’île (C+) si l’on tient compte du fait que la péninsule est 200 fois plus peuplée. En revanche, on peut décider d’attribuer à MURZI (7 inscriptions en Corse contre 68) en Italie une fréquence comparable (I~C). Le tableau suivant précise l’importance des 3 groupes constitués du point de vue de la fréquence relative comparée (Corse/Italie). Rapport C/I
Code
Noms relativement plus fréquents en Corse
C+
Noms de fréquence relative similaire Noms relativement plus fréquents en Italie
% Pourcentage
Nombre
59
13 570
I~C
25
5 811
I+
16
3 776
Total
100,00
23 337
29
Les chiffres
Annuaires téléphoniques et abonnés « absents » : fréquence 0 en Italie (=> Annexe 2) Notre base de données permet d’identifier les noms de famille présents dans l’île qui ont une fréquence proche de 0 (moins de 10 abonnés) dans l’annuaire italien, ou qui n’y figurent pas. Le nombre des noms pratiquement « introuvables » en Italie représente environ 70 % du total. Font partie de cette catégorie des noms de famille dont la graphie est « non-conforme » au système onomastique corse, qui comprennent par exemple des lettres ou groupes de lettres « étrangers » (pour la notion de « graphie conforme », voir notre paragraphe => « Graphie conforme » et « système onomastique corse »), par exemple DESCHAMPS (Rang 909). En font partie aussi, indépendamment de leur graphie, des noms originaires de territoires situés en dehors de la zone d’échanges réguliers (politique, économique…) avec l’Italie. C’est le cas des noms d’origine arabe comme BENALI. En font partie également des noms d’origine grecque « naturalisés » comme DRAGACCI (voir notre paragraphe sur les « changements de nom »). La non-correspondance avec l’Italie résulte aussi des erreurs de transcription de toutes sortes, comme dans le fréquent GUISEPPI (Rang 23) qui représente probablement la déformation de GIUSEPPI (Rang 521). Cette erreur dans la syllabe initiale est fréquente mais non systématique : contrairement à l’opinion majoritaire (en Corse), GUIDICELLI n’est pas forcément la corruption de GIUDICELLI. Il peut s’agir de noms distincts : GIUDICELLI évoque le « juge » (en Corse la base est un surnom et le plus souvent un nom de personne) et GUIDICELLI est basé sur un correspondant du prénom Guy). En Corse comme en Italie, GUIDICELLI est un dérivé à rapprocher de GUIDI (le suffixe est régulier dans la langue vivante : cf. par exemple en corse -icella : funa/funicella « corde »/« cordelette »). LUGREZI ; PALDACCI
1
GILORMINI ; LOVICONI
2
GUGLIELMACCI ; MARANINCHI ; PASQUALAGGI
3
OLMETA ; ACQUATELLA ; VALLECALLE
4
GIOCANTI ; MORDICONI ; NIVAGGIOLI ; PROFIZI
5
DONSIMONI, DONCARLI
6
SIMONGIOVANNI ; SIMONPIERI ; SIMONPIETRI
7
PIERLOVISI ; GIAFFERI ; TERRAMORSI
8
USCIATI, BOCCHECIAMPE, BEVERAGGI
9