Collection L’Essentiel français, dirigée par Catherine Fuchs Formes et notions La transitivité verbale en français, par Meri Larjavaara L’intensité et son expression en français, par Clara Romero L’expression de la manière en français, par Estelle Moline et Dejan Stosic La ponctuation en français, par Jacques Dürrenmatt La comparaison et son expression en français, par Catherine Fuchs Les déterminants du français, par Marie-Noëlle Gary-Prieur Le discours rapporté en français, par Laurence Rosier Les verbes modaux en français, par Xiaoquan Chu Les temps de l’indicatif en français, par Gérard Joan Barceló et Jacques Bres Le nom propre en français, par Sarah Leroy Le gérondif en français, par Odile Halmøy La préposition en français, par Ludo Melis Le conditionnel en français, par Pierre Haillet La référence et les expressions référentielles, par Michel Charolles La construction du lexique français, par Denis Apothéloz Le subjonctif en français, par Olivier Soutet Les noms en français, par Nelly Flaux et Danielle Van de Velde La cause et son expression en français, par Adeline Nazarenko L’intonation : le système du français, par Mario Rossi Les stéréotypes en français, par Charlotte Schapira L’adjectif en français, par Michèle Noailly Les constructions détachées en français, par Bernard Combettes L’espace et son expression en français, par Andrée Borillo Les formes conjuguées du verbe français, oral et écrit , par Pierre Le Goffic Les adverbes du français : le cas des adverbes en -ment, par Claude Guimier Les expressions figées en français, par Gaston Gross Les ambiguïtés du français, par Catherine Fuchs La concession en français, par Mary-Annick Morel La conséquence en français, par Charlotte Hybertie
Pages de titres.indd 2
13/01/2021 10:52
Variétés du français Les parlers jeunes dans l’Île-de-France multiculturelle, par Françoise Gadet Décrire le français parlé en interaction, par Véronique Traverso Le français au contact d’autres langues, par Françoise Gadet et Ralph Ludwig Les créoles à base française, par Marie-Christine Hazaël-Massieux Approches de la langue parlée en français, nouvelle édition, par Claire Blanche-Benveniste (épuisé) Les variétés du français parlé dans l’espace francophone. Ressources pour l’enseignement, par Sylvain Detey, Jacques Durand, Bernard Laks et Chantal Lyche (dir.) Les expressions verbales figées de la francophonie, par Béatrice Lamiroy (dir.) La variation sociale en français, par Françoise Gadet Le français en diachronie, par Christiane Marchello-Nizia
Outils et ressources Lexique raisonné du français académique, Tome 1, par Catherine Fuchs et Sylvie Garnier Grammaire de la subordination en français, par Pierre Le Goffic Lire un texte académique en français, par Lita Lundquist Dictionnaire des verbes du français actuel, par Ligia-Stela Florea et Catherine Fuchs Rédiger un texte académique en français, par Sylvie Garnier et Alan D. Savage Construire des bases de données pour le français, par Benoît Habert Dictionnaire pratique de didactique du FLE, par Jean-Pierre Robert Les dictionnaires français, outils d’une langue et d’une culture, par Jean Pruvost Instruments et ressources électroniques pour le français, par Benoît Habert
Pages de titres.indd 3
13/01/2021 10:52
Tous droits de traduction, de reproduction et d’adaptation réservés pour tous pays. Toute représentation, reproduction intégrale ou partielle faite par quelque procédé que ce soit, sans le consentement de l’auteur ou de ses ayants cause, est illicite et constitue une contrefaçon sanctionnée par les articles 425 et suivants du Code pénal. Par ailleurs, la loi du 11 mars 1957 interdit formellement les copies ou les reproductions destinées à une utilisation collective. © Éditions Ophrys, 2021 Éditions Ophrys, 5 avenue de la République, 75011 Paris www.ophrys.fr ISBN 978-2-7080-1591-3
Pages de titres.indd 4
13/01/2021 10:52
Pages de titres.indd 5
13/01/2021 10:52
Pages de titres.indd 6
13/01/2021 10:52
INTRODUCTION La production d’un texte n’est pas toujours chose aisée, comme nous le rappelle cette planche de comics1 :
Schulz C. M. (2010), Snoopy & les Peanuts 1969-1970. Paris, Dargaud, © 2020 Peanuts Worldwide LLC.
Si les personnages ou les (éléments de) situations sont les conditions sine qua non d’un bon récit, il ne suffit cependant pas de les multiplier et de les additionner pour que le texte « prenne ». Comme le dit Snoopy in fine, il faut relier les différents fils. Mais pas seulement. Il faut aussi continuer… Et les débuts de Snoopy, pour être prometteurs, n’en posent pas moins tout un tas 1 Nous remercions les éditions Dargaud pour nous avoir accordé le droit de reproduire ce comics et Paul Cappeau pour l’avoir gentiment porté à notre connaissance.
Introduction
de questions. Lequel des éléments va constituer le thème ou le personnage principal de ce futur récit ? Pourquoi le roi ou le garçon semblent-ils a priori de meilleurs candidats que la bonne, le bateau ou le coup de feu ? Pourquoi certains personnages sont-ils introduits par un groupe nominal indéfini (un garçon) et d’autres par un SN défini (la bonne, le roi mais aussi la porte) ? Pourquoi certains outils grammaticaux semblent-ils plus adaptés aux circonstances que d’autres ? C’est à ce type de questions que le présent ouvrage cherche à apporter des éléments de réponse. Pour construire un texte bien formé, comment faut-il introduire les entités (personnes, objets, événements) et les doter du statut de « référent » dans un texte ? comment continuer à parler de ces éléments, par quelles unités grammaticales et lexicales les « reprendre » tout en veillant à des enchaînements solidaires ou, techniquement parlant, cohésifs ? Bref comment se construisent ce qu’on nomme les chaînes de référence, c’est-à-dire la suite des expressions d’une production écrite ou orale, qui renvoient à une même entité, comme ci-dessous, les SN et pronoms notés en gras qui auraient pu renvoyer au garçon dont il est question dans le comics : Un garçon grandissait… il… il… Quelques années plus tard, l’adolescent/l’étudiant… Dix ans après, le fils de fermier était devenu une star de la musique country. Le chanteur/La vedette…
Par son propos, cet ouvrage s’inscrit à la croisée des domaines de la référence (de quoi/qui parle-t-on ? avec quels moyens linguistiques ?), de la cohésion, de la cohérence textuelle et donc de la linguistique dite trans-/inter-phrastique ou textuelle. Il s’intéresse à un facteur essentiel de la production et de la compréhension des textes : le fait d’isoler les éléments d’un discours qui paraissent essentiels ou importants et de les suivre tout au long de ce discours, autrement dit la référence discursive. En dépit de son rôle crucial, la notion de chaîne de référence reste absente des grammaires usuelles du français pour diverses raisons. D’abord, c’est une notion relativement récente dans le champ linguistique puisqu’elle a été conçue en 1975 par un linguiste américain (Chastain). Deuxièmement, les mécanismes d’interprétation des chaînes de référence reposent sur deux autres notions, celles d’anaphore et celle de coréférence, beaucoup plus anciennes, bien ancrées dans le domaine, qui ont fait couler beaucoup d’encre. La bibliographie figurant à la fin de cet ouvrage montre d’ailleurs que les études qui y ont été consacrées sont innombrables. Elles relèvent, qui plus est, de cadres théoriques distincts et ont donc suscité de nombreuses controverses. Enfin, 2
Introduction
elles émanent de domaines très diversifiés, certains participants des sciences du langage (syntaxe, sémantique référentielle, pragmatique, linguistique textuelle, Traitement Automatique des Langues (TAL)), d’autres provenant de champs connexes comme la psychologie cognitive ou la psycholinguistique. Étant donné le nombre et de la diversité de ces approches – qui montrent que les questions suscitées par l’anaphore et la coréférence ne sont toujours pas définitivement tranchées –, se préoccuper des chaînes de référence a pu paraître, pendant longtemps, sinon secondaire, du moins prématuré : vu l’instabilité des bases, pourquoi (et comment) s’attaquer à l’étape « d’après » ? En outre, travailler sur les chaînes de référence suppose la prise en compte de « paramètres » autrement plus nombreux et complexes, on le verra, que ceux qu’imposent les notions d’anaphore et de coréférence. Pourtant, ce qui apparaissait, à la naissance de la notion de chaîne de référence, comme un défi, énoncé comme suit par L. Kartutten (1976), Considérons un automate conçu pour lire un texte dans une langue naturelle donnée, l’interpréter, et en enregistrer en quelque manière son contenu, par exemple être en mesure de répondre à des questions sur ce texte. Pour accompagner cette tâche, la machine devra remplir au minimum les exigences suivantes. Elle devra être en mesure de construire un fichier contenant la liste de toutes les entités, événements, objets, etc. mentionnés dans le texte, et pour chaque entité, enregistrer ce qui en est dit. Naturellement, au moins pour la période présente, il semble qu’un tel interpréteur de texte ne soit pas réalisable pratiquement, mais cela ne devrait pas nous décourager d’étudier dans l’abstrait quel genre de capacités devrait posséder une telle machine, pourvu que notre étude jette quelque lumière sur les langues naturelles en général. (cité par Corblin, 1995 : 171, nous soulignons)
est devenu aujourd’hui réalité. Force est de constater, en effet que, depuis ce propos, des travaux de tous bords ont œuvré à cette fin : par exemple, des théories comme la théorie du centrage ont essayé de prédire les enchaînements et de modéliser les suites d’expressions référentielles ; les travaux menés dans le domaine du traitement automatique des langues et les nombreuses campagnes d’évaluation des systèmes de résolution de l’anaphore et des modalités de la coréférence ont favorisé l’élaboration de corpus et de systèmes de détection automatique des mécanismes impliqués dans cette tâche. En France, l’intérêt porté aux chaînes de référence s’est fait en deux temps. À la fin des années quatre-vingt, Corblin (1985) et Charolles (1988) ont évoqué la notion, le premier dans une revue d’observance Tal (Intellectica) et le second dans une revue de didactique du français (Pratiques), ce qui a généré une première vague de thèses et travaux, principalement dans le domaine de la linguistique française et de la linguistique contrastive. Plus 3
Introduction
récemment, la notion a été remise au « goût du jour », en 2011-2013, dans le cadre d’un projet intitulé Modélisation Contrastive et Computationnelle des Chaînes de Coréférence (MC4), suivi, en 2016, d’un projet financé par l’Agence Nationale de la Recherche (ANR), intitulé DEscription et MOdélisation des Chaînes de Référence : outils pour l’Annotation de corpus (en diachronie et en langues comparées) et le Traitement automatique (Democrat)2 regroupant une trentaine de personnes (linguistes et spécialistes de Tal), dont les premiers résultats sont publiés, entre autres, dans deux numéros de revue3. L’objectif visé par cet ouvrage est donc de proposer, à toutes celles et ceux qui sont intéressé·e·s par les diverses facettes de la (co-)référence, la production/compréhension des textes, l’articulation entre faits de langue et genres de discours et l’élaboration de corpus utilisant l’annotation dite de « haut niveau », une introduction au concept de chaîne de référence, en commençant par rappeler les notions sur lesquelles il repose (anaphore et coréférence) de manière à bien les différencier (Chapitre I). Dans un deuxième chapitre, nous évoquerons les paramètres à prendre en considération lorsqu’on analyse les chaînes de référence : leurs composants (qu’on appelle mentions ou, métaphoriquement, maillons) et les questions liées à leur appariement, ainsi que les paramètres qui interviennent dans le déroulement linéaire de ces mentions, à travers les textes et les discours. Au cours du troisième chapitre, nous étudierons le matériau linguistique composant les maillons des chaînes de référence (catégories grammaticales et têtes lexicales). Cela nous donnera l’occasion d’évoquer les théories qui, dans les années 1990, ont proposé des modèles exposant les motivations cognitives et linguistiques présidant au choix des expressions (co-)référentielles. Dans les quatrième et cinquième chapitres, nous exposerons les contraintes externes et internes qui influent sur la réalisation des chaînes de référence, contraintes prenant en compte notamment les variations diachronique, diamésique et générique (au sens ici de genres discursifs) mais aussi les formes de découpage textuel que constituent, par exemple, les paragraphes ou le discours rapporté direct. Nous terminerons cet ouvrage en suggérant (Chapitre VI) les domaines d’application intéressés, déjà efficients ou potentiels, par la question des chaînes de référence, qui vont de la littérature à la didactique du français en passant par la linguistique clinique. 2 Tous deux initiés et portés par Frédéric Landragin (ENS/Lattice). 3 Langages (2014) Les chaînes de référence et Langue française (2017) Les chaînes de référence en corpus. 4
Introduction
Chaque chapitre se conclura par une série de références bibliographiques invitant le lecteur à approfondir les connaissances acquises et à les tester par des exercices pour lesquels seront proposés des corrigés. Ceux-ci sont disponibles sur le site des éditions Ophrys, à la page de l’ouvrage. Étant donné l’ampleur de la bibliographie évoquée plus haut, nous avons balisé – et donc restreint – le terrain comme suit. Nous travaillerons principalement sur le français, compte tenu des objectifs de notre support éditorial, et sur l’écrit, l’oral posant des problèmes spécifiques que nous ne ferons que survoler faute de place (cf. Chapitre IV). Enfin, notre travail s’appuiera exclusivement sur des énoncés authentiques issus d’écrits de locuteurs, experts ou apprenants, provenant de domaines diversifiés (littérature, presse, droit, écrits scolaires, institutionnels,…). Vu l’importance et la diversité des travaux relatifs à l’anaphore et à la coréférence, il est impossible d’en concevoir une/la synthèse4. Notre objectif est plutôt de faciliter l’accès aux études linguistiques du domaine et de permettre au lecteur, d’une part, de comprendre les enjeux des discussions et controverses, et, d’autre part, de faire ses choix théoriques et méthodologiques en toute connaissance de cause. C’est pourquoi nous renverrons, en temps utile, aux publications-phares sur les points particuliers qui seront évoqués. D’ores et déjà, deux ouvrages complèteront opportunément celui-ci : celui de Charolles, dans la même collection, intitulé La référence et les expressions référentielles en français (2002), qui présente les notions-clés attachées à la référence et le mode de saisie référentielle opérée par certaines expressions, et celui de Cornish (1986, rééd. 2015) Anaphoric Relations in English and French: A Discourse Perspective, notamment et entre autres, pour son classement exhaustif des relations anaphoriques. Travaillant sur cette notion depuis de nombreuses années5, nous espérons surtout communiquer à notre lecteur (étudiant ou collègue) notre intérêt et notre enthousiasme pour ce domaine de recherche passionnant, aux innombrables ramifications et aux possibilités d’exploitation multiples dans des domaines extrêmement divers.
4 Parmi les ouvrages-sommes, publiés en anglais, signalons d’ores et déjà Reference in Discourse (Kibrik, 2011), Anaphora Resolution. Algorithms, Resources, and applications (Poesio et al., 2016) et The Oxford Handbook of Reference (Gundel & Abbott, 2019). 5 Certains des points évoqués dans cet ouvrage ont été développés dans des publications présentes dans la bibliographie.
5
Introduction
Nous tenons, enfin, à adresser nos plus sincères et chaleureux remerciements à Catherine Fuchs, l’éditrice de ce volume, pour la confiance qu’elle nous a témoignée, pour sa relecture exigeante et ses suggestions d’amélioration ; à Paul Cappeau, qui nous a fait l’amitié de relire ce texte, de manière à la fois impitoyable et constructive, et qui, par ses conseils, a grandement aidé notre démarche ; à Daniela Capin, qui a traduit les textes de langue ancienne ; à Frédéric Landragin, grâce à qui le thème des chaînes de référence a connu de nouveaux développements et des perspectives prometteuses. Nous remercions également les cohortes d’étudiants de Master du parcours Sciences du Langage de la Faculté des Lettres de l’Université de Strasbourg et d’autres séminaires, en France et à l’étranger ainsi que les collègues qui ont contribué par leurs suggestions, leurs interrogations scientifiques et méthodologiques, à enrichir notre réflexion. Ce travail aura, enfin, bénéficié de l’émulation du projet Democrat, qui aura été, durant ces dernières années, une opportunité de collaborations et d’échanges très stimulants. Nous exprimons toute notre reconnaissance à Ersie Leria qui nous a permis de finaliser ce document avec le professionnalisme et l’extrême patience qui sont les siens.
6
CHAPITRE I Anaphore(s), coréférence, chaîne de référence : définitions et fonctionnement
Introduction Pour caractériser ce dont il va être question dans cet ouvrage, considérons l’extrait (1) qui constitue le début (on parle aussi d’incipit) du roman d’E. Zola intitulé Germinal : (1) Dans la plaine rase, sous la nuit sans étoiles, d’une obscurité et d’une épaisseur d’encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n’avait la sensation de l’immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d’avoir balayé des lieues de marais et de terres nues. Aucune ombre d’arbre ne tachait le ciel, le pavé se déroulait avec la rectitude d’une jetée, au milieu de l’embrun aveuglant des ténèbres. L’homme était parti de Marchiennes vers deux heures. Il marchait d’un pas allongé, grelottant sous le coton aminci de sa1 veste et de son pantalon de velours. Un petit paquet, noué dans un mouchoir à carreaux, le gênait beaucoup ; et il le serrait contre ses flancs, tantôt d’un coude, tantôt de l’autre, pour glisser au fond de ses poches les deux mains à la fois, des mains gourdes que les lanières du vent d’est faisaient saigner. Une seule idée occupait sa tête vide d’ouvrier sans travail et sans gîte, l’espoir que le froid serait moins vif après le lever du jour. Depuis une heure, il avançait ainsi, lorsque sur la gauche à deux kilomètres de Montsou, il aperçut des feux rouges, trois brasiers brûlant au plein air, et comme suspendus. D’abord, il hésita, pris de crainte ; puis, il ne put résister au besoin douloureux de se chauffer un instant les mains. (Zola, Germinal, incipit)
Ce début de roman introduit et met en scène un personnage dont la première mention linguistique s’effectue au moyen du groupe nominal indéfini un homme. Ce personnage réapparaît dans la suite du texte, rappelé par un groupe nominal, l’homme, ainsi que par toute une suite de pronoms, lui, il et le, qui émaillent régulièrement cet extrait (signalés par du gras). Les formes de cette suite, éparses dans le texte, sont reliées par le fait qu’on comprend qu’elles 1 Nous expliquerons le cas des déterminants possessifs infra.
CHAPITRE I
renvoient toutes au même personnage, ce que l’on pourrait schématiser de la manière suivante2 : • • • • • Figure 1. Schématisation des chaînes de référence
Pour parler métaphoriquement de cette forme de concanétation ou d’interdépendance, on a utilisé la notion de chaîne de référence que Corblin (1985) et Charolles (1988) définissent comme suit : Convenons d’appeler chaîne de référence la suite des expressions d’un texte entre lesquelles l’interprétation construit une relation d’identité référentielle. (Corblin, 1985 : 123) Les chaînes sont constituées par des suites d’expressions coréférentielles […]. Seules peuvent appartenir (donner lieu à) une chaîne des expressions employées référentiellement, c’est-à-dire toutes et rien que les expressions nominales (ou pronominales) permettant d’identifier un individu (un objet de discours) quelle que soit sa forme d’existence (personne humaine, événement, entité abstraite) (Charolles, 1988 : 8)
Cette notion n’est pas consignée dans les grammaires usuelles. Il y a deux raisons à cela. Premièrement, elle a été introduite relativement tard dans le domaine linguistique, puisqu’elle est apparue en 1975, sous la plume de Chastain (1975). Deuxièmement, deux autres notions, celles d’anaphore et de coréférence, semblent décrire des phénomènes linguistiques similaires. Comme ces deux notions sont plus anciennes et mieux connues, ce sont elles que privilégient les grammaires. C’est ainsi que, à propos de l’extrait (2) : (2) [p1] Depuis trois jours la seule distraction de Mme de Rênal avait été de tailler et de faire faire en toute hâte par Elisa une robe d’été, d’une jolie petite étoffe fort à la mode. [p2] À peine cette robe put-elle être terminée quelques instants après l’arrivée de Julien ; [p3] Mme De Rênal la mit aussitôt. (Grammaire méthodique du français, 1029, chapitre XXIV, Texte et discours)
il est précisé que : Dans cet extrait de Stendhal, deux termes sont anaphoriques : le référent du groupe nominal cette robe et du pronom personnel la s’identifient à partir d’une robe d’été. (op. cit., ibid.)
L’anaphore est définie par les auteurs comme suit :
2 À des fins didactiques. Ce schéma ne préjuge aucunement des processus d’interprétation à l’œuvre. 8
Anaphore(s), coréférence, chaîne de référence La cohésion du texte repose en partie sur la répétition. Divers éléments linguistiques y contribuent ; les groupes nominaux, en particulier, assurent, par leur articulation et leurs relations au fil du texte, la reprise de l’information. La notion d’anaphore permet de décrire cet aspect de l’organisation du texte. L’anaphore se définit traditionnellement comme toute reprise d’un élément antérieur dans un texte. (op. cit., ibid.)
Il n’est toutefois n’est pas précisé que ce court extrait évoque en fait la fameuse robe plus longuement, et ce, par le biais des quatre expressions (en gras dans l’extrait ; le elle de pût-elle en fait partie). Ces éléments sont unis non seulement par la relation d’anaphore qui vient d’être décrite mais également par un autre lien : ils partagent tous, en effet, la propriété de renvoyer à un même objet, la robe. Autrement dit, ils co-réfèrent (on parlera alors de coréférence). Par voie de conséquence, on considère que ces quatre expressions coréférentielles constituent, en vertu de la définition introduite au début de ce chapitre, une chaîne de référence, qui permet de suivre, durant cette brève portion de texte, le « devenir » discursif de la robe. C’est donc aux trois notions d’anaphore, de coréférence et de chaîne de référence, qu’est consacré ce chapitre inaugural (cf. Schnedecker (2019)). Comme ces trois notions sont déterminantes pour cet ouvrage, ce chapitre sera consacré à leur définition et à leur différenciation. La première partie sera consacrée à la notion d’anaphore. Nous déterminerons la nature sémantico-pragmatique des expressions référentielles concernées, puis les appuis cotextuels qui permettent leur interprétation. Nous proposerons alors une typologie des anaphores qui distinguera entre anaphores coréférentielles et non coréférentielles pour finir par des anaphores moins « classiques ». Ce chapitre sera aussi l’occasion de montrer la diversité des conceptions de l’anaphore, de manière à donner au lecteur quelques éléments pour aborder l’énormissime littérature consacrée à ce phénomène. Dans un second temps, nous aborderons la coréférence, dont nous montrerons la subtilité à travers cinq cas de figure sensibles : les cas d’ambiguïtés référentielles et/ou syntaxiques ; les cas dits par les spécialistes du Tal de « quasi identité » ; les cas liés à l’évolution du référent, les cas d’indétermination référentielle et, pour finir, la question de l’indétermination de la source et de la portée de ce qu’on nomme « l’anaphore résomptive ». Dans un troisième temps, nous envisagerons d’autres différences entre les trois notions, à travers le nombre des éléments qu’elles mettent en relation et leurs propriétés formelles.
9
CHAPITRE I
Pour terminer, nous mettrons en évidence les rendements de la notion de chaîne de référence pour l’analyse de certains phénomènes référentiels, ne serait-ce que parce qu’elle contribue à relativiser des problèmes quelque peu exacerbés certaines approches focalisées sur les enchaînements de paires d'énoncés. Par ce chapitre, nous ferons valoir l’idée que la notion de chaîne de référence n’est pas une notion linguistique « gadget » de plus, mais qu’elle seule est de nature à capter véritablement la référence discursive, ce qui explique aussi pourquoi elle participe de la cohésion textuelle.
1. Anaphore 1.1. Une première définition Pour introduire la notion d’anaphore, nous allons observer la séquence (3a) extraite du début du roman de G. Sand intitulé François le Champi : (3a) […] elle trouva un petit enfant assis devant sa planchette, et jouant avec la paille qui sert de coussinet aux genoux des lavandières.
L’emploi du pronom elle dans cet extrait ne permet pas d’identifier l’entité dont il est question. Tout au plus dispose-t-on d’informations morphologiques comme le genre et le nombre du pronom, qui permettent d’inférer que le référent est une entité unique (le singulier) et de sexe féminin (cf. le genre du pronom). Voici maintenant l’incipit complet : nous avons restitué la première phrase du roman : (3b) Un matin que Madeleine Blanchet, la jeune meunière du Cormouer, s’en allait au bout de son pré pour laver à la fontaine, elle trouva un petit enfant assis devant sa planchette, et jouant avec la paille qui sert de coussinet aux genoux des lavandières. Madeleine Blanchet, ayant avisé cet enfant, fut étonnée de ne pas le connaître, car il n’y a pas de route bien achalandée de passants de ce côté-là, et on n’y rencontre que des gens de l’endroit.
La présence d’un nom propre, Madeleine Blanchet, permet d’interpréter le pronom « énigmatique » de (3a). Le lecteur est alors en mesure d’identifier un référent dénommé Madeleine Blanchet dont il peut raisonnablement penser qu’il sera unique dans le roman. Le pronom personnel qui, dans (3a), laisse en suspens l’ensemble des caractéristiques du référent que seul le contexte permet de préciser, est ce qu’on appelle une anaphore. Celle-ci a fait l’objet d’une définition fondatrice
10
CHAPITRE IV Contraintes externes pesant sur la composition des chaînes de référence
Introduction On l’a vu (cf. Chapitre III), la composition des chaînes de référence varie au point que l’on peut avoir le sentiment qu’il est extrêmement difficile de dégager des régularités dans l’emploi du matériau lexical. Dans ce chapitre (et le suivant, cf. Chapitre V, infra), nous allons exposer certaines des raisons qui expliquent ces fortes variations, en commençant par les contraintes externes, c’est-à-dire, les raisons extérieures à la langue et au système linguistique, pour envisager, dans le Chapitre V, les contraintes liées à la textualité et à la langue. La composition des chaînes de référence dépend, comme on va le voir, de cinq types de contraintes : l’époque à laquelle les textes ont été écrits (1), les langues ou familles de langue dans lesquelles elles sont exprimées (2), les supports ou medias qui les véhiculent (3), leurs genres discursifs d’occurrence (4) et, enfin, la nature ontologique des entités qui font office de référent principal (5).
1. Variation selon l’époque Les travaux sur les chaînes de référence dans des textes « anciens » sont relativement récents et rares (cf. les articles de Glikman et al., 2014 ; Obry et al., 2016, Capin, 2014). Ils démontrent en tout cas que la date de composition des textes influe sur la composition des chaînes de référence. Quatre observations majeures ressortent des études déjà réalisées : i) l’importance de l’anaphore zéro, ii) la faible variation dans les têtes lexicales des SN, iii) une tolérance aux ambiguïtés référentielles dans les textes de français classique, iv) l’utilisation de formes qui ont diminué dans l’usage ou se sont spécialisées dans certains genres).
CHAPITRE IV
1.1. Importance de l’anaphore zéro L’importance et la fréquence de l’anaphore zéro est liée au fonctionnement du système linguistique. En effet, comme l’ont montré les linguistes diachroniciens (cf. Buridant, 2000 : 424), jusqu’au xiiie siècle, le sujet n’était pas nécessairement exprimé, son absence prévalait même en ancien français. L’extrait (1) montre le comportement du sujet dans un texte du xiiie siècle : les expressions explicites, visibles sont indiquées en gras ; les verbes en gras (avoit, estoit, voloit, dit) sont précédés d’un sujet zéro : (1) D’une damoisele vos voil Conter c’onques ne virent oil Si bele come ele estoit, Et de biauté grant los avoit. De riches clers, de chevaliers, Et de borjois et d’escuiers Estoit totes eures requise, Mes ne voloit en nule guise La priere a nul escouter. Un jor dit qu’el voudroit voler. Sachiez que plusors genz l’öirent : À mervelles s’en esbaïrent
D’une demoiselle Je vous veux Conter que jamais ne virent des yeux Aussi bele comme elle était De beauté Elle avait grande éloge De riches clercs, de chevaliers De bourgeois et d’écuyers Elle était tout le temps requise Mais ne voulait d’aucune façon La prière à qui que ce soit écouter Un jour elle dit qu’elle voudrait voler1 Sachez que plusieurs l’entendirent (Et) ils en furent très étonnés2 (De la pucele qui vouloit voler, xiiie siècle).
L’extrait (2) ci-après met en regard un extrait de la chanson de Roland (xie siècle)3 avec sa traduction. Dans les trois premières lignes, le texte original comprend trois verbes à sujet zéro, que la traduction fait apparaître par des pronoms de 3e personne.
1 Voler : soit 1) « se mouvoir dans les airs », soit 2) « chasser au vol » avec un oiseau de proie, soit 3) « jouer au volet, ce dernier étant un jeu de hasard », soit 4) « éprouver de la joie », laquelle donne l’impression de voler… 2 <https://sourcebook.stanford.edu/sites/all/modules/custom/vm/VersioningMachine/texts/girl_ wanted_fly_1.html>. Je veux vous raconter l’histoire d’une jeune fille ; jamais on n’en vit d’aussi belle. Sa beauté suscitait l’éloge des riches clercs, des chevaliers, des bourgeois et des écuyers. On lui réclamait tellement son amour, mais elle ne voulait en aucune façon exaucer la prière de quiconque. Un jour, elle dit qu’elle voudrait VOLER. Plusieurs l’entendirent et en furent très surpris. (Traduction de notre collègue Daniela Capin que nous remercions pour son aide précieuse). 3 <https://fr.wikisource.org/wiki/La_Chanson_de_Roland/L%C3%A9on_Gautier/%C3%89dition_critique/Premi%C3%A8re_partie>. 150
Contraintes externes pesant sur la composition des chaînes de référence 2a) Li Emperere se fait e balt e liet : Cordres ad prise e les murs peceiez, Od ses cadables les turs en abatiet. Mult grant eschec en unt si chevaler 100 D’or e d’argent e de guarnemenz chers. En la citet nen ad remés paien Ne seit ocis u devient chrestiens. Li Emperere est en un grant verger, Ensembl’od lui Rollanz e Olivers,(…) Desuz un pin, delez un eglenter, 115 Un faldestoed i out, fait tut d’or mer, Là siet li reis ki dulce France tient ; Blanche ad la barbe e tut flurit le chef, Gent ad le cors e le cuntenant fier. S’est ki l’demandet, ne l’estoet enseigner. 120 E li message descendirent à pied,
Si l’saluèrent par amur e par ben.
2b) L’Empereur se fait tout joyeux et est de belle humeur. Il a pris Cordres, il en a mis les murs en pièces, Avec ses machines il en a abattu les tours ; Ses chevaliers y ont fait un très riche butin D’or, d’argent, de riches armures. Dans la ville il n’est pas resté un seul païen Qui ne soit forcé de choisir entre la mort et le baptême… Le roi Charles est dans un grand verger ; Avec lui sont Roland et Olivier, Sous un pin, près d’un églantier, Est un fauteuil d’or massif : C’est là qu’est assis le roi qui tient douce France. Sa barbe est blanche et son chef tout fleuri ; Son corps est beau, et fière est sa contenance. À celui qui le veut voir il n’est pas besoin de le montrer. Les messagers païens descendent de leurs mules, Et saluent Charles en tout bien, tout amour.
Par ailleurs, dans une étude portant sur des textes issus de genres narratifs brefs (du xiiie au xvie siècle), Obry et al. (2017) ont montré que, dans les genres les plus anciens, 23,9 % des maillons des chaînes de référence (celles des fabliaux notamment) ne sont pas exprimés, alors que, dans des textes ultérieurs, le pronom personnel constitue 28,0 % des expressions référentielles des chaînes au xve siècle, puis 38,4 % de celles des textes datant du xvie siècle. Corollairement, l’usage des verbes sans sujet exprimé diminue au fil du temps : 8,9 % au xve siècle puis 3,4 % au xvie siècle. 1.2. Une tendance à la stabilité lexicale Même si l’étude des chaînes de référence n’a jamais été menée en tant que telle sur les périodes anciennes, les travaux convergent pour souligner que les expressions référentielles des textes anciens montrent une grande stabilité qu’on perçoit dans la répétition du SN li emperere de l’extrait (2). Dans une étude pionnière, Perret (2000 : 17) signale, en effet, que « l’ancien français privilégie les reprises nominales répétitives et semble préférer la stabilité voire la rigidité désignationnelle ». C’est ainsi qu’en calculant ce qu’elle nomme le
151
CHAPITRE IV
coefficient de stabilité4, elle montre que celui-ci est plus élevé dans les textes anciens que dans les textes du début du xxe siècle (elle prend l’exemple de Proust). Par ailleurs, dans les textes anciens, le genre conditionnerait le choix des expressions référentielles puisque les romans en prose et les romans en vers (Jehan de Saintré, Mélusine, Jehan de Paris) auraient, selon l’auteur, un coefficient de stabilité supérieur à celui des nouvelles (Cent nouvelles nouvelles). L’extrait (3) donne un aperçu de ces phénomènes d’invariance : (3a) Et quant Saintré fut en Avignon, pour la grant nouvelle de sa venue, le roy d’arme d’Anjou, qui le seelé de sa response portoit, au saillir de la messe ledit seelé présenta. Et quand Saintré eust bien leu et advisé ledit seelé, ledit Saintré devant chascun publiquement retourna incontinent a l’eglise remercier dieu devotement (…). (Saintré, Cent nouvelles nouvelles in Perret 2000 : 20) (3b) Quant Saintré arriva à Avignon, à cause de la grande nouvelle de sa venue, le héraut d’armes d’Anjou, qui apportait le scellé de sa réponse, présenta ledit scellé à la sortie de la messe. Et lorsque Saintré eut bien vu et examiné ledit scellé, ledit Saintré devant tout le monde retourna rapidement à l’église remercier Dieu avec effusion (traduction littérale, D. Capin)5
Ce constat est partagé par Glikman et al. (2014 : 50-51) qui, sur un corpus de textes médiévaux de genres variés (miracles en vers, hagiographie en vers, roman en prose et traduction d’un livre historique), soulignent l’absence de variété dans le mode de désignation des référents humains. Capin (2014), de son côté, observe dans les textes juridiques anglo-normands du xiiie siècle une tendance à la réitérer le nom propre. 1.3. La relative tolérance du français classique aux ambiguïtés référentielles Les travaux de Fournier (1998, 2008) montrent que, en dépit des prescriptions des remarqueurs qui préconisent, pour les sources de l’anaphore pronominale, un principe de netteté (identifiabilité univoque du référent) et de proximité, la langue classique est toujours présentée comme le lieu d’une grande liberté en matière d’anaphore pronominale, liberté dont le revers (pour qui prône l’univocité) est la multiplication des ambiguïtés référentielles. (Fournier, 2008 : 326) 4 Obtenu en divisant pour un référent donné le nombre total d’anaphores nominales par le nombre de désignations différentes (art.cit. : 17). Cf. Chapitre II. 5 Traduction esthétique : Saintré arriva à Avignon. En raison de la grande nouvelle de sa venue, en sortant de la messe, le héraut d’armes d’Anjou qui apportait le scellé de sa réponse, lui présenta le document. Après avoir bien lu et vu le scellé, Saintré, au vu et au su de tout le monde, retourna tout de suite à l’église pour remercier Dieu avec empressement. (D. Capin). 152
TABLE DES MATIÈRES
INTRODUCTION.................................................................................... 1 CHAPITRE I : Anaphore(s), coréférence, chaîne de référence : définitions et fonctionnement............................................ 7 Introduction............................................................................................... 7 1. Anaphore............................................................................................. 10 1.1. Une première définition................................................................ 10 1.2. Expressions référentiellement autonomes vs non autonomes.......... 11 1.3. Quels « appuis » pour l’interprétation d’une anaphore ?................. 13 2. Coréférence.......................................................................................... 34 2.1. Les ambiguïtés référentielles......................................................... 35 2.2. La « quasi identité » (Recasens et al., 2010)................................... 37 2.3. L’évolution du référent.................................................................. 39 2.4. Les « groupes flous » (Landragin, 2011)......................................... 43 2.5. Source et portée des anaphores résomptives................................... 48 2.6. Bilan............................................................................................. 49 3. Anaphore, coréférence, chaînes de référence : où est la différence ?........ 49 3.1. Différence « numérique »............................................................... 50 3.2. Propriétés formelles....................................................................... 50 3.3. Incidences méthodologiques.......................................................... 52 3.4. Rendements des chaînes de référence............................................. 55 4. Chaînes de référence et cohésion textuelle............................................ 61 Conclusion........................................................................................... 64 Pour aller plus loin............................................................................... 65 Exercices.............................................................................................. 65 CHAPITRE II : Analyser les chaînes de référence : quels paramètres retenir, analyser et comment ?.............. 69 Introduction............................................................................................. 69 1. Identifier les maillons d’une chaîne de référence : pour quoi faire ?....... 70 2. Problèmes d’analyse linguistique : identifier et matérialiser les maillons d’une chaîne de référence................................................. 72
TABLE DES MATIÈRES
2.1. Caveat et précautions préliminaires.............................................. 72 2.2. Maillons invisibles........................................................................ 73 2.3. Maillons imbriqués....................................................................... 74 2.4. Maillons discontinus..................................................................... 75 2.5. Attributs et appositions................................................................ 75 2.6. Pronoms se.................................................................................... 78 2.7. Mentions a-référentielles............................................................... 78 2.8. Mentions des discours représentés................................................. 79 3. Ordre des mentions dans une chaîne de référence................................. 80 3.1. Premier maillon............................................................................ 80 3.2. Deuxième ou énième maillon........................................................ 81 3.3. Bémols.......................................................................................... 82 3.4. Bilan............................................................................................. 86 4. Qu’est-ce qui fait une chaîne de référence ? Paramètres........................ 86 4.1. Densité référentielle et nombre de référents d’un texte.................. 88 4.2. Nombre de chaînes de référence d’un texte.................................... 89 4.3. Mesures permettant de caractériser les dimensions des chaînes de référence................................................................. 89 4.4. Unités d’occurrence des chaînes de référence et question des limites.................................................................. 92 4.5. Mesures permettant de caractériser la composition des chaînes de référence................................................................. 94 4.6. Relations et cohabitation entre les chaînes de référence d’un texte..................................................................................... 99 4.7. Résultats..................................................................................... 104 5. Application........................................................................................ 109 5.1. Les difficultés.............................................................................. 111 5.2. Quelques résultats chiffrés........................................................... 112 5.3. Interprétations des chiffres.......................................................... 113 5.4. Bilan et perspectives................................................................... 115 Conclusion............................................................................................. 115 Pour aller plus loin................................................................................ 117 Exercices................................................................................................ 118
272
Table des matières
CHAPITRE III : La composition des chaînes de référence...................... 121 Introduction........................................................................................... 121 1. Les faits : diversité catégorielle et lexicale des maillons....................... 121 2. La forme des maillons d’une chaîne de référence................................. 122 2.1. Une conception qui accorde l’exclusivité aux expressions référentielles............................................................................... 123 2.2. Une conception ouverte à toutes les formes de rappels................ 123 2.3. Une conception intermédiaire..................................................... 125 3. Principes cognitifs généraux............................................................... 125 3.1. Les théories cognitives et choix de la catégorie grammaticale des maillons d’une chaîne de référence.............................................. 125 3.2. Bilan : apports et limites des théories cognitives.......................... 130 4. Principes linguistiques : l’exemple des SN démonstratifs « à apport informationnel »....................................................................................... 132 4.1. Absence de contrainte................................................................. 134 4.2. Trois limites à la liberté du locuteur........................................... 134 4.3. Points de vue.............................................................................. 136 4.4. Bilan........................................................................................... 137 5. Prédire la « mise en chaîne » à partir du premier maillon................... 137 5.1. Les prédictions de suivi référentiel attachées au nom propre........ 138 5.2. Du rôle prédictif de certains pronoms réputés indéfinis............... 142 5.3. Bémols........................................................................................ 142 5.4. Les maillons singletons............................................................... 143 Conclusion............................................................................................. 144 Pour aller plus loin................................................................................ 145 Exercices................................................................................................ 145 CHAPITRE IV : Contraintes externes pesant sur la composition des chaînes de référence................. 149 Introduction........................................................................................... 149 1. Variation selon l’époque..................................................................... 149 1.1. Importance de l’anaphore zéro..................................................... 150 1.2. Une tendance à la stabilité lexicale.............................................. 151 273
TABLE DES MATIÈRES
1.3. La relative tolérance du français classique aux ambiguïtés référentielles............................................................................... 152 1.4. Des pics dans l’usage de certaines formes.................................... 153 2. Variation selon la langue.................................................................... 153 2.1. Quelques résultats....................................................................... 153 2.2. De la relativité des approches trans-linguistiques........................ 155 3. Variation selon le medium................................................................... 157 3.1. Les chaînes de référence à l’oral et selon le type d’interaction...... 157 3.2. Les chaînes de référence dans les sms........................................... 158 3.3. La référence multi-modale........................................................... 159 4. Variation selon le type d’entité référentielle....................................... 159 5. Variation selon le genre de texte........................................................ 163 5.1. Quelques résultats....................................................................... 163 5.2. Les chaînes de référence dans deux genres de la presse................. 165 5.3. Variation des chaînes de référence dans deux sous-genres dits d’incitation à l’action.................................................................. 166 Conclusion............................................................................................. 169 Pour aller plus loin................................................................................ 170 Exercices................................................................................................ 170 CHAPITRE V : Contraintes internes pesant sur la composition des chaînes de référence................... 173 Introduction........................................................................................... 173 1. Découpages textuels et chaînes de référence....................................... 174 1.1. Découpage en paragraphes et chaînes de référence....................... 175 1.2. Titraille et chaînes de référence................................................... 180 1.3. Découpage hybride : les propos rapportés.................................... 182 1.4. Autres formes de découpages....................................................... 183 1.5. Bilan........................................................................................... 184 2. Découpages sémantiques des textes en domaines................................ 184 2.1. Impact du découpage en domaines sur les chaînes de référence.... 184 2.2. Bilan........................................................................................... 186 3. Découpages marqués par les expressions référentielles........................ 187 274
Table des matières
3.1. Le rôle du nom propre dans les chaînes de référence.................... 189 3.2. Les SN démonstratifs.................................................................. 191 Conclusion............................................................................................. 195 Pour aller plus loin................................................................................ 196 Exercices................................................................................................ 196 CHAPITRE VI : Les chaînes de référence : domaines d’application......... 201 Introduction........................................................................................... 201 1. Les chaînes de référence : des outils pour analyser les textes littéraires.201 1.1. Les chaînes de référence dans un des topoï des incipit dans les romans réalistes du xixe siècle : l’arrivée du personnage principal.203 1.2. La désignation des personnages dans les fables : Esope vs La Fontaine................................................................... 208 1.3. Les chaînes de référence : un moyen d’appréhender le style d’un auteur......................................................................................... 210 1.4. Bilan........................................................................................... 212 2. Les chaînes de référence : des outils pour la didactique et l’enseignement du français............................................................ 212 2.1. L’analyse des productions écrites des chaînes de référence par le biais les brouillons.............................................................................. 214 2.2. Les « jets » textuels » (Cislaru & Olive, 2018) et la production « en direct » de chaînes de référence................................................... 217 3. Chaînes de référence et linguistique (de corpus) outillée.................... 218 3.1. Annotation et outils d’annotation............................................... 218 3.2. De l’annotation à la constitution de corpus et à la conception d’outils de traitement automatique des chaînes de référence.................... 223 4. Chaînes de référence et lisibilité des textes......................................... 225 5. Autres perspectives............................................................................ 228 5.1. Domaine juridique...................................................................... 228 5.2. Acquisition du langage, psychologie cognitive, pathologies........ 229 5.3. Domaine médical........................................................................ 230 Pour aller plus loin................................................................................ 231 Exercices................................................................................................ 231 275
TABLE DES MATIÈRES
CHAPITRE VII : Étudier les chaînes de référence : quelques pistes et conseils…...................................... 235 1. Avant de se lancer….......................................................................... 235 1.1. Dans quel cadre s’inscrit l’étude ?................................................ 235 1.2. Quels sont les « produits » académiques visés ?............................ 235 1.3. Quel est l’objet d’étude exactement ?........................................... 235 1.4. Sur quelles données travailler ?.................................................... 237 2. Une fois lancé·e….............................................................................. 238 2.1. Quoi annoter ?............................................................................. 238 2.2. Avec quel outil annoter ?............................................................. 239 2.3. Quelle ligne d’annotation adopter ?............................................. 239 2.4. Comment analyser les résultats ?................................................. 240 CONCLUSION..................................................................................... 241 REPÈRES BIBLIOGRAPHIQUES........................................................ 245 GLOSSAIRE.......................................................................................... 261 FIGURES ET TABLEAUX.................................................................... 267
276