8:["$","$L22",null,{"documentTextVersion":{"pageTexts":["Analyse du flux de dépendance dans un corpus de\nfrançais oral annoté en microsyntaxe\n\nMarie-Amélie Botalla\n\nMémoire dirigé par Sylvain Kahane\n\nMaster d'Ingénierie Linguistique, parcours Recherche et Développement\nUniversité Paris III Sorbonne Nouvelle","$23","$24","$25","$26","$27","$28","$29","$2a","$2b","$2c","$2d","$2e","$2f","$30","Chapitre 3\n\nReprésentation du flux\nEnsembles de dépendances passant par une position donnée, le flux peut être représenté de\ndifférentes façons selon les caractéristiques que l'on veut mettre en valeur. Nous introduirons ici une\nreprésentation du flux sous la forme d'une structure de traits, puis sous la forme d'une matrice. Nous\napprofondirons ensuite cette dernière représentation en en présentant les propriétés.\n\n3.1. Représentation du flux sous la forme d'une structure de traits\nPour chaque position dans le corpus, le flux de dépendance peut être représenté par une\nstructure de traits, dont le patron est présenté ci-dessous en figure 3.1.\n\nFig. 3.1. : Représentation du flux sous la forme d'une structure de traits\n\nCette structure permet ensuite de rechercher des positions du corpus où le flux remplit un\ncertain nombre de critères : elle sera donc utile à un programme de requêtes.\n\n13","$31","$32","•\n\nRemplissage du tableau\n\nOn place ensuite les dépendances dans le tableau, en fonction des numéros attribués à leurs\nextrémités. La dépendance \"longer\"-\"rails\" (notée [V, N, obj, +]) va donc en ligne 1, colonne 1 et la\ndépendance \"les\"-\"les\" (notée [D, D, para_disfl, -]) en ligne 2, colonne 2.\nLe tableau rempli est présenté ci-dessous en figure 3.5.\n1\n1\n\n2\n\n[V, N, obj, +]\n\n2\n\n[D, D, para_disfl, -]\nFig. 3.5. : Tableau rempli\n\n3.3.2. Propriétés de la matrice\nLa représentation du flux sous la forme d'une matrice permet de repérer rapidement certaines\ncaractéristiques du flux.\n•\n\nFlux disjoint\n\nPropriété : À une position donnée, le flux est disjoint et projectif si et seulement si seules les cases\nde la diagonale principale de la matrice sont remplies.\nPropriété : Deux dépendances sont disjointes si et seulement si elles ne sont placées ni sur la même\nligne, ni sur la même colonne de la matrice.\n\n1\n\n2\n\n2\n\nFig. 3.6. : Flux disjoint\n\n16\n\n1","$33","$34","$35","$36","$37","$38","$39","$3a","$3b","$3c","1\n1\n\n2\n[N, V, dep, +]\n\n2\n\n[V, Qu, obj, -]\nFig. 4.2. Matrice la plus fréquente dans les cas de croisement\n\nFig. 4.3. : Position où la matrice du flux correspond à la matrice la plus fréquente\n\nIl est intéressant de noter que ces 13 flux sont tous répartis sur un arbre différent.\n4.1.2. Typologie de quelques croisements dans le corpus Rhapsodie\n•\n\nLes liens paradigmatiques\n\nSur la totalité des croisements du corpus Rhapsodie, 114 font intervenir un ou plusieurs\nlien(s) para, soit un peu moins de 20%.\n\nFig. 4.4. : Croisement dû à un lien paradigmatique\n\nSur la figure 4.4 le lien paradigmatique entre \"quelque chose\" et \"armes\" croise le lien entre\n\"donné\" et \"à\".\n•\n\nLe passé composé\n27","$3d","$3e","Fig. 4.9. : Clitique antéposé\n\nSur la figure 4.9, la dépendance entre \"a\" et \"il\", soit celle entre le verbe et son sujet, croise\nla dépendance entre \"autres\" et \"en\", soit celle entre le complément et le clitique antéposé.\n•\n\nAutres phénomènes\n\nOn trouve dans le corpus Rhapsodie des occurrences d'une structure considérée comme rare\nen français : la relative extraposée.\n\nFig. 4.10. : Relative extraposée\n\nDans la figure 4.10 la relative extraposée \"qui prend du pain\", est de plus à une autre\nsubordonnée relative, introduite par le complément relatif \"où\". L'antécédent de la relative\nextraposée est ici le sujet de l'autre relative. La dépendance entre \"boulanger\" et \"prend\", soit la\ndépendance antécédent-verbe de la relative extraposée, croise la dépendance entre \"endroit\" et\n\"vient, soit une dépendance antécédent-modal, et celle entre \"stationner et \"où\", soit une\ndépendance verbe-adjonction, de l'autre relative.\n\n30","$3f","$40","$41","$42","$43","•\n\nAdjonction intercalée entre un mot et son complément\n\nFig. 4.19. : Adjonction intercalée entre un mot et son complément\n\nDans la figure 4.19, le croisement entre les liens \"est\"-\"aujourd'hui\" et \"cas\"-\"de\" n'est pas\naccompagné d'une insubordination.\n4.3.4. Typologie de quelques insubordinations n'entraînant pas de croisement\n•\n\nAdjonction antéposée\n\nLes adjonctions antéposées constituent la grande majorité des cas d'insubordination sans\ncroisement. On trouve de même quelques compléments obliques antéposés.\n\nFig 4.20. : Exemple de complément oblique antéposé\n\nDans la figure 4.20, la dépendance entre \"aller\" et \"là\" est insubordonnée à la dépendance\nentre \"voulais\" et \"aller\", mais cette insubordination n'est pas associée à un croisement.\n•\n\nComparaison\n\nOn note que l'unique occurrence d'une comparaison qui n'est pas associée à un croisement\nest une comparaison dont l'adjectif n'est pas prédicat d'un verbe.\n\n36","Fig. 4.21. : Comparaison\n\nDans la figure 4.21., la dépendance entre \"aussi\" et \"que\" est insubordonnée à celle entre\n\"curieux\" et \"aussi\", sans qu'on observe pour autant de croisement dans la même zone.\n4.3.5. Conclusion\nBien qu'une majorité des cas de croisement entraînent une insubordination, et vice versa,\nl'existence de contre-exemples nous contraint à réfuter l'hypothèse émise : croisement et\ninsubordination ne sont pas systématiquement cooccurrents.\n\n37","$44","$45","$46","$47","$48","Fig. 5.8. : Autre dépendance à grand empan\n\nDans la figure 5.8, la longueur de la dépendance entre \"partis\" et \"en\", étiquetée ad, entraîne\nun allongement de la dépendance entre \"et\" et \"est\", étiquetée dep. La longueur de cette seconde\ndépendance est donc due à la longueur de la première.\n•\n\nIncise ou parenthèse\n\nLes incises et les parenthèses peuvent être placées entre les deux extrémités d'une\ndépendance, ce qui implique un allongement de cette dépendance.\n\nFig. 5.9. : Parenthèses\n\nDans la figure 5.9, on trouve trois parenthèses (\"j'ai eu ce chapeau-là\", \"vraiment\" et \"je l'ai\neu\"), qui entraînent un allongement de la dépendance para_disfl entre \"à\" et \"à\". Ici, on peut même\nles considérer comme la cause de la présence de cette dépendance para_disfl. Elles entraînent aussi\nun allongement de la dépendance entre \"et\" et \"ai\", étiquetée dep.\n43","$49","et \"en\", et donc de celle entre \"et\" et \"est\", comme indiqué précédemment.\n\nFig. 5.12. : Liens paradigmatiques\n•\n\nDépendant du dépendant dans le cas d'une dépendance à tête finale\n\nSi le dépendant d'une dépendance à tête finale D1 gouverne par projection toute une suite de\nmots, alors D1 peut être une dépendance à grand empan.\nDans la figure 5.13 ci-après, la longueur de la dépendance sub entre le verbe \"dispose\" et le\nnom \"parti\" est uniquement due à la succession de mots dans la projection du dépendant.\n\n45","46\n\nFig. 5.13. : Dépendant du dépendant","$4a","$4b","$4c","Nivre, J. (2006). Constraints on Non-Projective Dependency Parsing. In Proceedings of the 11th\nConference of the European Chapter of the Association for Computational Linguistics (EACL), pp.\n73-80\nNivre, J. (2013). Training Deterministic Parsers Using Non-Deterministic Oracles. Diaporama de la\nconférence au séminaire Alpage, juin 2013\nPretkalniņa, L., Znotiņš, A., Rituma, L. et Goško, D. (2014). Dependency parsing representation\neffects on the accuracy of semantic applications — an example of an inflective language. In\nProceedings of the 9th Language Resources and Evaluation Conference (LREC), Reykjavik\nVillemonte de la Clergerie, E. (2010). Building factorized TAGs with meta-grammars. In\nProceedings of the 10th International Conference on Tree Adjoining Grammars and Related\nFormalisms - TAG+ 10, pp. 111-118\nYngve, V. (1960). A Model and an Hypothesis for Language Structure. In Proceedings of the\nAmerican Philosophical Society, Vol. 104, n° 5, pp. 444-466\n\n50","$4d","$4e","$4f","print >> fichier, col[5].encode(\"utf-8\"),\",\"\nprint >> fichier, col[4].encode(\"utf-8\"),\",\"\nprint >> fichier, col[2].encode(\"utf-8\"),\",\"\nif col[3] > 0 :\nprint >> fichier, \"+\"\nif col[3] < 0:\nprint >> fichier, \"-\"\nprint >> fichier, \"]\"\nelse:\n\nprint >> fichier, \"\",col,\"\"\nprint >> fichier, \"\"\nprint >> fichier, \"
\"\nprint >> fichier, \"
----------------
\"\nprint >> fichier, \"\"\nfichier.close()\n\n54"]},"initialDocumentData":{"document":{"access":"PUBLIC","contentRating":{"isAdsafe":true,"isExplicit":false,"isReviewed":true},"description":"","path":{"type":"user","username":"sfleury","documentName":"marie-amelie_botalla-tal-rd-1314"},"fullPageImageDimensions":[{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497},{"width":1058,"height":1497}],"originalPublishDateInISOString":"2014-11-04T20:49:39.000Z","pageCount":57,"publicationId":"60b83c4b7a209cdafb5937545e71592e","revisionId":"141104204939","title":"Analyse du flux de dépendance dans un corpus de français oral annoté en microsyntaxe","isDocumentGated":false,"username":"sfleury","documentName":"marie-amelie_botalla-tal-rd-1314"},"publisher":{"owner":{"type":"user","username":"sfleury","userId":1010051},"displayName":"Serge Fleury","userPlan":"UNKNOWN_PLAN","moreDocuments":[{"type":"user","coverRatio":1.412751677852349,"docUrl":"sfleury/docs/slides-perl","documentId":"190123163320-f6b6641479605c41e14979adb81b6669","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"f6b6641479605c41e14979adb81b6669","publicationName":"slides-perl","publishDate":{"year":2016,"month":12,"day":14},"title":"Initiation à la programmation pour le TAL avec Perl"},{"type":"user","coverRatio":1.412751677852349,"docUrl":"sfleury/docs/projet-journal-de-codage","documentId":"161023164957-5d82c7a901fe340c29401d211782cf7b","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"5d82c7a901fe340c29401d211782cf7b","publicationName":"projet-journal-de-codage","publishDate":{"year":2016,"month":10,"day":13},"title":"Projet - Journal de codage. plurital.org"},{"type":"user","coverRatio":1.412751677852349,"docUrl":"sfleury/docs/le-trameur.pptx","documentId":"181127145439-fb45829eeaa64d30996b2ff14f0184db","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"fb45829eeaa64d30996b2ff14f0184db","publicationName":"le-trameur.pptx","publishDate":{"year":2016,"month":9,"day":9},"title":"Explorer un corpus annoté avec Le Trameur / iTrameur"},{"type":"user","coverRatio":1.415126050420168,"docUrl":"sfleury/docs/slides-ecriscol-24022016-cd","documentId":"160225162400-a44cf95d8566befea725e9be019496d3","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"a44cf95d8566befea725e9be019496d3","publicationName":"slides-ecriscol-24022016-cd","publishDate":{"year":2016,"month":2,"day":24},"title":"PROJET ECRISCOL : Constituer un corpus d’écrits d’élèves : collecte et traitement des données"},{"type":"user","coverRatio":0.7074910820451843,"docUrl":"sfleury/docs/pierre-godard-memoire-tal-rd-1314","documentId":"151029170953-29ed10b6bc19b9b72abfb4b75308a5e6","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"29ed10b6bc19b9b72abfb4b75308a5e6","publicationName":"pierre-godard-memoire-tal-rd-1314","publishDate":{"year":2015,"month":10,"day":29},"title":"Typologie pour l’alignement multilingue. Pierre godard."},{"type":"user","coverRatio":0.7727272727272727,"docUrl":"sfleury/docs/asma-zamiti-tal-rd-1415.pdf","documentId":"150701153713-79b404cf3a5367831da3b5f11a9c9572","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"79b404cf3a5367831da3b5f11a9c9572","publicationName":"asma-zamiti-tal-rd-1415.pdf","publishDate":{"year":2015,"month":7,"day":1},"title":"Asma Zamiti Master TAL R&D 2014-2015"},{"type":"user","coverRatio":1.415126050420168,"docUrl":"sfleury/docs/problemes-transcription-annotation-","documentId":"150629075848-d7981754b4efd7c5cee5216e0ab18459","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"d7981754b4efd7c5cee5216e0ab18459","publicationName":"problemes-transcription-annotation-","publishDate":{"year":2015,"month":6,"day":29},"title":"Sara Mazziotti, Vanda Enoiu : \"Problèmes liés à la transcription et à l'annotation\""},{"type":"user","coverRatio":1.3333333333333333,"docUrl":"sfleury/docs/roubaud_marie-noelle-corpus-ecrits-","documentId":"150622161254-db2f9519b606dbfde5660f7eaf6a303e","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"db2f9519b606dbfde5660f7eaf6a303e","publicationName":"roubaud_marie-noelle-corpus-ecrits-","publishDate":{"year":2015,"month":6,"day":22},"title":"Marie-Noëlle ROUBAUD. Principes méthodologiques pour l’établissement d’un corpus de textes scolaires"},{"type":"user","coverRatio":1.415126050420168,"docUrl":"sfleury/docs/je_ecriscol_presentation_tluong","documentId":"150325173450-33c68b5cb9e36be338cda6a2c5d7d302","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"33c68b5cb9e36be338cda6a2c5d7d302","publicationName":"je_ecriscol_presentation_tluong","publishDate":{"year":2015,"month":3,"day":25},"title":"Exploration de corpus d'écrits d'étudiants"},{"type":"user","coverRatio":1.3333333333333333,"docUrl":"sfleury/docs/poudat_je_ecriscol","documentId":"150325173730-3305c85c1cbc5303edf1f37b1987a49c","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"3305c85c1cbc5303edf1f37b1987a49c","publicationName":"poudat_je_ecriscol","publishDate":{"year":2015,"month":3,"day":25},"title":"Eléments de méthode pour explorer des contrastes et des hypothèses en corpus"},{"type":"user","coverRatio":1.7777777777777777,"docUrl":"sfleury/docs/rinck_jacques_corpusdelitteracieava","documentId":"150325173836-8641ec650de99e928638ba080b813441","ownerDisplayName":"Serge Fleury","ownerUsername":"sfleury","publicationId":"8641ec650de99e928638ba080b813441","publicationName":"rinck_jacques_corpusdelitteracieava","publishDate":{"year":2015,"month":3,"day":25},"title":"Corpus de littératie avancée : structuration et métadonnées"}],"licenses":{"removeSignupButton":false,"hideAdsInReader":false,"hideReadMoreSection":false},"username":"sfleury","userId":1010051},"visitor":{"isLoggedIn":false,"readerplusWeeklyPrice":{"currencyCode":"USD","unitAmount":99}},"articleSummaries":[],"articleStorySummaries":"$8:props:initialDocumentData:articleSummaries","iabCategories":[],"categories":[]},"initialPageNumber":1,"initialViewportWidth":1024,"referrer":"","isCrawler":true,"experiments":[]}]