OpenCorpus

Page 1

OpenCorpus Une édition électronique des sources de la Maison de Béthune


3 axes de recherche

Établir et analyser le réseau de relations de la Maison de Béthune en dehors de la seigneurie. Analyser le mode de gestion et les relations au sein de la seigneurie. Étudier une méthode d'analyse et de présentation numérique du corpus.

07/03/2008

Jean-François CAUCHE

2


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

3


Cadre temporel 999 : charte de fondation de la collégiale SaintBarthélemy de Béthune.

1248 : mort de Robert VII, dernier seigneur en titre de Béthune.

07/03/2008

Jean-François CAUCHE

4


Localisation géographique

07/03/2008

Jean-François CAUCHE

5


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

6


Généalogie 1

07/03/2008

7


Généalogie 2

07/03/2008

8


Évolution de la production écrite Évolution de la production des actes. 90 80 70 60 50

Nombre d'actes

40 30 20 10 0 Robert Ier

07/03/2008

Robert II

Robert III

Robert IV

Jean-François CAUCHE

Guillau me Ier

Robert V

Robert VI

Guillau me II

Daniel

Robert VII

9


Une identité qui se cherche Les attributs du pouvoir Une monnaie béthunoise Défense du territoire (ost, contrôle de l'espace public...) Justice Titulatures (Dei Gratia) Un fidèle vassal du Comte de Flandres Des relations ambigûes entre France et Angleterre

07/03/2008

Jean-François CAUCHE

10


Un réseau structuré de manières diverses

Vassalité et hommages motivés par les dons Pairs, hommes, vavasseurs... une vassalité graduée Curia comitis Entretien d'un personnel seigneurial Un garant régulier (dettes et garanties) Le mariage, un outil au service du réseau

07/03/2008

Jean-François CAUCHE

11


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

12


Un protecteur fidèle ou éphémère Saint-Vaast, une avouerie de première importance Un territoire commun avec l'Église : l'alleu SaintVaast Des protections éphéméres : Hénin, Saint-Bavon... Chartes de franchise, un acte de générosité à tendance économique et politique

07/03/2008

Jean-François CAUCHE

13


Une générosité mesurée Donations aux établissements religieux 30 27,5 25 22,5 20 17,5 15

Nombre de dons

12,5 10 7,5 5 2,5 0

Anchi n

07/03/2008

Choc ques

Maro euil

Mont- Saint- Saint- Saint- Termo Warn Religi Saint- Barth Pry Vaast nde eton eux Éloi élemy

Jean-François CAUCHE

Diver s

14


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurée Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

15


Anatomie du document 1

07/03/2008

Jean-Franรงois CAUCHE

16


Anatomie du document 2

07/03/2008

Jean-Franรงois CAUCHE

17


Anatomie du document 3

07/03/2008

Jean-Franรงois CAUCHE

18


Anatomie du document 4

07/03/2008

Jean-Franรงois CAUCHE

19


Anatomie du document 5

07/03/2008

Jean-Franรงois CAUCHE

20


Anatomie du document 6

07/03/2008

Jean-Franรงois CAUCHE

21


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

22


Historique / XML 1952-1959 : premiers langages informatiques (Fortran, Lisp, Cobol...) 1969 : SGML (Standard Generalized Markup Language) 1990 : HTML 1.0 (Hypertext Markup Language) 1995 : HTML 2.0 1996 : HTML 3.0 1997 : HTML 4.0 1998 : XML

07/03/2008

Jean-Franรงois CAUCHE

23


Exemple / HTML <html> <head> <title>Identity</title> </head> <body> <p>Nom : CAUCHE<br/> Prénom : Jean-François</p> </body> </html>

07/03/2008

Jean-François CAUCHE

24


Exemple / XML <?xml version='1.0' encoding='UTF-8'?> <liste> <item> <lname>CAUCHE</lname> <fname>Jean-Franรงois</fname> </item> </liste>

07/03/2008

Jean-Franรงois CAUCHE

25


Champs d'application du XML Messagerie : XML en tant que format standard pour l'échange de données (par exemple : XML/EDI) Traitement : banque et commerce électronique. Documentaire : structuration du document. Collaboratif : l'auteur décide du contenu, le lecteur de la présentation. Publication : présentation variable et automisée de l'information. Recherche : Recherche intelligente d'information Intégration de système : Echanges automatisés, EAI, etc. 07/03/2008

Jean-François CAUCHE

26


Avantages / Inconvénients Format TXT

XML verbeux

Standard

Format lourd

Strict

Moins à l'aise avec les données tabulaires

Extensible Structuré et hiérarchique Possibilité d'ajouter des commentaires.

07/03/2008

Jean-François CAUCHE

27


PHP – MYSQL vs. XML / Avant. - Inconv. Rapide Requêtes efficaces Convient bien à des données tabulaires

Métalange extensible Transformable à l'infini

Trop de tables Impossibilité de baliser le texte 1 champ = 1 donnée

Fichiers importants Requêtes lourdes à gérer

07/03/2008

Jean-François CAUCHE

28


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

29


Définitions : édition électonique

Édition électronique Tout acte par lequel un texte ou un document est saisi, reproduit et rediffusé par l'intermédiaire d'un support informatique ou «électronique» quelconque.

07/03/2008

Jean-François CAUCHE

30


Modèle de l'édition électronique Numéro de l'acte Date & Lieu Analyse Tradition manuscrite Tradition imprimée Indications Transcription Notes

07/03/2008

Jean-François CAUCHE

31


Hypertexte : Définition

Hypertexte Un système hypertexte est un système contenant des documents liés entre eux par des hyperliens permettant de passer du document consulté à un autre document lié.

07/03/2008

Jean-François CAUCHE

32


Exemple / HTML

Web 2.0 interaction entre les utilisateurs et le contenu ● évolution des supports permettant de consulter les sites web, leurs différents formats ● l'internaute est acteur.

+

07/03/2008

Jean-François CAUCHE

Web 3.0 Évolution, transformation du web en une base de données.

+ Web sémantique Ensemble de technologies visant à rendre le contenu des ressources du Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles.

33


Principes : KISS

KISS KEEP

07/03/2008

Jean-Franรงois CAUCHE

IT

SIMPLE

STUPID

34


Principes : Interopérabilité

Interopérabilité L'interopérabilité est la capacité que possède un produit ou un système dont les interfaces sont intégralement connues à fonctionner avec d'autres produits ou systèmes existants ou futurs.

07/03/2008

Jean-François CAUCHE

35


Principes : licence libre

G. P. L. GNU

07/03/2008

Jean-Franรงois CAUCHE

PUBLIC

LICENSE

36


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

37


XML - Définition

DTD (Document Type Definition) Document ou “grammaire” permettant de décrire un modèle de document SGML ou XML. Une DTD indique les noms des éléments pouvant apparaître et leur contenu.

07/03/2008

Jean-François CAUCHE

38


XML OpenCorpus

07/03/2008

Jean-Franรงois CAUCHE

39


Chaîne de traitement / XML

07/03/2008

Jean-François CAUCHE

40


Texte vers XML [1] Ego Johannes, dominus Nigellae castellanus Brugensis, omnibus notum facio presentes litteras inspec [2] turis quod ego pro me debitorem constitui karissimum consanguineum et amicum meum Dani [3] elem, advocatum Attrebatensem et dominum Bethunie, erga dilectos meos Andream Wa [4] gon et Robertum Cosseth, cives Attrebatenses, de tanto quod littere mee testificabun [5] tur quod dicti burgenses mii accomodaverint usque ad tria milia libras parisiensis. <ln num="1"/>Ego <name-pers function="débiteur" alt="Jean, seigneur de Noyelles, châtelain de Bruges" id="996">Johannes, dominus Nigellae castellanus Brugensis</name-pers>,</block></section-mark><section-mark type="texte"><block type="notif"> omnibus notum facio presentes litteras inspec<ln num="2"/>turis quod</block><block type="dispo"> ego pro me debitorem constitui karissimum consanguineum et amicum meum <name-pers function="créancier" alt="Daniel, avoué d'Arras et seigneur de Béthune" id="1709">Dani<ln num="3"/>elem, advocatum Attrebatensem et dominum Bethunie</name-pers>, erga dilectos meos <name-pers function="créancier" alt="André Wagon, bourgeois d'Arras" id="3105">Andream Wa<ln num="4"/>gon</name-pers> et <name-pers function="créancier" alt="Robert Cosseth, bourgoies d'Arras" id="2013">Robertum Cosseth</name-pers>, cives Attrebatenses, de tanto quod littere mee testificabun<ln num="5"/>tur quod dicti burgenses mii accomodaverint usque ad <money goal="dette"><sum arab="3000" type="livres" regio="Paris" metal="">tria milia libras parisiensis</sum></money>.

07/03/2008

Jean-François CAUCHE

41


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

42


OpenCorpus / Exemples : persona <!ELEMENT persona (item*)> <!ELEMENT item EMPTY> <!ATTLIST item content CDATA #REQUIRED type (aut | disp | dest | benef | impet | redac | scribe) #REQUIRED> <persona> <item content="Jean, seigneur de Noyelles, châtelain de Bruges" type="aut"/> <item content="Daniel, avoué d'Arras, seigneur de Béthune" type="benef"/> </persona>

07/03/2008

Jean-François CAUCHE

43


OpenCorpus / Exemples : datation & localisation <!ELEMENT datation EMPTY> <!ATTLIST datation style CDATA #IMPLIEDdatefix CDATA #REQUIRED datelim CDATA #IMPLIED> <!ELEMENT location (#PCDATA)> <datation datefix="1220" datelim="1222"/> <location>Béthune</location>

07/03/2008

Jean-François CAUCHE

44


OpenCorpus / Exemples : source 1 <!ELEMENT source (doc)*> <!ELEMENT doc (serial, chiro, descrip, mention)?> <!ATTLIST doc type (original | copie | cartulaire | registre | notice) #REQUIRED support (parchemin | papier ) #IMPLIED script-type CDATA #IMPLIED> <!ELEMENT serial EMPTY> <!ATTLIST serial spot-arch CDATA#IMPLIED serial-arch CDATA #IMPLIED> <!ELEMENT chiro (#PCDATA)> <!ELEMENT descrip (forme, sceau?)> <!ELEMENT forme EMPTY> <!ATTLIST forme carta ( transversa | nontransversa ) #REQUIRED lgh CDATA #REQUIRED lgb CDATA #IMPLIED htg CDATA #REQUIRED htd CDATA #IMPLIED> <!ELEMENT sceau (#PCDATA)> <!ATTLIST sceau material CDATA #IMPLIED color CDATA #IMPLIED> <!ELEMENT mention-lis (mention*)> <!ELEMENT mention (#PCDATA)>

07/03/2008

Jean-Franรงois CAUCHE

45


OpenCorpus / Exemples : source 2 <source> <doc type="original" support="parchemin"> <serial spot-arch="A.D.N." serial-arch="B 1008/345"/> <descrip> <forme carta="nontransversa" lgh="140" htg="60"/> <sceau>Jadis muni d’un sceau, pendant sur double queue de parchemin.</sceau> </descrip> <mention-list> <mention>1220. Promesse de Jean, s[eigneur] de Migelle, chastelain de Bruges à Daniel avoué d’Arras, son cousin, de le dédomager de tout interest quil pouvoit encourir à cause de la caution à laquelle il s’estoit obligé pour luy envers quelques bourgeois d’Arras pour la somme de 3000 livres parisis.</mention> <mention>le dimanche après quintanam</mention> </mention-list> </doc> </source>

07/03/2008

Jean-François CAUCHE

46


OpenCorpus / Exemples : structuration du texte 1 <!ELEMENT text (section-mark)> <!ATTLIST text oredit CDATA #REQUIRED ponct ( same | modern ) #IMPLIED> <!ELEMENT section-mark (block)> <!ATTLIST section-mark type ( protocole | texte | eschatocole ) #REQUIRED> <!ELEMENT block (ponct-init | name-pers | name-loc | clause | note | incert | vari | add | retab | blank | litel | ecret | tab | alinea | hand | tache | trch | superior | symbol | figure | lines | addht | over | defin | mesure | money | info-remark | parag | list | highlight)*> <!ATTLIST block type ( invoc | subscrip | adress | salut | preamb | notif | expo | dispo | corrob | date | apprec | mht) #REQUIRED>

07/03/2008

Jean-Franรงois CAUCHE

47


OpenCorpus / Exemples : structuration du texte 2 [Protocole ---> [Souscription ---> Ego Johannes, dominus Nigellae castellanus Brugensis,]] [Texte ---> [Notification ---> omnibus notum facio presentes litteras inspecturis quod] [Dispositif ---> ego pro me debitorem constitui karissimum consanguineum et amicum meum Danielem, advocatum Attrebatensem et dominum Bethunie, erga dilectos meos Andream Wagon et Robertum Cosseth, cives Attrebatenses, de tanto quod littere mee testificabun tur quod dicti burgenses mii accomodaverint usque ad tria milia libras parisiensis. Creantavi etiam dicto advocato per abbandonem omnium rerum mearum quod cum deliberabo de predicto debito et de omnibus cultis que occasione istius debiti ei provenirent.]] [Eschatocole ---> [Datation --->

Actum anno Domini M°.CC°.

vicesimo prima dominica post Quintanam.]]

07/03/2008

Jean-François CAUCHE

48


OpenCorpus / Exemples : nom de personne <!ELEMENT name-pers (#PCDATA)> <!ATTLIST name-pers function CDATA #IMPLIED alt CDATA #IMPLIED id CDATA #REQUIRED lang CDATA #IMPLIED rem CDATA #IMPLIED> <name-pers function="débiteur" alt="Jean, seigneur de Noyelles, châtelain de Bruges" id="996">Johannes, dominus Nigellae castellanus Brugensis</name-pers> <name-pers function="créancier" alt="André Wagon, bourgeois d'Arras" id="3105">Andream Wagon</name-pers>

07/03/2008

Jean-François CAUCHE

49


OpenCorpus / Exemples : somme d'argent <!ELEMENT money (sum+)> <!ELEMENT sum (#PCDATA)> <!ATTLIST sum arab CDATA #REQUIRED type CDATA #REQUIRED regio CDATA #IMPLIED metal CDATA #IMPLIED> <money goal="dette"> <sum arab="3000" type="livres" regio="Paris">tria milia libras parisiensis</sum> </money>

07/03/2008

Jean-Franรงois CAUCHE

50


OpenCorpus / Exemples : mais encore... mesures agraires variation du texte changement de main ajout du scribe note en marge ou hors-ligne tâches, trous, déchirures... alinéa lettrine lettres alongées ou étirées ajout de définition notes

07/03/2008

Jean-François CAUCHE

rétablissement ou correction du texte éléments barrés symboles lignes numéros de lignes images bibliographie remarques d'ordre informatique contact

51


Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir

07/03/2008

Jean-François CAUCHE

52


OpenCorpus / Regrets Constitue un prototype non finalisé Ensemble du corpus non traité Balisage manuel Traitement du texte en mode client et non serveur N'a pu servir de base pour l'analyse historique pour une question de timing

07/03/2008

Jean-François CAUCHE

53


OpenCorpus / À venir... Interface dynamique en PHP pour intégration de nouveaux textes + flux RSS Aspect graphique Web 2.0 + strict XHTML Balisage complet du corpus Traitement du texte en mode serveur Automatisation du balisage grâce au langage Rebol sur base de dictionnaires

07/03/2008

Jean-François CAUCHE

54


OpenCorpus : Un réseau social ?

Mes sources Mes documents Mes transcriptions Mes analyses Ma bibliographie Mes contacts...

07/03/2008

Jean-François CAUCHE

55


OpenCorpus Jean-Franรงois CAUCHE jeanfr.cauche@gmail.com


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.