OpenCorpus Une édition électronique des sources de la Maison de Béthune
3 axes de recherche
➔
➔
➔
Établir et analyser le réseau de relations de la Maison de Béthune en dehors de la seigneurie. Analyser le mode de gestion et les relations au sein de la seigneurie. Étudier une méthode d'analyse et de présentation numérique du corpus.
07/03/2008
Jean-François CAUCHE
2
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
3
Cadre temporel 999 : charte de fondation de la collégiale SaintBarthélemy de Béthune.
1248 : mort de Robert VII, dernier seigneur en titre de Béthune.
07/03/2008
Jean-François CAUCHE
4
Localisation géographique
07/03/2008
Jean-François CAUCHE
5
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
6
Généalogie 1
07/03/2008
7
Généalogie 2
07/03/2008
8
Évolution de la production écrite Évolution de la production des actes. 90 80 70 60 50
Nombre d'actes
40 30 20 10 0 Robert Ier
07/03/2008
Robert II
Robert III
Robert IV
Jean-François CAUCHE
Guillau me Ier
Robert V
Robert VI
Guillau me II
Daniel
Robert VII
9
Une identité qui se cherche Les attributs du pouvoir Une monnaie béthunoise Défense du territoire (ost, contrôle de l'espace public...) Justice Titulatures (Dei Gratia) Un fidèle vassal du Comte de Flandres Des relations ambigûes entre France et Angleterre
07/03/2008
Jean-François CAUCHE
10
Un réseau structuré de manières diverses
Vassalité et hommages motivés par les dons Pairs, hommes, vavasseurs... une vassalité graduée Curia comitis Entretien d'un personnel seigneurial Un garant régulier (dettes et garanties) Le mariage, un outil au service du réseau
07/03/2008
Jean-François CAUCHE
11
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
12
Un protecteur fidèle ou éphémère Saint-Vaast, une avouerie de première importance Un territoire commun avec l'Église : l'alleu SaintVaast Des protections éphéméres : Hénin, Saint-Bavon... Chartes de franchise, un acte de générosité à tendance économique et politique
07/03/2008
Jean-François CAUCHE
13
Une générosité mesurée Donations aux établissements religieux 30 27,5 25 22,5 20 17,5 15
Nombre de dons
12,5 10 7,5 5 2,5 0
Anchi n
07/03/2008
Choc ques
Maro euil
Mont- Saint- Saint- Saint- Termo Warn Religi Saint- Barth Pry Vaast nde eton eux Éloi élemy
Jean-François CAUCHE
Diver s
14
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurée Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
15
Anatomie du document 1
07/03/2008
Jean-Franรงois CAUCHE
16
Anatomie du document 2
07/03/2008
Jean-Franรงois CAUCHE
17
Anatomie du document 3
07/03/2008
Jean-Franรงois CAUCHE
18
Anatomie du document 4
07/03/2008
Jean-Franรงois CAUCHE
19
Anatomie du document 5
07/03/2008
Jean-Franรงois CAUCHE
20
Anatomie du document 6
07/03/2008
Jean-Franรงois CAUCHE
21
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
22
Historique / XML 1952-1959 : premiers langages informatiques (Fortran, Lisp, Cobol...) 1969 : SGML (Standard Generalized Markup Language) 1990 : HTML 1.0 (Hypertext Markup Language) 1995 : HTML 2.0 1996 : HTML 3.0 1997 : HTML 4.0 1998 : XML
07/03/2008
Jean-Franรงois CAUCHE
23
Exemple / HTML <html> <head> <title>Identity</title> </head> <body> <p>Nom : CAUCHE<br/> Prénom : Jean-François</p> </body> </html>
07/03/2008
Jean-François CAUCHE
24
Exemple / XML <?xml version='1.0' encoding='UTF-8'?> <liste> <item> <lname>CAUCHE</lname> <fname>Jean-Franรงois</fname> </item> </liste>
07/03/2008
Jean-Franรงois CAUCHE
25
Champs d'application du XML Messagerie : XML en tant que format standard pour l'échange de données (par exemple : XML/EDI) Traitement : banque et commerce électronique. Documentaire : structuration du document. Collaboratif : l'auteur décide du contenu, le lecteur de la présentation. Publication : présentation variable et automisée de l'information. Recherche : Recherche intelligente d'information Intégration de système : Echanges automatisés, EAI, etc. 07/03/2008
Jean-François CAUCHE
26
Avantages / Inconvénients Format TXT
XML verbeux
Standard
Format lourd
Strict
Moins à l'aise avec les données tabulaires
Extensible Structuré et hiérarchique Possibilité d'ajouter des commentaires.
07/03/2008
Jean-François CAUCHE
27
PHP – MYSQL vs. XML / Avant. - Inconv. Rapide Requêtes efficaces Convient bien à des données tabulaires
Métalange extensible Transformable à l'infini
Trop de tables Impossibilité de baliser le texte 1 champ = 1 donnée
Fichiers importants Requêtes lourdes à gérer
07/03/2008
Jean-François CAUCHE
28
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
29
Définitions : édition électonique
Édition électronique Tout acte par lequel un texte ou un document est saisi, reproduit et rediffusé par l'intermédiaire d'un support informatique ou «électronique» quelconque.
07/03/2008
Jean-François CAUCHE
30
Modèle de l'édition électronique Numéro de l'acte Date & Lieu Analyse Tradition manuscrite Tradition imprimée Indications Transcription Notes
07/03/2008
Jean-François CAUCHE
31
Hypertexte : Définition
Hypertexte Un système hypertexte est un système contenant des documents liés entre eux par des hyperliens permettant de passer du document consulté à un autre document lié.
07/03/2008
Jean-François CAUCHE
32
Exemple / HTML
Web 2.0 interaction entre les utilisateurs et le contenu ● évolution des supports permettant de consulter les sites web, leurs différents formats ● l'internaute est acteur.
+
●
07/03/2008
Jean-François CAUCHE
Web 3.0 Évolution, transformation du web en une base de données.
+ Web sémantique Ensemble de technologies visant à rendre le contenu des ressources du Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles.
33
Principes : KISS
KISS KEEP
07/03/2008
Jean-Franรงois CAUCHE
IT
SIMPLE
STUPID
34
Principes : Interopérabilité
Interopérabilité L'interopérabilité est la capacité que possède un produit ou un système dont les interfaces sont intégralement connues à fonctionner avec d'autres produits ou systèmes existants ou futurs.
07/03/2008
Jean-François CAUCHE
35
Principes : licence libre
G. P. L. GNU
07/03/2008
Jean-Franรงois CAUCHE
PUBLIC
LICENSE
36
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
37
XML - Définition
DTD (Document Type Definition) Document ou “grammaire” permettant de décrire un modèle de document SGML ou XML. Une DTD indique les noms des éléments pouvant apparaître et leur contenu.
07/03/2008
Jean-François CAUCHE
38
XML OpenCorpus
07/03/2008
Jean-Franรงois CAUCHE
39
Chaîne de traitement / XML
07/03/2008
Jean-François CAUCHE
40
Texte vers XML [1] Ego Johannes, dominus Nigellae castellanus Brugensis, omnibus notum facio presentes litteras inspec [2] turis quod ego pro me debitorem constitui karissimum consanguineum et amicum meum Dani [3] elem, advocatum Attrebatensem et dominum Bethunie, erga dilectos meos Andream Wa [4] gon et Robertum Cosseth, cives Attrebatenses, de tanto quod littere mee testificabun [5] tur quod dicti burgenses mii accomodaverint usque ad tria milia libras parisiensis. <ln num="1"/>Ego <name-pers function="débiteur" alt="Jean, seigneur de Noyelles, châtelain de Bruges" id="996">Johannes, dominus Nigellae castellanus Brugensis</name-pers>,</block></section-mark><section-mark type="texte"><block type="notif"> omnibus notum facio presentes litteras inspec<ln num="2"/>turis quod</block><block type="dispo"> ego pro me debitorem constitui karissimum consanguineum et amicum meum <name-pers function="créancier" alt="Daniel, avoué d'Arras et seigneur de Béthune" id="1709">Dani<ln num="3"/>elem, advocatum Attrebatensem et dominum Bethunie</name-pers>, erga dilectos meos <name-pers function="créancier" alt="André Wagon, bourgeois d'Arras" id="3105">Andream Wa<ln num="4"/>gon</name-pers> et <name-pers function="créancier" alt="Robert Cosseth, bourgoies d'Arras" id="2013">Robertum Cosseth</name-pers>, cives Attrebatenses, de tanto quod littere mee testificabun<ln num="5"/>tur quod dicti burgenses mii accomodaverint usque ad <money goal="dette"><sum arab="3000" type="livres" regio="Paris" metal="">tria milia libras parisiensis</sum></money>.
07/03/2008
Jean-François CAUCHE
41
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
42
OpenCorpus / Exemples : persona <!ELEMENT persona (item*)> <!ELEMENT item EMPTY> <!ATTLIST item content CDATA #REQUIRED type (aut | disp | dest | benef | impet | redac | scribe) #REQUIRED> <persona> <item content="Jean, seigneur de Noyelles, châtelain de Bruges" type="aut"/> <item content="Daniel, avoué d'Arras, seigneur de Béthune" type="benef"/> </persona>
07/03/2008
Jean-François CAUCHE
43
OpenCorpus / Exemples : datation & localisation <!ELEMENT datation EMPTY> <!ATTLIST datation style CDATA #IMPLIEDdatefix CDATA #REQUIRED datelim CDATA #IMPLIED> <!ELEMENT location (#PCDATA)> <datation datefix="1220" datelim="1222"/> <location>Béthune</location>
07/03/2008
Jean-François CAUCHE
44
OpenCorpus / Exemples : source 1 <!ELEMENT source (doc)*> <!ELEMENT doc (serial, chiro, descrip, mention)?> <!ATTLIST doc type (original | copie | cartulaire | registre | notice) #REQUIRED support (parchemin | papier ) #IMPLIED script-type CDATA #IMPLIED> <!ELEMENT serial EMPTY> <!ATTLIST serial spot-arch CDATA#IMPLIED serial-arch CDATA #IMPLIED> <!ELEMENT chiro (#PCDATA)> <!ELEMENT descrip (forme, sceau?)> <!ELEMENT forme EMPTY> <!ATTLIST forme carta ( transversa | nontransversa ) #REQUIRED lgh CDATA #REQUIRED lgb CDATA #IMPLIED htg CDATA #REQUIRED htd CDATA #IMPLIED> <!ELEMENT sceau (#PCDATA)> <!ATTLIST sceau material CDATA #IMPLIED color CDATA #IMPLIED> <!ELEMENT mention-lis (mention*)> <!ELEMENT mention (#PCDATA)>
07/03/2008
Jean-Franรงois CAUCHE
45
OpenCorpus / Exemples : source 2 <source> <doc type="original" support="parchemin"> <serial spot-arch="A.D.N." serial-arch="B 1008/345"/> <descrip> <forme carta="nontransversa" lgh="140" htg="60"/> <sceau>Jadis muni d’un sceau, pendant sur double queue de parchemin.</sceau> </descrip> <mention-list> <mention>1220. Promesse de Jean, s[eigneur] de Migelle, chastelain de Bruges à Daniel avoué d’Arras, son cousin, de le dédomager de tout interest quil pouvoit encourir à cause de la caution à laquelle il s’estoit obligé pour luy envers quelques bourgeois d’Arras pour la somme de 3000 livres parisis.</mention> <mention>le dimanche après quintanam</mention> </mention-list> </doc> </source>
07/03/2008
Jean-François CAUCHE
46
OpenCorpus / Exemples : structuration du texte 1 <!ELEMENT text (section-mark)> <!ATTLIST text oredit CDATA #REQUIRED ponct ( same | modern ) #IMPLIED> <!ELEMENT section-mark (block)> <!ATTLIST section-mark type ( protocole | texte | eschatocole ) #REQUIRED> <!ELEMENT block (ponct-init | name-pers | name-loc | clause | note | incert | vari | add | retab | blank | litel | ecret | tab | alinea | hand | tache | trch | superior | symbol | figure | lines | addht | over | defin | mesure | money | info-remark | parag | list | highlight)*> <!ATTLIST block type ( invoc | subscrip | adress | salut | preamb | notif | expo | dispo | corrob | date | apprec | mht) #REQUIRED>
07/03/2008
Jean-Franรงois CAUCHE
47
OpenCorpus / Exemples : structuration du texte 2 [Protocole ---> [Souscription ---> Ego Johannes, dominus Nigellae castellanus Brugensis,]] [Texte ---> [Notification ---> omnibus notum facio presentes litteras inspecturis quod] [Dispositif ---> ego pro me debitorem constitui karissimum consanguineum et amicum meum Danielem, advocatum Attrebatensem et dominum Bethunie, erga dilectos meos Andream Wagon et Robertum Cosseth, cives Attrebatenses, de tanto quod littere mee testificabun tur quod dicti burgenses mii accomodaverint usque ad tria milia libras parisiensis. Creantavi etiam dicto advocato per abbandonem omnium rerum mearum quod cum deliberabo de predicto debito et de omnibus cultis que occasione istius debiti ei provenirent.]] [Eschatocole ---> [Datation --->
Actum anno Domini M°.CC°.
vicesimo prima dominica post Quintanam.]]
07/03/2008
Jean-François CAUCHE
48
OpenCorpus / Exemples : nom de personne <!ELEMENT name-pers (#PCDATA)> <!ATTLIST name-pers function CDATA #IMPLIED alt CDATA #IMPLIED id CDATA #REQUIRED lang CDATA #IMPLIED rem CDATA #IMPLIED> <name-pers function="débiteur" alt="Jean, seigneur de Noyelles, châtelain de Bruges" id="996">Johannes, dominus Nigellae castellanus Brugensis</name-pers> <name-pers function="créancier" alt="André Wagon, bourgeois d'Arras" id="3105">Andream Wagon</name-pers>
07/03/2008
Jean-François CAUCHE
49
OpenCorpus / Exemples : somme d'argent <!ELEMENT money (sum+)> <!ELEMENT sum (#PCDATA)> <!ATTLIST sum arab CDATA #REQUIRED type CDATA #REQUIRED regio CDATA #IMPLIED metal CDATA #IMPLIED> <money goal="dette"> <sum arab="3000" type="livres" regio="Paris">tria milia libras parisiensis</sum> </money>
07/03/2008
Jean-Franรงois CAUCHE
50
OpenCorpus / Exemples : mais encore... mesures agraires variation du texte changement de main ajout du scribe note en marge ou hors-ligne tâches, trous, déchirures... alinéa lettrine lettres alongées ou étirées ajout de définition notes
07/03/2008
Jean-François CAUCHE
rétablissement ou correction du texte éléments barrés symboles lignes numéros de lignes images bibliographie remarques d'ordre informatique contact
51
Plan Une seigneurie des Flandres Contexte historique et géographique Une famille & un réseau Une piété et générosité mesurées Qu'est-ce que l'édition électronique ? Anatomie du document Langages et bases de données Quel modèle ? Principes et orientation. OpenCorpus, une DTD pour l'édition électronique médiévale Fonctionnement Exemples Constat et avenir
07/03/2008
Jean-François CAUCHE
52
OpenCorpus / Regrets Constitue un prototype non finalisé Ensemble du corpus non traité Balisage manuel Traitement du texte en mode client et non serveur N'a pu servir de base pour l'analyse historique pour une question de timing
07/03/2008
Jean-François CAUCHE
53
OpenCorpus / À venir... Interface dynamique en PHP pour intégration de nouveaux textes + flux RSS Aspect graphique Web 2.0 + strict XHTML Balisage complet du corpus Traitement du texte en mode serveur Automatisation du balisage grâce au langage Rebol sur base de dictionnaires
07/03/2008
Jean-François CAUCHE
54
OpenCorpus : Un réseau social ?
Mes sources Mes documents Mes transcriptions Mes analyses Ma bibliographie Mes contacts...
07/03/2008
Jean-François CAUCHE
55
OpenCorpus Jean-Franรงois CAUCHE jeanfr.cauche@gmail.com