Cette page Web permet d’accéder à l’ensemble des documents (listes des participants, supports
d’intervention, fichiers exemples, ressources diverses) utilisés pendant la formation sur TEI
organisée par l’École nationale des chartes (ENC) à Paris les 4, 5, 10, 11 et 12 juin 2009.
Dernière mise à jour de cette page : 6 novembre 2009.
Nota : pour l’instant, tous les documents ne sont pas réunis. Ce sera le cas
très bientôt.
Présentation de la formation
Dans le cadre de son offre de formation continue, l’École nationale des chartes a organisé un
stage de 5 jours les 4-5,10-12 juin 2009 sur la mise en œuvre du modèle XML/TEI (Text Encoding
Initiative, http://www.tei-c.org) pour l’édition électronique de textes.
Public visé : toute personne engagée dans un projet d’édition électronique de textes anciens,
tels que des sources primaires manuscrites. Etaient notamment concernés des chercheurs en histoire et en
littérature, des gestionnaires de collections patrimoniales, des informaticiens...
Objectifs : permettre aux participants de se familiariser avec TEI et d’acquérir une première
expérience d’encodage en TEI P5, pour mener un projet d’édition électronique de corpus textuels. Ces
objectifs rejoignent ceux du centre de ressources numériques TELMA (Traitement électronique des
manuscrits et des archives, http://www.cn-telma.fr) co-piloté par l’École des chartes, et plus largement
ceux du TGE ADONIS (Accès unifié aux données et documents numériques des sciences humaines et
sociales, http://www.tge-adonis.fr).
Pré-requis : savoir utiliser un traitement de texte, un navigateur Web,
éventuellement connaître les grandes lignes du langage XML (ce dernier point a de toute façon été présenté le premier jour).
On peut télécharger le programme du stage.
Retour au début
Documentation de la formation
La documentation est organisée en fonction du programme du stage.
Première journée (4 juin) : introduction théorique
Retour au début
Deuxième journée (5 juin) : travaux pratiques (1)
Les travaux pratiques, animés par Florence Clavaud, ont permis d’installer (pour ceux qui avaient apporté leur
ordinateur portable et n’en disposaient pas) le logiciel oXygen dans sa version 10.2. Cet
environnement de développement XML est un bon éditeur XML parmi d’autres, qui embarque le modèle TEI et diverses
ressources (CSS, XSLT) applicables à des documents TEI. C’est un logiciel commercial propriété de la société Synchro
Soft Ltd ; il est actuellement utilisé par l’ENC pour équiper à un coût relativement modique les ordinateurs de la salle de formation et
les ordinateurs de ses étudiants, ainsi que l’équipe informatique, ce sans exclusive. Il peut être
téléchargé et utilisé gratuitement pendant un mois.
On s’est ensuite familiarisé avec cet éditeur, dont l’interface est comparable à celle de
beaucoup d’autres. Un exercice d’encodage de document XML bien formé a été fait. Puis l’en-tête
d’un document TEI (élément teiHeader, dont le modèle de contenu est formé essentiellement à l’aide
du module header de la TEI) a été présenté, au travers d’un exercice d’encodage.
La journée a aussi été consacrée à des informations plus générales sur TEI :
le site Web du projet TEI ; les ressources disponibles et téléchargeables (Guidelines, schémas...) ;
le fonctionnement de ROMA ; présentation rapide
du modèle TEI Lite et de la macro-structure d’un document TEI ou d’un document de racine teiCorpus.
Retour au début
Troisième et quatrième journée (10 juin et 11 juin matin) : travaux pratiques (2 et 3)
Les travaux pratiques, animés par Florence Clavaud, ont porté sur les principaux aspects du travail d’encodage d’une
édition critique de texte manuscrit.
- la transcription d’un manuscrit
- les métadonnées d’un manuscrit
- description du manuscrit
- analyse et datation
- l’apparat critique et le tableau de la tradition ou liste de témoins
- les notes
- l’indexation : balisage des concepts dans le texte, création d’index des concepts identifiés
- les liens vers d’autres ressources, en particulier vers les substituts numériques des manuscrits
- les techniques d’établissement de correspondances - alignement -, au travers de quelques exemples
(alignement zone de texte - zone d’image,
alignement zone de texte - traduction de cette zone, zone de texte - élément d’interprétation
analytique).
Deux manuscrits inédits ont été utilisés, dont des éditions récentes au
traitement de texte étaient
disponibles à l’ENC et permettaient de bien étudier ces aspects.
- les pages 1 et 2 d’un récit de voyage en Abyssinie, datant du XIXe siècle et réutilisé pour
rédiger un rapport administratif (Archives nationales, F/12/5080) (zip contenant deux images
numériques, une édition rédigée au traitement de texte dans le cadre du cours d’ecdotique dirigé par
Christine Nougaret, le document TEI) ;
- l’acte numéroté 36 dans le chapitre de Pierrefitte au cartulaire blanc de l’abbaye de
Saint-Denis (Archives nationales, LL1157, p. 383-384). Une édition critique de ce chapitre a été
préparée au traitement de texte par des étudiants de l’ENC, sous la direction d’Olivier
Guyotjeannin, puis encodée en TEI, et sera bientôt publiée ; nous avons utilisé
un extrait de cette édition (zip contenant les images des pages, l’image de la charte originale,
l’édition, au traitement de texte, le document TEI).
Nota : les images numériques fournies reproduisent des documents conservés aux Archives
nationales. Aucune diffusion publique de ces images, commerciale ou non, n’est autorisée sans
l’accord préalable des Archives nationales.
D’autres documents sont également fournis.
- un fichier contenant essentiellement un en-tête TEI et une description physique détaillée de
manuscrit : le registre d’ensaisinement de la collégiale de Sainte-Opportune à Paris au XIVe siècle
(Archives nationales, LL584), dont l’édition critique électronique a été commencée par Philippe
Pons, étudiant en Master 2 de l’ENC, en 2008, sous la direction d’Olivier Guyotjeannin et Florence
Clavaud (zip contenant le document TEI) ;
- une notice descriptive de manuscrit latin de la BnF (latin 16879), rédigée par Mélanie
Tamaillon, étudiante à l’ENC, sous la direction de Pascale Bourgain dans le cadre du cours de
codicologie, et encodée conformément au schéma
conçu dans le cadre du projet européen ENRICH et diffusé par le TEI Consortium dans les sources de la TEI P5 1.4.1 (zip
contenant le document TEI et le schéma) ;
- un document TEI publié récemment dans l’application des dossiers documentaires THELEME, qui
présente en particulier une utilisation fine de l’élément facsimile
Seront ajoutés à cette documentation des supports de présentation plus générale de tous ces
aspects.
Retour au début
Quatrième et cinquième journée (11 juin après-midi, 12 juin) : présentation de projets
Cette dernière partie de la formation a été consacrée à la présentation de projets ou de
travaux d’opérateurs utilisant
TEI P5, par les porteurs de ces projets, scientifiques et/ou plus techniques.
Nota : les présentations de projet diffusées ici ont été faites au mois de juin 2009 et
reflètent l’état des projets à cette date. Ces projets, les idées qui les sous-tendent et
l’utilisation de TEI qu’ils impliquent, sont susceptibles d’évoluer rapidement.
- TEI à l’École nationale des chartes : présentation générale et retour sur les processus de
production des documents TEI (F. Clavaud) ; le projet Du Cange : mesurer la complexité d’un
dictionnaire balisé (Frédéric Glorieux) ; le moteur de fouille de texte PhiloLogic (Nicolas
Legrand).
Nota : en ce qui concerne PhiloLogic : l’ENC a longuement testé PhiloLogic et est en train de préparer
d’une part, une distribution de PhiloLogic intégrant divers corpus de textes libres de droits,
à l’attention particulière des étudiants ou chercheurs voulant faire des recherches rapides dans de
gros ensembles, ou installer PhiloLogic sur leur machine et l’utiliser pour leur propre corpus,
d’autre part une installation de PhiloLogic qui permettra bientôt d’interroger les corpus TEI
préparés par l’équipe informatique dans le cadre de la collection d’éditions électroniques ELEC. En
attendant que ces installations soient présentables, on peut notamment consulter :
- TEI à l’université d’Oxford (Lou Burnard)
- Le programme "Sourcencyme" : constitution d’un corpus annoté en ligne des encyclopédies
médiévales latines (Isabelle Draelants et Emmanuelle Kuhry, ERL 7229 de Médiévistique,
Atelier Vincent de Beauvais, université Nancy II) : deux interventions, présentation générale du
projet, et présentation de l’utilisation de TEI pour ce projet ;
- XML, TEI et édition : normes, outils et méthodes de travail pour la mise en place d’une
collection de sources à l’université de Caen-Basse-Normandie. Première partie (Pierre-Yves
Buard) : présentation de la collection de sources (en ligne, papier et cédérom)
des Presses universitaires de Caen. Deuxième partie (Carole Dornier) : présentation détaillée du projet Montedite, édition électronique du manuscrit des Pensées de Montesquieu conservé à la Bibliothèque municipale de Bordeaux ;
- TEI dans le projet Bibliothèques
virtuelles humanistes (Nicole Dufournaud, Centre d’Etudes supérieures de la Renaissance,
université François Rabelais, Tours) ;
- La TEI en pratique ou du nécessaire dialogue entre chercheurs et techniciens : deux projets
en cours avec l’appui technique du programme MutEC (mutualisation d’outils numériques pour les
éditions critiques et les corpus) : Bouvard et Pécuchet, par Emmanuelle Morlock-Gerstenkorn (Service
d’ingénierie documentaire de l’Institut des sciences de l’homme, université Lumière Lyon 2) et
Hyperdonat, par Maud Ingarao (unité numérique de l’École Normale Supérieure Lettres et Sciences Humaines, Lyon) ;
- Très grand équipement ADONIS et interopérabilité (Yannick Maignien,
ADONIS).
Retour au début
Conditions d’utilisation de la documentation
Cette documentation et tous les fichiers qui l’accompagnent sont mis à disposition selon le
Contrat Paternité-Pas d’Utilisation Commerciale-Partage des Conditions Initiales à
l’Identique 2.0 France, qui est disponible en ligne http://creativecommons.org/licenses/by-nc-sa/2.0/fr/ ou par courrier postal à Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA.
Retour au début