Nuvola apps important.png


ATTENTION CE WIKI N'EST PLUS ACTIF
La nouvelle version est sur le site
https://lorexplor.istex.fr/Wicri/Source/fr/index.php

Text Encoding Initiative : Différence entre versions

De Wicri Wicri
Aller à : navigation, rechercher
(Voir aussi)
(Contenu remplacé par « {{Page transférée|wiki=Source}} »)
 
Ligne 1 : Ligne 1 :
<small>[[Accueil]] > [[Sciences humaines et sociales|SHS]] > [[Bibliothèques numériques en sciences humaines et sociales|Bibliothèques numériques SHS]] > [[Text Encoding Initiative|TEI]]<hr/></small>
+
{{Page transférée|wiki=Source}}
 
 
La '''Text Encoding Initiative''' désigne à la fois le nom d'un groupe de travail international et d'un standard. Le sujet qu'ils traitent est la codification de toutes sortes de documents dans une approches structurée et plus précisément, en SGML au début puis maintenant en XML.
 
 
 
==Un exemple introductif==
 
 
 
Pour illustrer la philosophie de la TEI, voici comment pourrait être codé un extrait du [[wikipedia:Le Cid (Corneille)|Cid]] de [[wikipedia:Pierre Corneille|Pierre Corneille]]<ref>
 
Cet exemple est inspiré d'un article de Lou Burnard, a fait l'objet d'un article sur le site [[ticri.fr:ARTIST|ARTIST]] (http://artist.inist.fr/article.php3?id_article=59 ARTIST) et a été enfin adapté à [[wikipedia:TEI|Wikipédia]]</ref>. Pour un ouvrage d'introduction plus complet voir [[#bib.bur.96||BUR 96]]].
 
 
 
On cherche à représenter :
 
{|border="1"
 
|
 
{|border="0"
 
|-
 
|
 
|'''Acte II, Scène 2'''
 
|-
 
|
 
|
 
|-
 
|'''DON RODRIGUE'''
 
|À moi, Comte, deux mots.
 
|-
 
|'''LE COMTE'''
 
|&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Parle.
 
|-
 
|'''DON RODRIGUE'''
 
|&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Ôte-moi d'un doute.
 
|-
 
|
 
|Connais-tu bien Don Diègue ?
 
|-
 
|'''LE COMTE'''
 
|&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Oui.
 
|-
 
|'''DON RODRIGUE'''
 
|&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Parlons bas, écoute.
 
|-
 
|
 
|Sais-tu que ce vieillard fut la même vertu,
 
|-
 
|
 
|La vaillance et l'honneur de son temps ? Le sais-tu ?
 
|}
 
|}
 
 
 
Avec le langage HTML, on aurait une codification limitée aux aspects « mise en page ».
 
 
 
<source lang="xml">
 
<h1>Acte II, Scène 2</h1>
 
<br/> <b>DON RODRIGUE</b> À moi Comte, deux mots.
 
<br/> <b>LE COMTE</b>&nbsp;&nbsp; ... &nbsp; Parle
 
</source>
 
 
 
Avec le schéma TEI, on obtiendrait ceci :
 
<source lang="xml">
 
  <div type="Act" n="I"><head>Acte II</head>
 
  <div type="Scene" n="1"><head>Scène 2</head>
 
    <sp><speaker>Rodrigue</speaker>
 
        <l part="i">À moi, comte, deux mots.</l></sp>
 
    <sp><speaker>Comte</speaker><l part="m">Parle</l></sp>
 
    <sp><speaker>Rodrique</speaker>
 
        <l part="f">Ôte-moi d'un doute</l></sp>
 
    <sp><speaker>Comte</speaker>
 
        <l part="i">Connais-tu bien Don Diègue ?</l></sp>
 
      <sp><speaker>Comte</speaker><l part="m">Oui</l></sp>
 
    <sp><speaker>Rodrigue</speaker>
 
      <l part="f">Parlons bas, écoute.</l>
 
      <l>Sais-tu que ce vieillard fut la même vertu,</l>
 
      <l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp>
 
    ...
 
  </div>
 
  ...
 
  </div>
 
</source>
 
 
 
La TEI permet de décrire la structuration du texte tel qu'il a été conçu et non son rendu final (présentation). Cet exemple montre notamment :
 
* L'imbrication des actes et des paragraphes (2 éléments div imbriqués). Avec un langage comme [[XPath]], il est alors possible d'extraire un acte ou une scène.
 
* Le découpage du dialogue par des éléments "sp".
 
* La définition des interlocuteurs par des éléments "speaker" (il est possible facilement de lancer des requêtes pour localiser les endroits où Rodrigue cite Chimène).
 
* La précision de la description de la versification par des éléments "l" (ligne) avec des indications sur la position d'un élément de dialogue en début, fin ou milieu de vers grâce aux attributs "part".
 
&nbsp;
 
 
 
==Voir aussi==
 
;Notes et références:
 
<references/>
 
{{Wicri voir|référence=Ticri}} La TEI est églalement présente sur :
 
** (page d'entrée sur la normalisation TEI : [[wicri-meta.fr:Text Encoding Initiative|Wicri/Métadonnées]],
 
** (page d'entrée sur les outils liés à la TEI : [[wicri-outils.fr:Text Encoding Initiative|Wicri/Outils]], .
 
 
 
;Liens externes:
 
:* [http://www.tei-c.org/index.xml Site de la TEI]
 
:* le wiki de la TEI : http://wiki.tei-c.org/index.php/Main_Page
 
:* la TEI sur [[wikipedia:Text Encoding Initiative|Wikipédia]]
 
 
 
;Bibliographie:
 
 
 
<span id="bib.bur.96">[BUR 96]</span> [[A pour auteur cité::Lou Burnard]] et [[A pour auteur cité::Michael Sperberg-McQueen C. M. Sperberg-McQueen]], traduction de François Role. ''La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange''<br/><http://www.tei-c.org.uk/Lite/teiu5_fr.html>
 
 
 
[[catégorie:Norme bibliothèque numérique]]
 
__SHOWFACTBOX__
 

Version actuelle datée du 12 juin 2020 à 09:58

logo import Wikipédia la page Text Encoding Initiative est transférée sur Wicri/Source logo import Wikipédia LogoWicriSourceFr.png