TEI en la práctica

La cabecera TEI

Fundamentos de TEI

Un documento TEI se compone de dos secciones principales: la cabecera <teiHeader> y el elemento <text>. Estas dos secciones son a su vez elementos hijos de la raíz <TEI>. Los podemos diferenciar fácilmente ya que mientras que el elemento <text> contiene el propio documento que queremos codificar (ya sea un poema, una carta o cualquier otro objeto textual), la cabecera <teiHeader> se encarga de los  metadatos del objeto, tanto del propio original analógico (si fuera el caso) como de la nueva versión codificada. En la figura 1 puedes encontrar una ilustración de esta estructura básica.

1
2
3
4
5
6
7
8
<TEI xmlns="http://www.tei-c.org/ns/1.0">
     <teiHeader>
            <!-- metadatos -->
     </teiHeader>
     <text>
             <!-- transcripción -->
     </text>
</TEI>

Figura 1: Ilustración de la estructura básica de un documento TEI.

Estructura de la cabecera TEI

La función principal de la cabecera  <teiHeader> es proporcionar un registro bibliográfico del documento electrónico. A su vez este elemento incluye cuatro secciones principales (o elementos hijo), no todas necesarias para conformar una codificación correcta:

  • <fileDesc>: un registro bibliográfico del documento electrónico creado, así como de la fuente de la que este se deriva;
  • <encondingDesc>: especificación de la codificación y principios editoriales utilizados en el etiquetado del texto electrónico;
  • <profileDesc>: palabras clave para indexar, buscar y recuperar;
  • <revisionDesc>: relación de cambios aplicados al documento electrónico. 

La figura 2 nos muestra el orden que tendrían estos elementos en caso de ser utilizados. Sin embargo, el único elemento requerido en esta sección sería <fileDesc>.

1
2
3
4
5
6
<teiHeader>
    <fileDesc></fileDesc>
    <encodingDesc></encodingDesc>
    <profileDesc></profileDesc>
    <revisionDesc></revisionDesc>
</teiHeader>
Figura 2. Los posibles elementos hijos de <teiHeader> y su orden de aparición.

El elemento <fileDesc> en detalle

<fileDesc> es el único elemento hijo obligatorio de la etiqueta <teiHeader> para todos los documentos TEI.  <fileDesc>, a su vez, debe incluir tres elementos hijos para ser válido: <titleStmt>, <publicationStmt> y <sourceDesc>.

  • <titleStmt> contiene elementos hijo que proporcionan metadatos básicos acerca del documento, incluyendo el título del recurso, el nombre del autor y/o los editores, así como los nombres y roles de otras personas que hayan podido contribuir a la creación del documento electrónico;
  • <publicationStmt> contiene elementos hijos básicos respecto a la información de publicación del texto electrónico, incluyendo el nombre del editor y su dirección, información de copyright  y fecha de publicación;
  • <sourceDesc> contiene elementos hijo que describen la fuente original a partir de la cual ha sido creado el documento electrónico. Por ejemplo, podría contener descripciones detalladas de un libro o de un manuscrito. 

La figura 3 nos muestra la estructura básica de un encabezado TEI con todos sus elementos obligatorios:

1
2
3
4
5
6
7
8
9
10
11
12
13
<teiHeader>
    <fileDesc>
        <titleStmt>
             <title>Título</title>
        </titleStmt>
        <publicationStmt>
             <p>Información de la publicación</p>
        </publicationStmt>
        <sourceDesc>
            <p>Información sobre la fuente</p>
        </sourceDesc>
    </fileDesc>
</teiHeader>

Figura 3. Elementos obligatorios en la cabecera TEI.



Junto a los tres elementos hijos obligatorios de <fileDesc> descritos aquí, también podemos encontrar otros tres elementos opcionales, cuyo orden de aparición queda establecido en las directrices TEI:

  • <editionStmt>: incorpora información relacionada con una edición específica del texto;
  • <extent>: describe el tamaño aproximado del texto almacenado en un soporte especificado o bien el tamaño de otro objeto, sea este digital o no, especificado en las unidades convenientes;
  • <seriesStmt>: incluye información sobre la serie, si hubiera, a la que pertenece la publicación.
  • <noteStmt>: recoge cualquier nota con información adicional a la guardada en otras partes de la descripción bibliográfica.

Opciones para codificar los elementos de la cabecera TEI

Tal y como hemos visto hasta aquí, muchos de los elementos presentes en la cabecera <teiHeader> contienen elementos hijos que proporcionan estructuración adicional al contenido.  Con muchos de estos elementos un editor puede escoger entre una simple descripción en prosa o una estructuración más detallada del contenido utilizando elementos hijos adicionales. <encodingDesc> es un buen ejemplo de estos casos. Una opción posible es utilizar una etiqueta <p> para la descripción narrada, como se muestra en la figura 4:



1
2
3
<encodingDesc>
    <p>Se conserva la ortografía y tipografía del original, excepto cuando se ha considerado que dificultan la lectura.</p>
</encodingDesc>

Figura 4. Una descripción narrada simple de <encodingDesc>

En cualquier caso, el elemento <encodingDesc> puede incluir más elementos hijos que proporcionen una mayor  estructura, como se muestra en la figura 5:

1
2
3
4
5
6
<encodingDesc>
   <projectDesc>describe con detalle el objetivo o propósito para el que un archivo electrónico ha sido codificado</projectDesc>
   <samplingDecl>contiene una descripción en prosa sobre los fundamentos y métodos usados en textos de muestra en la creación de un corpus o una selección de textos</samplingDecl>
   <editorialDecl>explica las normas editoriales de codificación y transcripción de textos</editorialDecl>
   <charDecl>proporciona información sobre caracteres no estándar y glifos</charDecl>
</encodingDesc>

Figura 5. Una codificación detallada del elemento <encodingDesc>.

Los dos tipos de codificación son correctos. La decisión entre uno y otro dependerá de los fines específicos del proyecto. Por ejemplo, en caso de ser importante para los usuarios el poder buscar cómo se han codificado los caracteres no estándares, el segundo ejemplo se ajustaría mejor, ya que el uso de <charDecl> permitiría al elemento ser aislado para poder ser recuperado en búsquedas posteriores.

El capítulo 2 de las directrices TEI explican el apartado <teiHeader> y todos los elementos hijos que pueden ser utilizados aquí. El ejercicio de esta unidad también  profundiza en el elemento Header con más detalle.


Lecturas adicionales

The TEI header. The TEI Guidelines. <http://www.tei-c.org/release/doc/tei-p5-doc/en/html/HD.html>

Module 2: The TEI header, TEI by Example. <http://teibyexample.org/modules/TBED02v00.htm>