TEI

A Text Encoding Initiative ("Szövegkódolási Kezdeményezés") fontos nemzetközi projekt, amelyet 1987-ben három számítógépes nyelvészeti és irodalmi kutatásokkal foglalkozó angolszász tudományos társaság, az Association for Computers and the Humanities (ACH), az Association for Computational Linguistics (ACL), és az Association for Literary and Linguistic Computing (ALLC) indított el. A projekt feladata irányvonalak kifejlesztése, terjesztése volt a géppel olvasható szövegek kódolására, közvetíthetőségére, és cserélhetőségére, valamint javaslatok tétele új szövegek kódolására.

A TEI fejlesztésében mára számos tudományos társaság és tanszék vállal szerepet, évente konferenciákat tartanak, az egyes részterületeket – például a kéziratok kritikai kiadását vagy a karakterkódolást – munkabizottságok vizsgálják. A közös munka eredménye mindig egy DTD, vagyis dokumentumtípus-deklaráció, amely a nyelv jelölőelemeit és egymáshoz való viszonyukat határozza meg.

A TEI-t elsősorban általános tartalmú szövegek, szépirodalmi művek, kritikai kiadások, történeti források, illetve élőszöveg-átiratok elektronikus feldolgozására alkalmazzák. Megjelenése óta 5 verzióját adták ki, ezek közül a legutóbbi – TEI P5, mely 2007-ben jelent meg – tartalmazza az XML támogatást is, tehát a DTD-nek az SGML mellett egyaránt létezik XML és XML Schema változata.

A TEI 2001-től konzorciális keretek között működik, ráadásul az USA és Kanada kormányzati támogatását is élvezi. Az ajánlások – noha teljesen hozzáférhetőek – nem könnyű olvasmányok, megismerésükhöz szükség van SGML/XML ismeretekre.

(Forrás: Bíró Szabolcs: Szövegfeldolgozás XML alapokon.)

Korpuszunk a Text Encoding Initiative ajánlásainak betartásával készült.


We use TEI