Kedves Látogató!

Ezen az oldalon egy 103 szöveg(részlet)ből álló szöveggyűjtemény található. A szövegek a magyar nyelvű könyvnyomtatás első fél évszázadát (1527–1576) reprezentálják.
A gyűjtemény első változata 2001–2005 között készült el. A manuális szövegbevitel eredményeképpen egy közel 240 000 szavas (mintegy 1 200 000 n terjedelmű) ún. plain text korpusz jött létre, amely txt kiterjesztésű, egyszerű szövegfájlokból állt.*
2008–2010 között készült el a fájlok TEI-XML változata. A kódolás során elsőként minden fájl TEI-fejlécet kapott, majd a szövegtörzs és az ívjelzések megjelölése következett.
A kódolási munkálatok folyamatosan zajlanak, a cél egy nyelvi annotációt tartalmazó (morfológiailag és mondattanilag elemzett) korpusz létrehozása.

*A plain text korpusz első hasznosítása Kalcsó Gyula 2007-ben megvédett PhD-disszertációja volt, amelyben a magyar nyelvű könyvnyomtatás első fél évszázadának nyelvi változóit vizsgálta.