Mi a szöveg valójában?
Az OHCO (tartalmi elemek rendezett hierarchiája) modell
Az elméletek egyike közvetlenül olyan jelölőnyelvek belső struktúrájából származik, mint például az SGML (korábban szerepelt a Jelölőnyelvek és szövegmodellezés részben), vagy a belőle származó nyelvek, mint a HTML és az XML. Az SGML hierarchikus szerkezetekben tárolja az adatokat, azaz az elemek egymásba ágyazódnak, mint a matrjoska babák. Ezenkívül vannak olyan szabálynyelvek (Schema-k és DTD-k, amelyeket a Modellezés XML-lel című részben tárgyalunk), amelyek például azt szabályozzák, hogy egy adott elem hol, milyen gyakran, másik elemen belül pedig csak egyszer, vagy többször használható-e.
Következésképpen egy olyan metanyelv, mint az XML vagy az SGML, sajátos gondolkodásmódot követel a szövegekkel kapcsolatban. Az 1980-as évek végén és az 1990-es években kutatók egy csoportja, Allen Renear, Elli Mylonas, és David Durand kidolgozott egy elméletet kifejezetten szövegkódolásra, illetve általánosságban a szövegre. Ezt nevezték a tartalmi elemek rendezett hierarchiájának (OHCO). Úgy gondolták, hogy bár különböző típusú szövegek különbözőképpen rendeződhetnek, a felépítésük hierarchikus marad. Az OHCO modell első verziójában azt állították, hogy:
"A legalacsonyabb szintű alegységek olyan elemeket foglalnak magukba, mint a bekezdések, mondatok, prózai idézetek, versidézetek, egyenletek, bizonyítások, alapelvek stb. Számos ilyen elem tovább is bontható. Maga a szerkezet hierarchikus, mert ezek az elemek egymásba ágyazódnak, mint a kínai dobozok. Egyben rendezettek is, mert az objektumok lineáris kapcsolatban állnak – egy könyvön belül két objektumnál az egyik megelőzi a másikat." (Renear)
Ezek a beépülő elemek ismerősek lehetnek, a könyvekben ilyenek a fejezetek, szakaszok, bekezdések, listák stb. A matrjoska babához hasonlóan a tartalmi elemek egymásba illeszkednek a legkisebbtől (egy betű vagy szó) a legnagyobbig (egy könyv vagy monográfia), és közöttük még számos egymásba ágyazott elem található (mondatok, bekezdések, fejezetek, szakaszok stb.).
Bár az elmélet szerepet játszott a TEI fejlesztésében, soha nem tért ki teljes mértékben az egymást átfedő hierarchiák problémájára. Az egymást átfedő hierarchiák ugyanis megtörik a szépen egymásba ágyazott mintákat. Például, egy metafora a versben kettészelhet két vagy több sort is (<l> címkével jelöljük). Pusztán technikai kérdésnek tűnhet, hogy egy olyan nyelv, mint az XML, megköveteli, hogy az elem bezáródjon, mielőtt egy másik elem kinyílik, akárcsak a következő példában:
- <l>szöveg szöveg szöveg</l>
- <l>szöveg szöveg <metaphor> szöveg szöveg</metaphor></l>
ellentétben a következővel:
- <l>szöveg szöveg <metaphor> szöveg szöveg</l>
- <l>szöveg szöveg </metaphor></l>.
Az OHCO elmélet megalkotói elismerik, hogy ez nem pusztán technikai kérdés hanem rámutathat a kódolt szöveget körülvevő néhány kényes témára. Szövegszerkesztők, mint Jerom McGann, D. F. McKenzie és Peter Schillingsburg, különböző szövegértelmezéseket fejlesztettek ki. Úgy találták, hogy az OHCO modell túl egyszerű komplex művek, főleg irodalmi jellegűek reprezentálására. Lényegében azt állították, hogy a szövegek többféle szerkezettel és különböző jelentéssel rendelkezhetnek, amelyek közül néhány a szövegen kívülre esik. Ezek a szövegszerkesztési megközelítések egy Renear és McGann közötti vitába kerültek szembe egymással, amelyre 1999-ben, a Virginiai egyetemen megrendezett Digitális Bölcsészet konferencián került sor. McGann a szövegek összetett és egymást átfedő szerkezete mellett érvelt, amelyre a költészetet használta példának:
"A költészet nem szerveződik meghatározott hierarchiába. Bár a TEI és az SGML jelölés meglehetősen ésszerű eszköz az ismeretterjesztő szövegek számára, mégis alkalmatlan a költői szövegek olyan jellemzőinek jelölésére, amelyek a szövegek készítői és olvasói számára is egyaránt nyilvánvalóak. A költői szövegek rekurzív szerkezetek, amelyek az ismétlődésnek és variációknak az összetett hálózatából épülnek fel. Nem létezhet vers az egymást átfedő struktúrák nélkül." (Hockey)
A metaforák például átívelhetnek számos verssoron vagy versszakon is. Az elbeszélő események számos bekezdést hidalhatnak át és átfedés is előfordulhat. A verses dráma párbeszédsorozatokat, időmértékes verselést és mondatokat is tartalmaz. Ezek a mondatok és időmértékes sorok átfedik egymást áthajlás esetében, vagy amikor egy szereplő megszólal és egy másik félbeszakítja. (Renear) Mindezen hierarchiákat is ugyanúgy indokolt ábrázolni.
Így a szövegelméletet, amit az SGML (és ezáltal az XML és TEI) fogalmaz meg a legjobban, nevezhetjük egy szerkesztői vagy bibliográfiai megközelítésnek; tehát a szöveget mondatai, bekezdései, fejezetei, bevezetése és befejezése, stb. által ábrázoljuk. Ez nem meglepő, hiszen az SGML nyelv alapjai főként az informáló típusú szövegek elektronikus formában való megjelenítésére irányult. Innen nézve levonhatjuk azt a következtetést, hogy az SGML szerkezete csak adatközlési szempontból strukturálja a szövegeket.
Renear és munkatársai az OHCO modell mellett érveltek egy 2000-es évek közepén megjelenő cikksorozatban, amelyben tovább finomították és fejlesztették az eredeti OHCO javaslatukat. Mindeközben a TEI közösségen belül a legtöbb tudós McGann nézeteit vallotta: a kódolt szövegeket olyan komplex szövegszerkezetek szempontjából kell megközelíteni, amelyekben nem feltétlenül illeszkedik minden elem egy merev hierarchiába, ugyanakkor viszont, szükségszerűen egy OHCO modellnek is meg kell felelni, hiszen ez az, amit a nyelv legtermészetesebben lehetővé tesz.
További olvasmányok
Hockey, Susan, Alan Renear, Jerome McGann. 'Panel: What is text? A Debate on the Philosophical and Epistemological Nature of Text in the Light of Humanities Computing Research. Web. 29 August 2016.
McGann, Jerome. Radiant Textuality: Literature After the World Wide Web. London: Palgrave, 2001.
Scholen, David and Sandra Scholen. 'Beyond Gutenberg: Transcending the Document Paradigm in Digital Humanities'. Digital Humanities Quarterly. Vol. 8 No. 4. 2014.
Shillingsburg, Peter L. Scholarly Editing in the Computer Age: Theory and Practice. Ann Arbor: University of Michigan Press, 1996.