Beiträge vom August, 2005

Ausnahmen ohne Regel

Dienstag, 2. August 2005 1:36

Bei einer ersten, nicht besonders gründlichen Durchsicht der frisch angelegten Konkordanz stellte ich keine auffälligen Muster in den »Wörtern« fest. Natürlich gibt es »Wörter«, die tendenziell häufiger zu Anfang oder zum Ende einer Zeile auftreten, dies liegt jedoch an der schon häufiger beobachteten Struktur in einer Zeile. Der Eindruck, dass die Zeile eine Informationseinheit ist, lässt sich nicht leicht von der Hand weisen.

Wenn etwa das mit 98 Vorkommen (in der Transkription von Takeshi Takahashi, die ich für diese kurze Analyse verwendet habe) recht häufige »Wort« dam besonders häufig als letztes Wort in einer Zeile auftritt, so liegt das an der wohl bekannten Eigenschaft der Glyphe m, bevorzugt am Ende einer Zeile aufzutreten. Das ist keine neue Erkenntnis.

Ich erhoffte mir allerdings jetzt einen besseren Blick auf die Ausnahmen, also jene Fälle, in denen dam nicht am Ende einer Zeile steht. Würden in solchen Fällen besondere Muster in den vorherigen oder folgenden »Wörtern« auftauchen?

Aber die traurige Wahrheit ist: Zumindest für dam gibt es keine Regelmäßigkeiten in den Ausnahmen. Es finden sich häufige »Wörter« ebenso wie seltene oder einmalige, es gibt keine auffälligen Strukturen in diesen »Wörtern«, es gibt einfach nichts, was ein neues Licht auf die Sache wirft. Alles andere hätte mich auch überrascht. Aber die Hoffnung stirbt zuletzt.

Aber es ist ja gar nicht so sicher, dass die Leerzeichen »Wörter« voneinander trennen: di ege schick te eins tre ungvonle erz eich enkan nein entex tschong utvers chle iern, was denn jeden Versuch, Wortarten aufzufinden, schnell scheitern lässt. Und wie Sie an diesem Beispiel sehen, ist ein solcher Text für einen der Sprache kundigen Menschen durchaus noch lesbar, wenn auch mit etwas Mühe.

Aber die Konkordanz bleibt dennoch ein schönes und einfaches Hilfsmittel, um kleine Vermutungen bezüglich der Wortfolge schnell zu überprüfen.

Thema: Interpretation | Kommentare (0) | Autor:

Vollständige Konkordanz

Montag, 1. August 2005 21:01

Wenn man die Wörter im Voynich-Manuskript für eine Sprache hält, dann ist es eine gute Idee, eine Konkordanz des gesamten Manuskriptes anzulegen, also eine Übersicht, die jede Fundstelle jedes Wortes in ihrem Zusammenhang darstellt. So schafft man sich eine Möglichkeit, Wortarten zu identifizieren oder einfache Hypothesen zu überprüfen.

Gut, dass es Computer gibt, als Handarbeit wäre so etwas eine Qual. Mit einem Rechner hat man nur die Qual des Programmierens. Damit ist man zwar auch ein paar Stündchen beschäftigt (vor allem mit der Fehlersuche), aber danach arbeitet der Rechner. Und der liefert in wenigen Minuten ein Ergebnis, für das ein Mensch auf Jahre beschäftigt gewesen wäre.

Mein Perl-Skript concord erstellt mit Hilfe des Tools viat eine vollständige Konkordanz aus den Transkriptionen in Jorge Stofis Interlinear-Archiv. Die Konkordanz wird in leicht navigierbarem HTML erzeugt, für die Darstellung wird der Font EVA Hand 1 verwendet. Für jedes Wort, dass keine unidentifizierten Glyphen enthält, wird eine Liste aller Vorkommen mit einem kleinen Kontext erstellt. Die im Kontext dargestellten Wörter sind Links und verweisen wiederum auf die entsprechende Liste des jeweiligen Wortes.

Das hört sich alles komplizierter an, als es ist. Tatsächlich ist die generierte Konkordanz so leicht verwendbar, dass sie kaum einer Erklärung bedarf. (Das Programm ist dafür umso komplizierter geworden.) Da sie aber geradezu absurd viel Speicherplatz belegt (es sind 130 MB in insgesamt 28270 Dateien), stelle ich sie hier nicht zum Download zur Verfügung. Sicherlich, die Daten lassen sich mit zip auf gut 30 MB komprimieren, aber keine Kompression ist hier so gut wie das generierende Programm mit seinen 5,3 KB.

Thema: Hacking | Kommentare (1) | Autor: