Vollständige Konkordanz

Wenn man die Wörter im Voynich-Manuskript für eine Sprache hält, dann ist es eine gute Idee, eine Konkordanz des gesamten Manuskriptes anzulegen, also eine Übersicht, die jede Fundstelle jedes Wortes in ihrem Zusammenhang darstellt. So schafft man sich eine Möglichkeit, Wortarten zu identifizieren oder einfache Hypothesen zu überprüfen.

Gut, dass es Computer gibt, als Handarbeit wäre so etwas eine Qual. Mit einem Rechner hat man nur die Qual des Programmierens. Damit ist man zwar auch ein paar Stündchen beschäftigt (vor allem mit der Fehlersuche), aber danach arbeitet der Rechner. Und der liefert in wenigen Minuten ein Ergebnis, für das ein Mensch auf Jahre beschäftigt gewesen wäre.

Mein Perl-Skript concord erstellt mit Hilfe des Tools viat eine vollständige Konkordanz aus den Transkriptionen in Jorge Stofis Interlinear-Archiv. Die Konkordanz wird in leicht navigierbarem HTML erzeugt, für die Darstellung wird der Font EVA Hand 1 verwendet. Für jedes Wort, dass keine unidentifizierten Glyphen enthält, wird eine Liste aller Vorkommen mit einem kleinen Kontext erstellt. Die im Kontext dargestellten Wörter sind Links und verweisen wiederum auf die entsprechende Liste des jeweiligen Wortes.

Das hört sich alles komplizierter an, als es ist. Tatsächlich ist die generierte Konkordanz so leicht verwendbar, dass sie kaum einer Erklärung bedarf. (Das Programm ist dafür umso komplizierter geworden.) Da sie aber geradezu absurd viel Speicherplatz belegt (es sind 130 MB in insgesamt 28270 Dateien), stelle ich sie hier nicht zum Download zur Verfügung. Sicherlich, die Daten lassen sich mit zip auf gut 30 MB komprimieren, aber keine Kompression ist hier so gut wie das generierende Programm mit seinen 5,3 KB.

Tags »

Autor:
Datum: Montag, 1. August 2005 21:01
Trackback: Trackback-URL Themengebiet: Hacking

Feed zum Beitrag: RSS 2.0 Diesen Artikel kommentieren

Ein Kommentar

  1. 1

    […] einer ersten, nicht besonders gründlichen Durchsicht der frisch angelegten Konkordanz stellte ich keine auffälligen Muster in den »Wörtern« fest. Natürlich gibt es […]

Kommentar abgeben