Fünffach

Freitag, 5. August 2005 16:06

Die kürzlich von mir beschriebene »Wortfolge« qokeedy qokeedy qokedy qokedy qokeedy auf Seite f75r erweckt auf dem ersten Blick den Eindruck, in jeder europäischen Sprache unmöglich zu sein. Wahrscheinlich stimmt dieser Eindruck insofern, dass es sich nicht wirklich um eine europäische Sprache handelt, wahrscheinlich überhaupt nicht um eine direkt niedergeschriebene Sprache.

Aber völlig unmöglich ist eine solche Anhäufung ähnlicher Wörter nicht, wie das folgende Beispiel eines sinnvollen deutschen Satzes zeigt: »Ich weiß, dass das ›das‹, das das ’s‹ am Ende hat, eigentlich auf ›ß‹ enden sollte.«

Dass ein solches Beispiel aber sehr an den Haaren herbeigezogen ist, dass kaum jemand so sprechen und vermutlich noch weniger Menschen so schreiben würden, das sollte jeder merken. Tatsächlich musste ich für diese Konstruktion etwas länger nachdenken.

Thema: Spekulation | Kommentare (0)

Wortdubletten

Mittwoch, 3. August 2005 16:21

Wer sich mit den »Wortfolgen« im Voynich-Manuskript beschäftigt, macht schnell eine seltsame Feststellung, die nicht zu einer Sprache oder zu einem verschlüsselten Text passen will. Und zwar ist dies die Neigung der »Wortfolgen« zu identisch aufeinanderfolgenden »Wörtern«. Diese scheinen sehr häufig aufzutreten.

Nun könnte es sein, dass uns hier unsere Wahrnehmung einen Streich spielt. Das wäre gar nicht ungewöhnlich. Wenn sich die menschliche Wahrnehmung auf regellose Strukturen konzentriert, dann beginnt sie damit, in diesen Strukturen Muster zu erkennen, auch wenn keine vorhanden sind. Ein vertrautes Beispiel für diese Eigenart des Wahrnehmens sind die Sternbilder, die Menschen in der recht regellosen Anordnung der Fixsterne zu erkennen glauben.

Es lohnt sich also, die Wortdubletten mit einem Programm zu untersuchen. Dafür habe ich zunächst meine Skripten für die wortweise Analyse geschrieben. Die folgende Untersuchung ist recht einfach, sie liefert aber klaren Aufschluss darüber, dass die Wortdubletten eine wirkliche Eigenschaft der Wortfolge und kein Artefakt der menschlichen Wahrnehmung sind.

Für meine Untersuchung bediente ich mich Takahashi’s Transkription, weil diese vollständig ist. Mit dem Befehl viat -tH -C > h.txt erzeugte ich eine Datei namens h.txt, die frei von Kommentaren ist. Danach erzeugte ich mit dem Befehl wsplit h.txt > hw.txt eine Zerlegung der Transkription in Einzelwörter in der Datei hw.txt. Die Lokatoren wurden in dieser Datei belassen, damit Dubletten über Zeilengrenzen hinweg nicht gezählt würden. (Der Lokator beginnt gewissermaßen jede Zeile mit einem im gesamten Manuskript einmaligen »Wort«, welches für diese Anwendung die Zeilen voneinander trennt.)

Nun konnten die Dubletten einfach mit wdup hw.txt | wc -l gezählt werden. Dabei ergeben sich genau 300 Dubletten in der Transkription, also im Schnitt deutlich mehr als eine Dublette pro Seite.

Um diese Zählung mit einer zufälligen Verteilung der Wörter zu vergleichen, mischte ich die Wortfolge mit meinem shuffle-Skript und bestimmte die Dubletten in der so gemischten Wortfolge. Da dies ein Monte-Carlo-Ansatz ist, wiederholte ich den Befehl shuffle hw.txt | wdup | wc -l zehn Mal, indem ich ihn in einer Schleife absetzte. Und das ist mein Ergebnis:

$ for i in `seq 10`
> do
>   shuffle hw.txt | wdup | wc -l
> done
94
102
89
88
95
97
105
102
110
119

Da es sich hier um ein Experiment unter Verwendung eines Zufallsgenerators handelt, können die bei Ihnen ermittelten Dublettenanzahlen der zufälligen Wortfolge natürlich von meinen Ergebnissen abweichen. Dennoch ist deutlich, dass der Durchschnittswert von ungefähr 100 Dubletten bei zufälliger Verteilung der gleichen Wortmenge signifikant unterhalb der gezählten 300 Dubletten in der originalen Transkription liegt. Die große Häufigkeit von Wortdubletten ist somit kein Artefakt unserer Wahrnehmung, sondern eine wirkliche Eigenschaft des Manuskriptes, deren Bedeutung bei einem Entzifferungsversuch geklärt werden muss.

Neben den Wortdubletten gibt es ebenfalls sehr häufig Anhäufungen aufeinander folgender ähnlicher Worte, die sich in nur einer Glyphe voneinander unterscheiden. So findet sich schon auf der ersten Seite die beachtliche »Wortfolge« chor shey kol chol chol kor chal, und auf Seite f75r kann man die beachtliche »Wortfolge« qokeedy qokeedy qokedy qokedy qokeedy finden.

Angesichts dieser Eigenschaften des »Textes« erscheint es mir sehr unwahrscheinlich, dass es sich bei der »Wortfolge« um eine nur einfach verschlüsselte Form einer Mitteilung in einer mitteleuropäischen Sprache handelt.

Thema: Ergebnisse | Kommentare (3)

Grünes Wasser

Mittwoch, 3. August 2005 4:21

Dass sich im so genannten »biologischen Teil« eine Menge stereotyp gezeichneter nackter Nymphen in Wassern herumtollen, die durch teilweise sehr organisch aussehende Strukturen miteinander verbunden werden, das kann man in jedem guten Einführungstext lesen. Die Illustrationen im Manuskript sind eben wirklich sehr fremdartig und scheinen teilweise gar nicht in das späte Mittelalter zu passen.

Was hingegen kaum jemals Beachtung findet, obwohl es völlig offensichtlich ist, das ist die Farbe des Wassers. Alle großen Wasserflächen sind nämlich grün. Und das ist eine recht ungewöhnliche Farbwahl, wenn man Wasser darstellen will.

Das heißt aber nicht, dass der Illustrator keine blaue Farbe zur Verfügung gehabt hätte. Im oben stehenden Bild (ein Ausschnitt aus Seite f82r) kann man nicht nur an der Nymphe oben links (zum Label okaldy) eine deutliche Spur der Restauration sehen, die sich darin zeigt, dass sich neben der nachgezeichneten Rückenlinie noch eine sichtbare verblichene Linie der ursprünglichen Zeichnung befindet. Nein, es ist auch völlig offensichtlich, dass die Nymphe ganz rechts (zum Label okairady) knietief in einem kleinen Behälter mit blauem Wasser steht, und diese Farbe würde man ja eher für die Darstellung von Wasser erwarten.

Dass der Illustrator nicht farbenblind war und auch keine Grün-Blau-Schwäche hatte, zeigt sich darin, dass die »Pflanzen« mit grünen Blättern dargestellt wurden, und nicht mit blauen — obwohl diese »Pflanzen« ansonsten sehr ungewöhnliche Gestaltmerkmale haben. Die Farbgebung des Wassers ist also absichtsvoll erfolgt.

Und so gesellt sich zu vielen Rätseln ein weiteres. Und wieder kann man nur spekulieren, warum jemand auf die Idee kommt, grünes Wasser darzustellen. Hier meine ersten Ideen:

Es soll dargestellt werden, dass das Wasser sehr viele Algen enthält, die es intensiv grün färben. Solche grünen Gewässer kann man gelegentlich sehen, vor allem Bergseen können manchmal eine sehr überraschende und unnatürlich anmutende Farbe haben.
Es soll auf eine ungewöhnliche Eigenschaft des Wassers hingewiesen werden. Es könnte sich dann um die Darstellung eines Jungbrunnens oder eines ähnlichen mythischen Gewässers handeln, und die grüne Farbe soll die lebensspendene Wirkung unterstreichen.
Es handelt sich nicht um Wasser. Es könnte sich etwa um heilkräftigen Schlamm handeln, der über ein komplexes Leitungssystem in große Badebecken gelangt. Oder um eine Allegorie des Lebens, in dem sich verschiedene, als benannte Nymphen symbolisierte Geistwesen oder Gottheiten im heiteren Spiel agierend bemerkbar machen. Oder…

Dies ist wieder ein schönes Beispiel, wie schwierig die Interpretation eines in jeder Hinsicht einmaligen Werkes sein kann. Wenn man es doch nur lesen könnte!

Thema: Spekulation | Kommentare (0)

Wortweise

Mittwoch, 3. August 2005 2:20

Es scheint sinnvoll, die Folge der einzelnen Wörter einer Analyse zu unterwerfen. Zu diesem Zweck habe ich drei einfache Programme geschrieben. Diese werde ich ebenfalls als elementare Tools für weitere Analysen verwenden.

Alle Programme sind dokumentiert, die Dokumentation kann mit dem perldoc-Tool extrahiert werden. Des weiteren liegt eine kurze Einführung in englischer Sprache bei.

Es ist empfehlenswert, diese Programme in den Suchpfad für Kommandos zu kopieren.

wsplit zerlegt einen Text in einzelne Wörter, wobei jedes Wort in einer eigenen Zeile ausgegeben wird. Kommentare einer Transkription werden dabei entfernt. Über Optionen können Wörter mit Asterisk und Passagen in eckigen Klammern ausgeschlossen werden.
wdup zählt aufeinanderfolgende identische Wörter, die ja im Manuskript außerordentlich häufig sind. Es kann aber auch für andere Zwecke benutzt werden.
shuffle mischt die Zeilen einer Eingabedatei durch, bringt sie also in eine zufällige, neue Reihenfolge.

Thema: Hacking | Kommentare (0)

Titelgrafik

Dienstag, 2. August 2005 20:16

Das dekorative Element links und rechts in der Titelgrafik ist natürlich auch dem Manuskript entnommen. Es findet sich im pharmazeutischen Teil auf Seite f88r und soll scheinbar einen Behälter für die Zubereitungen dieser »Pfanzen« darstellen.

Schade, dass ich von diesen »Pflanzen« gerade nichts hier habe, sie schienen ja ganz gut zu wirken…

Thema: Diverses | Kommentare (0)

Patchwork

Dienstag, 2. August 2005 17:48

Es sind schon einige Versuche unternommen worden, die im Manuskript abgebildeten »Pflanzen« zu identifizieren. Und alle diese Versuche sind gescheitert. Das Rätsel dieses Manuskriptes besteht also nicht nur in einer unentzifferten mittelalterlichen Geheimschrift, sondern auch in der wie außerirdisch wirkenden Natur der Illustrationen.

Vor einigen Wochen zeigte ich zwei Kindern, sechs und acht Jahre alt, einige Bilder des Manuskriptes. Diese waren nun recht unvoreingenommen, und sie sahen auf dem ersten Blick, dass es diese »Pflanzen« in der Wirklichkeit nicht geben könne. Eigentlich sollte dies auch einem erwachsenen Betrachter schnell klar werden.

Ob es völlig ungewöhnliche Blütenformen sind, ob die Farben der Laubblätter in alternierenden Farben auftreten oder ob der Eindruck entsteht, die »Pflanze« sei irgendwie auf die Wurzel aufgesetzt: Der Eindruck, es eher mit künstlerischen Entwürfen zu tun zu haben, die aus einer (fremden und für das Mittelalter einmaligen) geistigen Welt und nicht aus dem Boden hervorsprossen, wird beim Betrachten dieser Bilder immer größer. Die wenigen vertraut aussehenden »Pflanzen«, die sich in die Illustrationen verirrt haben, können diesen Eindruck nicht beseitigen.

Die Frage, ob es sich bei diesem Manuskript mehr um eine künstlerische Form der Mitteilung handeln könnte, ist keineswegs unerheblich für jeden Versuch, das Manuskript zu lesen. Schließlich liest man ein Gedicht sehr anders als ein Bestimmungsbuch für Pflanzen.

Und in einer Kunstform wäre es auch nicht mehr so überraschend, dass viele Pflanzen wirken, als seien sie wie ein Patchwork aus verschiedenen Teilen zusammengesetzt, die gar nicht zusammen passen wollen.

Thema: Kunst | Kommentare (4)

Ausnahmen ohne Regel

Dienstag, 2. August 2005 1:36

Bei einer ersten, nicht besonders gründlichen Durchsicht der frisch angelegten Konkordanz stellte ich keine auffälligen Muster in den »Wörtern« fest. Natürlich gibt es »Wörter«, die tendenziell häufiger zu Anfang oder zum Ende einer Zeile auftreten, dies liegt jedoch an der schon häufiger beobachteten Struktur in einer Zeile. Der Eindruck, dass die Zeile eine Informationseinheit ist, lässt sich nicht leicht von der Hand weisen.

Wenn etwa das mit 98 Vorkommen (in der Transkription von Takeshi Takahashi, die ich für diese kurze Analyse verwendet habe) recht häufige »Wort« dam besonders häufig als letztes Wort in einer Zeile auftritt, so liegt das an der wohl bekannten Eigenschaft der Glyphe m, bevorzugt am Ende einer Zeile aufzutreten. Das ist keine neue Erkenntnis.

Ich erhoffte mir allerdings jetzt einen besseren Blick auf die Ausnahmen, also jene Fälle, in denen dam nicht am Ende einer Zeile steht. Würden in solchen Fällen besondere Muster in den vorherigen oder folgenden »Wörtern« auftauchen?

Aber die traurige Wahrheit ist: Zumindest für dam gibt es keine Regelmäßigkeiten in den Ausnahmen. Es finden sich häufige »Wörter« ebenso wie seltene oder einmalige, es gibt keine auffälligen Strukturen in diesen »Wörtern«, es gibt einfach nichts, was ein neues Licht auf die Sache wirft. Alles andere hätte mich auch überrascht. Aber die Hoffnung stirbt zuletzt.

Aber es ist ja gar nicht so sicher, dass die Leerzeichen »Wörter« voneinander trennen: di ege schick te eins tre ungvonle erz eich enkan nein entex tschong utvers chle iern, was denn jeden Versuch, Wortarten aufzufinden, schnell scheitern lässt. Und wie Sie an diesem Beispiel sehen, ist ein solcher Text für einen der Sprache kundigen Menschen durchaus noch lesbar, wenn auch mit etwas Mühe.

Aber die Konkordanz bleibt dennoch ein schönes und einfaches Hilfsmittel, um kleine Vermutungen bezüglich der Wortfolge schnell zu überprüfen.

Thema: Interpretation | Kommentare (0)

Vollständige Konkordanz

Montag, 1. August 2005 21:01

Wenn man die Wörter im Voynich-Manuskript für eine Sprache hält, dann ist es eine gute Idee, eine Konkordanz des gesamten Manuskriptes anzulegen, also eine Übersicht, die jede Fundstelle jedes Wortes in ihrem Zusammenhang darstellt. So schafft man sich eine Möglichkeit, Wortarten zu identifizieren oder einfache Hypothesen zu überprüfen.

Gut, dass es Computer gibt, als Handarbeit wäre so etwas eine Qual. Mit einem Rechner hat man nur die Qual des Programmierens. Damit ist man zwar auch ein paar Stündchen beschäftigt (vor allem mit der Fehlersuche), aber danach arbeitet der Rechner. Und der liefert in wenigen Minuten ein Ergebnis, für das ein Mensch auf Jahre beschäftigt gewesen wäre.

Mein Perl-Skript concord erstellt mit Hilfe des Tools viat eine vollständige Konkordanz aus den Transkriptionen in Jorge Stofis Interlinear-Archiv. Die Konkordanz wird in leicht navigierbarem HTML erzeugt, für die Darstellung wird der Font EVA Hand 1 verwendet. Für jedes Wort, dass keine unidentifizierten Glyphen enthält, wird eine Liste aller Vorkommen mit einem kleinen Kontext erstellt. Die im Kontext dargestellten Wörter sind Links und verweisen wiederum auf die entsprechende Liste des jeweiligen Wortes.

Das hört sich alles komplizierter an, als es ist. Tatsächlich ist die generierte Konkordanz so leicht verwendbar, dass sie kaum einer Erklärung bedarf. (Das Programm ist dafür umso komplizierter geworden.) Da sie aber geradezu absurd viel Speicherplatz belegt (es sind 130 MB in insgesamt 28270 Dateien), stelle ich sie hier nicht zum Download zur Verfügung. Sicherlich, die Daten lassen sich mit zip auf gut 30 MB komprimieren, aber keine Kompression ist hier so gut wie das generierende Programm mit seinen 5,3 KB.

Thema: Hacking | Kommentare (1)

Skripten für das Interlinear-Archiv

Samstag, 30. Juli 2005 23:54

Für die weitere Arbeit mit dem Interlinear-Archiv der Transkriptionen habe ich mir ein paar gängige Skripten an meine Arbeitsweisen angepasst. Diese Skripten stehen hier zum Download. Es handelt sich um die Perl-Programme viat.pl und vhtml.pl. Das Skript viat.pl extrahiert dabei definierbare Bereiche aus der Transkriptionsdatei und löst optional auch die Weirdos in Einzelzeichen auf, das Skript vhtml.pl formatiert EVA-Transkriptionen als HTML-Dateien unter Verwendung des Zeichensatzes EVA Hand 1.

Freunde der Maus seien gewarnt: Es handelt sich um Programme, die an der Kommandozeile zu benutzen sind. Da sie in Perl geschrieben sind, wird zusätzlich ein Perl-Interpreter für Ihr System benötigt.

Die folgenden Änderungen habe ich an den Skripten vorgenommen:

Die Extension .pl wurde entfernt, da es für ein Unix-System ausreicht, wenn ein Skript ausführbar ist und ein korrekter Hashbang mit dem Pfad des Interpreters gesetzt wurde. Und ich bin etwas tippfaul, da mag ich nichts überflüssiges zum Tippen.
Die eingebettete Dokumentation wurde an die vorgenommenen Änderungen angepasst. Sie kann mit dem perldoc-Programm gelesen oder in ein anderes Format gewandelt werden.
Es ist nicht mehr erforderlich, dass sich die Transkriptionsdatei im aktuellen Verzeichnis befindet. Die Umgebungsvariable VOYNICH muss jetzt so gesetzt werden, dass sie den kompletten Pfad zur Transkriptionsdatei enthält, wenn nicht eine andere Transkriptionsdatei auf der Kommandozeile angegeben wird.

Um diese Programme zu installieren, müssen sie

zunächst einmal heruntergeladen werden.
Dann müssen sie irgendwo in den Suchpfad für Programme kopiert werden, unter Unix-artigen Systemen wird dieser Suchpfad über die Umgebungsvariable PATH definiert.
Anschließend sollte das Interlinear-Archiv der Voynich-Transkriptionen heruntergeladen und entpackt werden. Die Umgebungsvariable VOYNICH ist so zu setzen, dass sie den vollständigen Pfad dieser Datei enthält.
Nun stehen die Programme zur Verfügung. Probieren Sie einmal viat -tH -f1 an der Kommandozeile aus, um Folio 1 in der Transkription von Takeshi Takahasi zu extrahieren. Weitere Informationen über den Programmaufruf erhalten sie mit viat -h.

Thema: Hacking | Kommentare (0)

Der Voynich-Blog ist eröffnet

Samstag, 30. Juli 2005 20:09

Ich habe mir jetzt eine Blog-Software besorgt und installiert, nämlich das großartige WordPress. Und damit werde ich in den nächsten Tagen die geistige Arbeit am Voynich-Manuskript dokumentieren.

Hier werden sich meine Spekulationen, meine Programme und meine Ergebnisse finden, wenn es denn welche geben sollte. Der größte Teil des Textes wird in deutscher Sprache verfasst sein, jedoch werde ich Resultate von allgemeiner Wichtigkeit auch in englischer Sprache zur Verfügung stellen.

Wer mitmachen will, herzlich willkommen!

Thema: Diverses | Kommentare (1)