Beiträge vom Mai, 2009

Die Voynich-Blogs

Dienstag, 26. Mai 2009 3:21

Dieses Voynich-Blog ist mein ältestes Internet-Projekt mit einem WordPress.

Als ich es im Jahre 2005 begann, war WordPress noch eine kleine und sehr überschaubare Software, die durchaus ihre rauen Ecken und Kanten hatte, aber ihren Zweck dennoch gut erfüllte. Ich hatte das Blog damals aufgesetzt, um meine Betrachtungen zum Voynich-Manuskript ein bisschen von meiner eher gesellschaftskritischen Homepage zu trennen. Zu einem Blog habe ich mich nicht etwa entschlossen, weil ich damals so begeistert von dieser Form des Publizierens gewesen wäre, sondern weil ich mich für die eher seltenen Publikationen nicht mit einem vollwertigen CMS herumschlagen wollte, aber auch die fehlerträchtige Mühe mit handgeschriebenem HTML und FTP-Uploads vermeiden wollte. Die damals verfügbaren Blogsysteme traten mir da als brauchbare Softwaregattung mittlerer Komplexität entgegen, und warum nicht einmal mit etwas Neuem experimentieren…

Nun gut, es sollte nicht mein letztes Blog bleiben – inzwischen betreibe ich eine Handvoll davon. Dieses Blog hat allerdings die längste Geschichte, es ist mehrfach auf verschiedene Domains umgezogen und hat auch schon einen Wechsel des Servers hinter sich. Es wird nur wenig gelesen – was wohl am Thema liegt – aber es ist mir dennoch ans Herz gewachsen. Außerdem kann ich an den Zugriffszahlen immer so schön sehen, ob das Thema unseres »verdammten Manuskriptes« mal wieder durch die deutschen Medien geht, denn dann suchen eben viele Menschen im Internet nach weiteren Informationen.

Inzwischen haben jedoch mehrere Voynich-Forscher entdeckt, dass ein Blogsystem eine ganz brauchbare Möglichkeit des einfachen Publizierens von Gedanken, Betrachtungen und Ergebnissen ist. Natürlich sind die meisten dieser Blogs in englischer Sprache, ich bin als deutscher Autor doch etwas seltenes. Die mir bekannten Voynich-Blogs sind die folgenden:

Und zu diesen Blogs ist jetzt ganz frisch ein weiteres Blog hinzugekommen, das ich für die regelmäßige Lektüre empfehlen kann, wenn es kein Problem ist, Englisch zu lesen:

Natürlich wird die englischsprachige Mailingliste (hoffentlich) auch in Zukunft der Ort des internationalen Austausches sein und die primäre Stelle, an der neue Erkenntnisse mitgeteilt werden; eine Zersplitterung der Kommunikation durch das tendenziell dezentrale Bloggen ist zurzeit noch nicht zu befürchten.

Aber dennoch, sollten in Zukunft noch weitere Blogs zum Voynich-Manuskript geführt werden, könnte es schnell etwas unübersichtlich für einen interessierten Leser sein. Drei bis vier regelmäßig aktualisierte Websites sind noch sehr überschaubar, aber sind es erstmal sieben, acht oder mehr, denn wird es zunehmend schwieriger, sich auf dem Laufenden zu halten.

Von daher kann ich jedem Interessierten schon jetzt empfehlen, die RSS-Feeds der Blogs zu benutzen und sich einen guten RSS-Reader auszusuchen. Wer regelmäßig bloggt und andere Blogs regelmäßig liest, kann sich kaum noch ein Leben ohne RSS-Reader vorstellen. Die Benutzung dieser Programme ist relativ einfach.

Vielleicht wird ja eines Tages jemand einen RSS-Aggregator im Internet zur Verfügung stellen, ähnlich, wie ich es bereits für die Blogs aus Hannover tue. Noch scheint mir das unnötig, aber warten wir noch ein paar Monate…

Thema: Sonstiges im Netz | Kommentare (5) | Autor:

Er sah niemals einen Skorpion

Montag, 25. Mai 2009 2:51

Man kann ja im Allgemeinen nur wenig über den Autor (oder die Autoren) des Voynich-Manuskriptes sagen, aber ich denke, dass mindestens eine der beiden folgenden Aussagen gesichertist:

  • Entweder wusste der Autor nicht, wie ein Skorpion aussieht
  • oder aber, er verwendete völlig andere Tierkreiszeichen.

Und ich tendiere stark dazu, die erste dieser Aussagen für wahr zu halten, da sie weniger zusätzliche Annahmen erfordert.

Gewiss, der Autor des Manuskriptes war kein großer Künstler, aber dass das folgende Bild des Tierkreises (an der erwarteten Position des Scorpio) auf Seite f73r

Skorpion auf Seite f73r

…keinen Skorpion darstellen kann, ist wohl deutlich genug. Wer einen Skorpion so zeichnet, belegt damit, dass er noch niemals einen Skorpion gesehen hat. Die Darstellung des Schützen auf Seite f73v zeigt hingegen recht klar, dass der Zeichner zwar nicht gerade ein Künstler war, aber doch wenigstens einen ihm vertrauten Anblick so darstellen konnte, dass der Inhalt des Bildes für einen Betrachter erfassbar ist:

Schütze

Selbst die Tatsache, dass der Schütze eine Armbrust (oder eine sehr ähnliche Waffe) trägt, ist trotz des flüchtigen Stiles der Zeichnung klar zu erkennen. Wenn man diese Zeichnung sieht, weiß man, dass der Zeichner wohl Schützen mit derartigen Waffen gesehen haben muss, und dass er sie trefflich zu skizzieren verstand.

Und damit weiß man auch, dass der »Skorpion« entweder

  • keinen Skorpion darstellen soll, oder aber
  • die Zeichnung eines Skorpiones durch einen Menschen ist, der noch nie einen Skorpion gesehen hat und sich das Bild aus Erzählungen zurechtreimen musste. Was dabei entstand, erinnert mehr an einen Hund mit ungewöhnlich langer Rute.

Für die Möglichkeit, dass der Tierkreis nichts mit der uns vertrauten Astrologie zu tun haben könnte, verweise ich auf Jonathan Dilas.

Geht man aber davon aus, dass der Tierkreis aus den vertrauten europäischen Symbolen besteht, so kann man feststellen, dass dem Zeichner der Anblick eines Skorpions nicht vertraut war. Das schränkt immerhin die Anzahl der möglichen Länder, in denen der Autor gelebt haben könnte, ein wenig ein – leider nicht so, dass es auch nur ein bisschen hülfe. 😉

Abschließende Anmerkung: Die unter den Symbolen des Tierkreises sichtbaren Monatsnamen in lateinischen Buchstaben – in den Zeichnungen kann man »novembre« und (mit etwas weniger Sicherheit) »decebre« erkennen – sind ein ganzes Thema für sich. Vermutlich stammen sie nicht vom Autor, sondern wurden nachträglich hinzugefügt. Obwohl hier der Inhalt erfreulich klar ist, erweist es sich als sehr schwierig, die Sprache zu identifizieren.

Thema: Zeichnungen | Kommentare (1) | Autor:

Wenn man eine Website umzieht…

Sonntag, 24. Mai 2009 0:48

…das heißt, wenn man die Site auf eine neue Domain bewegt, denn kann man sich damit eine ganze Menge Arbeit machen. Ich glaubte damals, als ich dieses Blog von meiner Subdomain beim Weltretter auf tamagothi.de umzog, dass ich alle Links schon angepasst hätte. Und in der Tat, es funktionierte auch alles, alle eingebetteten Grafiken waren sichtbar, es gab jahrelang kein Anzeichen für ein Problem. In diesem Zustand habe ich das Blog zusammen mit seiner neuen Domain sogar noch auf einen neuen Server umgezogen. Es gab ebenfalls kein Problem.

Inzwischen wurde die Domain mit dem einprägsamen Namen Weltretter von Frank verkauft, weil er Geld brauchte, die Domain aber nicht mehr brauchen konnte. Und ich dachte mir nichts weiter. Bis ich dann irgendwann zufällig feststellte, dass etliche Links nicht mehr funktionierten und dass etliche eingebettete Grafiken verschwunden waren.

Des Rätsels Lösung ist einfach. Dieses Blog lag in einem Unterverzeichnis des Verzeichnisses, das über die Weltretter-Domain verfügbar war, und dort lagen auch weiterhin die alten Grafiken und Downloads, weil ich natürlich nicht an eine Löschung dachte. Als es dann weg war, wurde meine Faulheit in solchen Dingen schmerzhaft offenbar, und dieses Blog sah teilweise ein bisschen zerschossen aus.

Leider hat mir das niemand mitgeteilt, und deshalb habe ich es so lange nicht bemerkt.

Aber ich habe jetzt alle Inhalte richtig verlinkt, und insesondere ist der viel gelesene Einführungstext wieder voll bebildert.

Thema: Kommunikation | Kommentare (0) | Autor:

Strukturen innerhalb einer Zeile

Donnerstag, 21. Mai 2009 4:18

Die Annahme, dass es sich beim Voynich-Manuskript um eine direkt notierte Sprache in einem lediglich unverständlichen Notationssystem handele, wird durch viele belegte Eigenschaften der Glyphenfolge gestützt. Zusammen mit dem fließenden Text entsteht so der Eindruck von ohne Benutzung von Hilfsmitteln niedergeschriebenen Notizen, die nur relativ schwach verschlüsselt sind. Es gibt jedoch im Manuskripte Eigenschaften, die diesem Eindruck widersprechen. Schon mit relativ einfachen Untersuchungen lassen sich Strukturen innerhalb der Textzeilen des Manuskriptes aufzeigen, die in natürlicher, weitgehend phonetisch notierter Sprache nicht auftreten sollten und sehr rätselhaft sind. Die nähere Untersuchung dieser Eigenschaften verspricht einen Ansatz zum Verständnis des Verfahrens, das für die Verschlüsselung des Voynich-Manuskriptes Verwendung fand.

Viele Forscher gehen davon aus, dass es sich beim Voynich-Manuskript um eine direkt niedergeschriebene Sprache handele. Diese Annahme wird gestützt vom Augenschein und von einigen statistischen Eigenschaften der Zeichenfolge, die eine große Ähnlichkeit zu gewöhnlichen sprachlichen Strukturen nahelegen.

Geht man von dieser Annahme aus, so stellt sich beim »Lesen« des Manuskriptes in erster Linie das Problem, eine phonetische Zuordnung der Glyphen zu finden, welche diese Sprache wieder erklingen lässt, um daraus die Sprache zu identifizieren und nach Möglichkeit zu verstehen. Da ein solches Vorgehen bislang für eine Vielzahl von Sprachen gescheitert ist, kommt es immer wieder zu weit hergeholten Hypothesen, deren bekannteste wohl ist, dass es sich um eine phonetisch notierte fernöstliche Sprache handeln könne. Die Tatsache, dass die Illustrationen des Manuskriptes offensichtlich europäisch sind, dass sie keinerlei Ähnlichkeit mit fernöstlichen Symboliken aufweisen, kann solches Spekulieren leider nicht bremsen.

Diese Spekulationen führen allerdings zu nichts, sie sind nur mit dürftigen Indizien belegt und aufgrund der wegen des ideographischen Schriftsystemes nur rudimentär bekannten, historischen chinesischen Phonetik auch kaum falsifizierbar. Man könnte eben so »gut« annehmen, dass hier eine UFO-Besatzung ein Buch geschrieben und auf der Erde zurückgelassen habe, und man kann damit ebenfalls alles »erklären« ? wenn eine Hypothese jedoch alles »erklären« kann, denn erklärt sie nichts. Dass sich die »fernöstliche Annahme« dennoch so lange halten konnte und bis heute eine gewisse Aufmerksamkeit in Kreisen der »Voynichologen« genießt, ist vor allem ein Zeichen der Hilflosigkeit gegenüber dem »verdammten Manuskript« und dem Mangel an jeglichem Fortschritt im Bestreben, seine Nachricht zu lesen.

Eine wenig beachtete Tatsache, die nach meiner Auffassung der Annahme einer direkt niedergeschriebenen Sprache widerspricht, sind die Strukturen innerhalb der Zeilen des Manuskriptes. Die Länge und Struktur eines »Wortes« verändert sich mit fortschreitender Position des »Wortes« innerhalb der Zeile; das »Wort« wird tendenziell um so kürzer und ärmer an Gallows, je weiter es am Ende der Zeile steht. Zudem gibt es gewisse Glyphen, die geradezu typisch für die letzten »Wörter« einer Zeile sind, etwa EVA »m«. Letzteres ist eine Eigenschaft des Manuskriptes, die schon bei naiver Betrachtung ersichtlich ist, und deshalb wird sie wohl so selten einer Untersuchung gewürdigt und nur selten mit »harten« Daten belegt. Dabei widerspricht diese Beobachtung dem Augenschein, dass es sich beim größten Teil des Manuskriptes um direkt niedergeschriebenen Text handelt, der Absätze in beinahe gewöhnlicher Sprache formt.

Schon sehr einfache computergestützte Untersuchungen können aufzeigen, dass die Wörter innerhalb der Zeile nicht gleichmäßig verteilt sind, dass es also Strukturen innerhalb der Zeile gibt, die einer Erklärung bedürfen, wenn wir das Manuskript lesen wollen.

Verwendete Daten

  • Ich habe für die im Folgenden beschriebenen Untersuchungen die vollständige Transkription von Takeshi Takahashi aus dem interlinearen Archiv von Jorge Stolfi verwendet. Das Transkriptions-Alphabet ist folglich ein nicht-kapitialisertes EVA.
  • Hieraus habe ich ausschließlich den »pflanzenkundlichen Teil« (so benannt nach der Gestalt der Illustrationen, die wirklichen Inhalte sind uns ja nicht bekannt) und die reinen Textseiten untersucht, da in diesen Teilen des Manuskriptes der Augenschein eines fließenden Textes besonders stark ist und die Existenz von Strukturen innerhalb der Zeilen aus diesem Grunde nicht erwartet wird. Eine Unterscheidung zwischen den beiden Currier-Sprachen habe ich nicht gemacht, diese wäre allerdings einfach durchzuführen, wenn eine solche Untersuchung weitere Erkenntnis verspräche.
  • Die »astrologischen« und »kosmologischen« Seiten habe ich aus der Betrachtung ausgenommen, weil sie stark von Labels mit bekannten statistischen Eigenarten und von kreisförmigen Texten geprägt sind. Bei letzteren ist der Startpunkt für die Transkription oft reine Willkür. Die »biologischen« Seiten zeigen eine erhebliche textuelle Anomalie im Manuskript, die sich vor allem in einer hohen Redundanz des »Textes« äußert. (Der durchschnittliche Informationsgehalt eines Zeichens liegt dort unter einem Bit.) Der abschließende Teil besteht aus vielen sehr kurzen »Texten«, die schon für den Augenschein nicht den Eindruck normalen Flusstextes erwecken.
  • Ferner habe ich nur Zeilen verwendet, die im Locator des Transkriptionsarchives als Zeile in einem Absatz gekennzeichnet sind. Labels und Titel sind keine Zeilen und könnten die Ergebnisse verzerren.
    Alle »schwachen« Leerzeichen (in EVA mit einem Komma notiert) werden als Leerzeichen betrachtet, die ebenfalls eine »Wortgrenze« darstellen.
    Eine Zeile, die nicht wenigstens fünf Wörter enthält, wird nicht ausgewertet. Bei den gewählten Methoden zur Untersuchung der Wortgestalt in Abhängigkeit von der Position des »Wortes« in der Zeile könnten solche Zeilen das Ergebnis verzerren.

Auswertungen

Mit diesen Daten habe ich für jeweils

  • das erste »Wort« einer Zeile,
  • das letzte »Wort« eine Zeile,
  • das »Wort« in der Mitte der Zeile (Position ermittelt durch Division der Zeilenlänge durch 2) und zudem für
  • das zweite »Wort« einer Zeile (weil das erste Wort jeweils noch weitere Informationen über die Verschlüsselung der Zeile enthalten könnte und deshalb ungewöhnlich gebildet sein könnte)

die folgenden Statistiken erstellt:

  • Zählung der Worthäufigkeit
  • Zählung der Zeichenhäufigkeit in der Transkription
  • Zählung der Wortlänge in der Transkription

Darüber hinaus habe ich die Verteilung von Wörtern mit Gallows (EVA »t«, »k«, »p«, »f«) innerhalb der Zeilen untersucht.

Die von mir verwendeten Perl-Skripten und die vollständigen Ergebnisse dieser Auswertungen zusammen mit einer gut druckbaren Version dieses Textes als RTF-Datei stehen hier zum freien Download zur Verfügung.

Anmerkung zu den Auswertungen

Sowohl die Zeichenhäufigkeit als auch die »Wortlänge« ist eine Form der Auswertung, für die meines Erachtens die EVA-Transkription eher ungeeignet ist, wenn wirkliche Erkenntnisse erlangt werden sollen. Viele Glyphenfolgen, die im Manuskript den starken Anschein eines »Zeichens« erwecken, werden wegen des analytischen Charakters der EVA-Transkription zu mehreren ASCII-Zeichen, wie etwa die häufigen »ch«, »sh« und »iin«. Die Analyse der »Wortlängen« wird durch diesen Umstand verzerrt, und zwar in Abhängigkeit davon, wie das jeweils gezählte »Wort« gebildet ist; die »Zeichenhäufigkeit« ist ebenfalls eher sinnlos. Im besten Fall können solche Daten als Anhaltspunkte für eventuell lohnende, spätere Untersuchungen gelten.

Ergebnis der Wortzählungen

Dies sind die »Wörter«, die mit einer Häufigkeit von mehr als 0,5 Prozent als erstes »Wort« in einer Zeile erscheinen:

daiin                    81  3.808%
saiin                    39  1.834%
sain                     32  1.504%
dain                     29  1.363%
qokeedy                  29  1.363%
sol                      28  1.316%
sor                      26  1.222%
qokeey                   25  1.175%
qokaiin                  22  1.034%
dshedy                   21  0.987%
qokain                   21  0.987%
sar                      20  0.940%
dar                      19  0.893%
tchedy                   19  0.893%
pol                      18  0.846%
dair                     17  0.799%
ol                       17  0.799%
qokedy                   16  0.752%
tol                      16  0.752%
qol                      15  0.705%
y                        15  0.705%
ycheey                   15  0.705%
dchedy                   13  0.611%
dol                      11  0.517%
qokal                    11  0.517%
sal                      11  0.517%

Zum Vergleich hier die gleiche Liste für das jeweils letzte »Wort« einer Zeile:

am                       39  1.834%
dy                       38  1.787%
ol                       33  1.551%
chedy                    32  1.504%
al                       28  1.316%
oly                      28  1.316%
dam                      26  1.222%
daiin                    23  1.081%
qoky                     23  1.081%
dal                      22  1.034%
otam                     17  0.799%
lchedy                   16  0.752%
lol                      16  0.752%
aiin                     15  0.705%
qokam                    15  0.705%
shedy                    15  0.705%
ary                      13  0.611%
dar                      13  0.611%
ram                      13  0.611%
dain                     12  0.564%
ldy                      12  0.564%
chey                     11  0.517%
oky                      11  0.517%
oldy                     11  0.517%
qoty                     11  0.517%

Einige Unterschiede fallen auf dem ersten Blick auf. Erwartet und schon oft beobachtet ist der häufige Zeilenabschluss mit einem »Wort«, welches auf »m« endet. Etwas unerwarteter ist hier die Tendenz zu eher kurzen »Wörtern« und das auffällige Fehlen von »Wörtern«, die mit »s« beginnen. (In EVA steht das »sh« in »shedy« für ein »ch« mit so etwas Ähnlichem wie einem diakritischen Zeichen darüber und nicht für die Glyphe »s« in »saiin«, »sain«, »sor«, »sal« oder »sar«.) Generell lässt sich ein völliges Fehlen der »s«-Glyphe in den häufigsten »Wörtern« am Ende einer Zeile feststellen. Die möglichen »Wörter« sind also innerhalb einer Zeile nicht gleichmäßig verteilt; zumindest für die erste und letzte Wortposition einer Zeile liegen sehr unterschiedliche Verteilungen der Worthäufigkeit vor.

Dies ist ein unerwartetes Ergebnis, wenn man davon ausgegangen ist, dass hier zusammenhängender Text in Absätzen geschrieben wurde, wie es dem Augenschein entspricht. Würde es sich um einen Text in Versform handeln, wäre dieses Ergebnis hingegen nicht überraschend, da diese Form eine gewisse Verteilung der Wortarten innerhalb der Zeilen begünstigen würde. Die Annahme, dass es sich um einen gewöhnlichen, jeweils eine Pflanze beschreibenden Text in direkt notierter Sprache handelt, kann bereits auf diesem Hintergrund angezweifelt werden.

Wenn aber eine Form von Kryptografie vorliegt, ist es durchaus denkbar, dass das jeweils erste »Wort« einen Hinweis auf den Schlüssel enthält, der für diese Zeile verwendet wurde.

Aus diesem Grund habe ich die gleiche Auswertung für das jeweils zweite »Wort« einer Zeile durchgeführt, und zwar mit dem folgenden Ergebnis:

ol                       69  3.244%
shedy                    56  2.633%
shey                     52  2.445%
aiin                     46  2.163%
chey                     45  2.116%
chedy                    40  1.881%
cheey                    32  1.504%
ar                       31  1.457%
qokeedy                  31  1.457%
qokeey                   25  1.175%
sheol                    25  1.175%
cheol                    24  1.128%
or                       24  1.128%
al                       21  0.987%
chol                     21  0.987%
qokedy                   20  0.940%
sheedy                   20  0.940%
daiin                    19  0.893%
qol                      19  0.893%
sheey                    19  0.893%
qokaiin                  18  0.846%
qokain                   18  0.846%
okaiin                   16  0.752%
ain                      15  0.705%
okeey                    15  0.705%
sheor                    15  0.705%
shol                     15  0.705%
okain                    14  0.658%
lchedy                   13  0.611%
qokal                    13  0.611%

Diese Liste enthält bereits kein »Wort« mehr, das mit »s« beginnt und auffallend viele kurze »Wörter« aus zwei Glyphen, sie weist also eine größeres Maß an Ähnlichkeit zur Verteilung der »Wörter« am Ende der Zeile auf. Allerdings gibt es hier auch eine wichtige Abweichung, und das ist die große Häufigkeit von »Wörtern«, die mit »ch« oder »sh« beginnen, was bei den häufigen »Wörtern« an abschließender Position in der Zeile kaum zu beobachten ist.

Die Zeile scheint also eine besondere, nicht offensichtliche Struktur zu haben. Die zweiten »Wörter« einer Zeile zeigen eine andere Häufigkeitsverteilung als die ersten »Wörter« einer Zeile, und beide Verteilungen unterscheiden sich recht deutlich von den letzten »Wörtern«. Die Ausdrucksweise »nicht offensichtlich« meint hier, dass diese Struktur bei einer Betrachtung des Manuskriptes nicht unmittelbar auffällt, sondern erst in einer Auswertung der Worthäufigkeiten in Abhängigkeit von der Wortposition innerhalb einer größeren Menge Text deutlich wird. In einer solchen Auswertung ist es dann aber sehr offensichtlich.

Es ist übrigens interessant, die gleiche Auswertung mit dem jeweils mittleren »Wort« einer Zeile durchzuführen. Ich habe die Position des mittleren »Wortes« ermittelt, indem ich die Anzahl der Wörter durch 2 geteilt habe und das Wort an dieser Position nahm, und kam so auf die folgende Häufigkeitsverteilung für das jeweils mittlere »Wort« einer Zeile:

chedy                    56  2.633%
shedy                    51  2.398%
ol                       38  1.787%
qokeey                   37  1.740%
daiin                    34  1.598%
qokedy                   34  1.598%
qokeedy                  33  1.551%
qokain                   32  1.504%
qokaiin                  29  1.363%
aiin                     26  1.222%
chey                     26  1.222%
qokal                    25  1.175%
chol                     19  0.893%
qol                      19  0.893%
okaiin                   18  0.846%
ar                       16  0.752%
or                       16  0.752%
qokar                    16  0.752%
otal                     15  0.705%
oteey                    15  0.705%
dal                      14  0.658%
dar                      14  0.658%
otedy                    14  0.658%
okain                    13  0.611%
qotedy                   13  0.611%
sheol                    13  0.611%
shey                     13  0.611%
al                       12  0.564%
cheol                    12  0.564%
okedy                    12  0.564%
okeey                    12  0.564%
cheey                    11  0.517%
dol                      11  0.517%
okeedy                   11  0.517%
otain                    11  0.517%
qoky                     11  0.517%

Auch hier findet sich unter den häufigen Wörtern keines, das mit »s« beginnt. Auffallend ist allerdings die größere Häufigkeit von »Wörtern«, die einen Gallow enthalten. Die Listen der Wörter mit einer Häufigkeit von über 0,5 Prozent an einer untersuchten Position innerhalb der Zeile weisen

  • 9 Gallows (34 Prozent der häufigsten »Wörter«) für die erste Position,
  • 9 Gallows (30 Prozent der häufigsten »Wörter«) für die zweite Position,
  • 17 Gallows (47 Prozent der häufigsten »Wörter«) für die mittlere Position, und
  • 5 Gallows (20 Prozent der häufigsten »Wörter«) für die letzte Position

auf. Auch dies ist ein eher unerwartetes Ergebnis, es erweckt zunächst den Anschein, die Wörter mit Gallows würden sich in der Mitte der Zeile ansammeln. Dies ist jedoch nicht der Fall. Um das zu untersuchen, habe ich die Verteilung der »Wörter« mit Gallows auf die jeweils fünf Positionen am Anfang der Zeile, am Ende der Zeile und in der Mitte der Zeile mit einem weiteren Perl-Skript untersucht. In der folgenden Liste gibt die erste Zeile die Gallowhäufigkeit in den ersten fünf »Wörtern« der Zeile, die zweite Zeile in den mittleren fünf »Wörtern« der Zeile und die dritte Zeile in den letzten fünf »Wörtern« der Zeile wieder:

Start of line       49.365% 44.335% 57.217% 57.264% 54.866% 
Center of line      54.725% 56.041% 55.806% 56.747% 55.101% 
End of line         57.593% 54.020% 56.700% 56.794% 39.821%

Abgesehen von einem leicht geringeren Auftreten der »Wörter« mit Gallows an der zweiten Position und einem deutlich geringerem Auftreten solcher »Wörter« an der letzten Position der Zeile zeigen sich hier keine Auffälligkeiten in der allgemeinen Verteilung.

Die auffällige Häufung von »Wörtern« mit Gallows in der Liste der häufigsten »Wörter« der Mittelposition kann also nur bedeuten, dass die »Wörter« mit Gallows am Anfang einer Zeile signifikant variabler und unregelmäßiger als in die Mitte der Zeile geformt sind und deshalb nicht in einer solchen Auflistung aufscheinen, da sie von regelmäßiger gebildeten »Wörtern« ohne Gallows von dort verdrängt werden. Dies sollte in folgenden Untersuchungen wesentlich präziser gefasst werden, für den Moment reicht die Erkenntnis, dass subtile Feinheiten der Wortstruktur von der Position des Wortes in der Zeile abhängig sind. Und genau das ist ein unerwartetes Ergebnis, wenn Wörter eines Absatzes einfach hintereinander weggeschrieben werden, es ist ein Zeichen dafür, dass hier trotz aller statistischer Sprachähnlichkeit der Glyphenfolge keine natürliche Wortfolge einer prosaischen Sprache vorliegen kann. Weitere Gedanken hierzu folgen in den abschließenden Betrachtungen.

Verteilung der Wortlängen

Eine andere Beobachtung lässt sich hingegen bestätigen. Die Wörter werden zum Ende hin kürzer, zumindest, wenn man die Wortlängen in einer EVA-Transkription betrachtet. Selbst, wenn dies nur ein Artefakt des EVA-Alfabetes sein sollte, zeigt es doch statistisch greifbare, strukturelle Änderungen in der Gestalt der durchschnittlichen »Wörter« in Abhängigkeit von ihrer Position in einer Zeile.

Beim ersten Wort einer Zeile beträgt die durchschnittliche Wortlänge 5,57 Zeichen, beim letzten Wort 4,7 Zeichen, der Unterschied beträgt also fast ein EVA-Zeichen und ist damit durchaus als signifikant zu betrachten. Die Länge des mittleren Wortes beträgt übrigens im Durchschnitt 5,3 EVA-Zeichen, und mit der deutlichen Ausnahme der zweiten Wortposition einer Zeile nimmt die Länge tendenziell mit der Position des »Wortes« in der Zeile ab. Es handelt sich hierbei nicht nur um ein Artefakt, das dadurch entsteht, dass der Autor zum Ende einer Zeile hin zu Abkürzungen tendiert.

Zeichenverteilung

Ohne zu diesem Thema zu sehr in die numerischen Einzelheiten gehen zu wollen, sei noch angemerkt, dass auch die Verteilung der Zeichenhäufigkeiten von der Position des »Wortes« in der Zeile abhängig ist.

Die sieben häufigsten Glyphen der »Wörter«

  • an der ersten Position sind: e, o, y, h, d, i, a;
  • an der zweiten Position sind: e, o, h, y, c, k, d;
  • an der mittleren Position sind: o, e, y, h, d, a, k;
  • an der letzten Position sind: o, a, y, l, d, e, h.

Es zeigt sich, dass zum Ende einer Zeile hin tendenziell die Glyphen »e« und die Gruppe »ch« und »sh« seltener werden, während die Glyphen »a« und »l« in der Häufigkeit zunehmen. Macht bei den »Wörtern« zum Zeilenanfang die Glyphe »a« noch 7,2% und »l« 5,2% des Glyphenvorrates aus, so ist am Ende einer Zeile das »a« mit 12,6% und das »l« mit 9% vertreten. Auf der anderen Seite fällt die Häufigkeit der Glyphe »e« von 12,2% beim ersten »Wort« einer Zeile auf 6,6% beim letzten Wort einer Zeile ab. Der größte Teil des Glyphenvorrates ist aber beinahe invariant gegenüber der Wortposition, so dass diese Veränderungen der Zeichenhäufigkeit innerhalb einer Zeile kaum auffallen.

Wäre das »Voynichianische« eine Sprache, so hätte sie die bemerkenswerte Eigenschaft, dass beim Schreiben zusammenhängender Texte in einem Absatz innerhalb einer Zeile eine Gruppe von Vokalen immer seltener wird, während eine andere Gruppe von Vokalen immer häufiger würde, und das bei jeder geschriebenen Zeile. Es fällt schwer, sich eine menschliche Sprache mit dieser Eigenschaft vorzustellen; es fällt vergleichbar schwer, ein sinnvolles Schriftsystem zu ersinnen, das solche Auffälligkeiten hervorbringt. Könnte man die Verkürzungen der Wörter noch mit Abkürzungen wegerklären, die sich tendenziell zum Zeilenende häufen, so bleibt die Erklärung eines solchen im Schriftbild aufscheinenden Lautwandels sehr knifflig. Die Hypothese, dass das »Voynichianische« eine Sprache ist, scheint mir angesichts dieser Analyse kaum noch haltbar.

Abschließende Betrachtungen

Was bedeutet das alles? Ich weiß es nicht, noch nicht. Mir sind jetzt »nur« ein paar weitere Fakten bekannt, die bei jedem Versuch einer Entzifferung dieser mittelalterlichen Kopfnuss berücksichtigt werden müssen:

  1. Es handelt sich nicht um eine relativ direkt niedergeschriebene Sprache, auch keine fernöstliche. Das Voynich-Manuskript entstand in einem Prozess der Verschlüsselung.
  2. Bei der Verschlüsselung hat die entstehende Zeile den »Wörtern« in dieser Zeile eine nachweisbare Struktur gegeben, die möglicherweise Rückschlüsse auf das angewendete Verfahren gestattet. Die »Wörter« in der Zeile sind in einer Weise geordnet, die ich noch nicht verstehe. Da auch die Glyphen innerhalb eines »Wortes« auf eigentümliche Weise geordnet sind, scheiden einfache Zeichenersetzungen aus. (Diese wären auch schon geknackt worden.) Es handelt sich vielmehr um eine Umordnung von Informationseinheiten, die zur beobachteten Struktur führte und die hoffentlich mit einfachen Mitteln umkehrbar ist. So lange wir nicht wissen, in welcher Sprache der Klartext gehalten ist, erscheint mir das Erraten der beim Verschlüsseln angewendeten Umordnungen als kaum lösbare Aufgabe.
  3. Gesetzt dem Fall, es handelt sich beim Voynich-Manuskript um eine bedeutungslose Zeichenfolge, muss eine Erklärung für die darin aufscheinenden Strukturen gefunden werden. Diese sind einerseits sprachliche Strukturen, da zum Beispiel das Zipfsche Gesetz vom dokumentierten »Wortvorrat« erfüllt wird, sie sind aber andererseits außersprachliche und schwer erklärbare Strukturen.
  4. Wenn das »verdammte Manusskript« eine entzifferbare Mitteilung enthält, ist es die vordringlichste Aufgabe der Entzifferung, diese Strukturen zu verstehen und zu deuten. Insbesondere sollte die Anomalie des zweiten »Wortes« einer Zeile verstanden werden, denn diese liefert möglicherweise einen Hinweis auf den in der jeweiligen Zeile verwendeten Schlüssel.

Das Frustrierende in diesem ganzen Prozess besteht darin, dass das Manuskript so aussieht, als sei es ohne besondere Hilfsmittel verfasst und recht unmittelbar niedergeschrieben worden. Welches Verfahren dabei auch immer angewendet wurde, es kann nicht allzu schwierig sein. Aber es war mit Sicherheit sehr intelligent und völlig anders als die kryptografischen Standards des späten Mittelalters.

Thema: Ergebnisse, Hacking | Kommentare (1) | Autor:

René Zandbergen in Darmstadt

Dienstag, 5. Mai 2009 3:19

Das muss einfach im Original kurz angerissen werden 😉

Guten Abend!

Will der eminent hollandisch Voynitschist, Voynitschologe und Über-Voynitschosoph René Zandbergen maken eine Performanz in Deutschland an der Mai der 26te, and is in Darmstadt an 6 an Nacht, was ist 18.00 Uhr.

Aber den Rest liest man besser dort nach, wo er veröffentlicht wurde

Wer am 26. Mai um 18:00 Uhr in Darmstadt sein kann und unbedingt einmal René Zandbergen für eine Stunde auf Englisch vortragen hören möchte, der sollte unter der dort angegebenen Adresse Kontakt aufnehmen. Ich werde leider nicht dort sein können, würde mich aber freuen, wenn ich hinterher erwas davon höre…

Thema: Kommunikation | Kommentare (2) | Autor:

Ernsthafte Voynich-Probleme

Freitag, 1. Mai 2009 19:21

Es ist ein ernsthaftes Problem für jede Theorie (nicht nur im Zusammenhange mit dem Voynich-Manuskript), wenn alle Belege für diese Theorie von eher indirekter Natur sind. Sicher, es gibt Gegenstände in der menschlichen Geistesbetätigung, bei denen jeder Beleg naturgemäß indirekt ist, wie etwa in der Erforschung der Geschichte, in welcher uns nur die indirekten Auswirkungen der Vergangenheit auf die Gegenwart vorliegen. Das Voynich-Manuskript liegt uns jedoch in materieller und gegenwärtiger Form vor, alle Eigenschaften der darin niedergeschriebenen Glyphenfolge sind einer direkten Untersuchung zugänglich. Dank des Internet sind diese Eigenschaften einer großen Anzahl von Menschen seit mehreren Jahren frei zugänglich. Trotz dieses sehr günstigen Umstandes ist es ein Problem sämtlicher gegenwärtiger Theorien zum Voynich-Manuskript, dass sie auch nach längerer Untersuchung ausschließlich indirekt belegt sind. Dieses Problem ist ein Hinweis darauf, dass etwas mit den Theorien nicht stimmen kann; und dieser Hinweis wird mit zunehmender Dauer der Untersuchung deutlicher.Wenn eine dieser Theorien wirkliche Eigenschaften des Manuskriptes beschreibt, denn sollte es relativ »einfach« sein, Untersuchungen anzustellen, die in direkter Weise die theoretisch postulierte Beschaffenheit des Manuskriptes aufzeigen – oder im Scheitern eines solchen positiven Fortschrittes einen Hinweis auf die Schwächen der Theorie geben und auf diese Weise zum Fortschritt der Erkenntnis führen. Ein derartiger Prozess lässt sich nach etlichen Jahrzehnten nicht beobachten, obwohl eine beachtliche vereinigte Geisteskraft sich am Manuskripte abgearbeitet hat und immer noch abarbeitet.

Es ist ebenfalls ein ernsthaftes Problem für jede Theorie (nicht nur im Zusammenhange mit dem Voynich-Manuskript), wenn sie nicht im Verlaufe ihrer Überprüfung zu einer fortschreitenden Vertiefung der Einsichten in den betrachteten Gegenstand führt. Ein solcher Prozess, der dem Lesen der unverstandenen Textes vorausgehen müsste,  ist bei allen bisherigen Theorien zum Voynich-Manuskript nicht zu beobachten. Das angesammelte Faktenwissen über das Manuskript, den Aufbau seines Glyphenvorrates und die Muster der Wortbildung und den geschichtlichen Kontext, in dem dieses Manuskript mutmaßlich entstand, fügt sich nicht in ein Gesamtbild und führt zu keinem Voranschreiten in der Erkenntnis. In der Tat sind wir kaum über die Einsichten der ersten neuzeitlichen Forscher hinausgekommen, sind immer noch nicht dazu imstande, auch nur ein einziges Wort zu lesen; und das wird auch daran liegen, dass die Gesamtheit der bisherigen Annahmen und Theorien an der Wirklichkeit des Manuskriptes vorbei geht.

Diese beiden Probleme sind eng miteinander verwandt. Es handelt sich nicht um Probleme des Voynich-Manuskriptes, sondern um Probleme, die in Erscheinung treten, wenn wir das Voynich-Manuskript auf unsere Art betrachten und dabei erklären wollen. Das Manuskript verbleibt davon unbeeindruckt, es bleibt genau das, was es immer war. Es kann nicht darum gehen, allerlei Gründe dafür zu suchen, warum die Belege für unsere Theorien dermaßen mager sind, wenn wir wirklich dieses harte Rätsel lösen wollen. Wenn unsere Theorien gut belegbar sind, brauchen wir keine Entschuldigungen zu suchen. Es kann nur darum gehen, erkennbar problematische Theorien zu verwerfen, sich um 180 Grad zu drehen, die Sackgasse zu verlassen und zu hoffen, dass man sich auf dem neuen Weg nicht wieder im Kreise drehen wird. Dass immer wieder kleine Ergebnisse erzielt werden, ist kein Zeichen dafür, dass man sich einer Einsicht nähert, solange nicht eine Verfeinerung der Theorie zu besseren und stärkeren Ergebnissen führt. Und davon ist nichts sichtbar, ganz im Gegenteil, mit zunehmenden Teilerkenntnissen erscheint das Manuskript immer verwirrender, unregelmäßiger, unverständlicher. In meinen Augen ist das ein guter Beleg dafür, dass sich die gesamte Forschung am Voynich-Manuskript in einer Sackgasse befindet.

Und ich werde diese Sackgasse verlassen.

Kommt jemand mit?

Thema: Kommunikation | Kommentare (0) | Autor: