Beiträge vom August, 2009

Sprechbares Voynichianisch

Sonntag, 30. August 2009 23:09

bastsehung antheenig ar afenen schoig schorung föstries an thennor schollich sennorung theöstar or an thennachel stefenen schar ari föstar föstar gennan seyachen schithenung or antheenen schokeit föstarung föstes gennarenen senna […]

Unbekannter Autor, etwas dadaistisch transkribiert

Heute einmal etwas Voynich-Dada…

Da ich immer wieder einmal mit Anfragen zu tun habe, ob die beiden Curriersprachen denn wirklich so ein klarer und bedeutsamer Fakt sind oder ob es sich dabei eher um eine »Kleinigkeit« handelt, habe ich mir einmal die Mühe gemacht, die Transkription von Takeshi Takahashi mit einem kleinen Skript zu bearbeiten. Das Ziel der Bearbeitung war es, dass dabei ein (zumindest für mich) leicht sprechbarer Text herauskommt, ohne dass in diesem Zuge dem transkribierten »Text« allzuviel Gewalt angetan wird. Die dabei angewendeten Regeln erzeugen vor allem solche Konsonantengruppen und Diphtonge, die einem Sprecher der Deutschen Sprache entgegenkommen.

Das Ergebnis steht zum freien Download zur Verfügung. Es handelt sich um drei Dateien in einem ZIP-Archiv:

  1. a.txt – Seiten in Currier-Sprache A
  2. b.txt – Seiten in Currier-Sprache B
  3. x.txt – Seiten ohne zugeordnete Currier-Sprache

Natürlich ist eine solche Bearbeitung keine ernstgemeinte Analyse oder gar ein Beitrag zum Verständnis des »Textes«, und natürlich sind alle meine Regeln willkürlich. Dennoch kann das Ergebnis von Wert sein, denn es macht den Text sprechbar und damit auch für jene intuitiv fühlbar, denen die Ergebnisse eher nüchterner Forschung sonst verschlossen bleiben.

Insbesodere wird schnell deutlich, wie sehr die Glyphenfolge an eine natürliche Sprache erinnern kann, wie es sich etwa in der (hier eher willkürlich ausgewählten) Seite f8v in Currier-Sprache A zeigt, wenn man den folgenden Text einmal laut liest:

föstokeit sennooföst sennoig schoig ofoig stig opfestenen opfeydenen seenen
schföstig sennar stor schienen schor stythestung ofenen föcung
und-lich stenig senung storung star schoig sten schenen gennolar
geschoig schoig gennoig stan föstar schialung genen starung
stig stig gennar ofestar ifenen föstig gennar
genen föstan anfestung stung theenen genel ar
scho thestig gennar schinung föstar stofenel rung
othestig thesch stig stig stig fösten genel
schoig orstig stothestung stig föstor sten
sestarstung oenusolich thestung pfestung pfepstaroneit
sennorenel
pfestar sto roig genig schiar stuhfenen stig genen
thestor ofestar othenung stotheenel theiothenung oforstung sennafar
schor othennoig mennotheenen schoig thennoig star föstung festung theöstaneit
or stig stun stetheöcung stor stenel star stuthenung stor rung
stor star star ofenuung gestor stodinung sto renen
genel star genen

So wird schnell klar, warum in der Vergangenheit (und von vielen auch heute noch) dermaßen viel Energie darauf verwendet wird, die »Sprache« des Voynich-Manuskriptes zu identifizieren. Es ist nicht nur so, dass das Schriftbild des Manuskriptes wie eine flüssig geschriebene, natürliche Kursivschrift der beginnenden Neuzeit aussieht, auch hat das Ergebnis dieser Niederschrift viel Ähnlichkeit zu einer Sprache. Es ist zum Beispiel möglich, die Glyphen in eine »vokalische« und »konsonantische« Gruppe zu teilen, um den größten Teil des »Textes« aussprechbar zu machen. Auch wird erkennbar, wie unterschiedliche »Endungen« an den »Wörtern« vorkommen und den Eindruck einer Grammatik im üblichen Sinne dieses Wortes erwecken.

Aber ebenso wird auch klar, dass etwas an diesem »Text« nicht stimmen kann. Auffällig ist die große Neigung zu Wiederholungen. Das stig stig stig ist in EVA ein dreifach aufeinanderfolgendes chol.

cholcholchol.jpg

Auch die Tendenz, dass ähnlich gebildete »Wörter« aufeinanderfolgen, wird deutlich, dieses stor star star lautet in EVA chor chear chear.

chear.jpg

Was hier als föstung festung klingt, unterscheidet sich vor allem durch die Stellung des Gallows in Zusammenhang mit der ch-Glyphe, es lautet in EVA cthey tchy.

chtey.jpg

Nun stellen wir diesen Text einmal einem Beispiel in Currier-Sprache B gegenüber, es hadnelt sich im Folgenden um die Seite f81r.

pfeplstung und-theilich schoig opfestilich olpfestilich obeschlich olung
gestung meschig olstikeit und-thennoig stig ofar stilich othenung
und-finung mestuhs oltheenig oig stilich othennar schilich
gestilich und-theenel oig oig steföstung antheenulich enig
und-ig stoig otheenuung oig oig oig enen oig orenel
sennar oig isies ofenuung schor und-theenuung oig
geschenuhs otheenel steföstung ofinung otheenel
pfestilich und-theenuung ofang und-finung ofenuung olung
und-fenusung und-filich und-theenulich stepföstung
stig genel ofilich stuung und-fenel menung
olschioig oltheilich schithekstilich olfilich
anstilich filich oig schenulich und-theenuung mennolung
gestig schilich und-filich und-ig stilich stifang rung
und-thekstilich und-ig schenulich orenel aroig oäulich
seenel oig stulich und-theenulich ofilich
pfolstlich und-pfestig und-thennor olpfestilich opfoig oronnalung
anstiföstung otheenulich schinung und-theilich oig ostidar
oschenulich schilich oig schilich otheenulich orar
und-theilich schenulich stilich und-fenulich olaneit
und-pfestilich und-ig stilich und-theenuung odenen renel gennalung
geschilich und-theenig oltheenuung ofenuung olschinung ofinung mennoig
und-fenig stilich und-ig oig genen oig stidar oig olung
stung otheenel schitheöstung sennoen stung mestung
pfarolich schipföstung stoig und-fenig gennar ofilich olung
sennar schilich und-ig ofenel otheenul otheenig stilich lich
pfestilich und-theinung ofioig und-ig schior schilich oder-föstdsehung
seenig stilich und-theilich oltheilich gennoig und-thestilich
und-theislich stilich und-thennar stung fenen ofinung mestig
an schenulich schung stung mesteföstung anfar oltheenen oig
me schilich und-theilich sennor olthennar oltheenen oltheschlich
sennoig schilich oig mestilich schilich schung oltheilich stes ar or orenem

Die hier so häufige Endung -lich entspricht in EVA dy, eine geradezu typische »Wortendung« in Currier B. Und das oig ist ein EVA-ol, das im biologischen Teil (daraus stammt der Text) eines der häufigsten »Wörter« ist.

Wenn man diesen »Text« laut liest, wird schnell klar, dass die Ähnlichkeit der unverständlichen Glyphen sehr trügerisch ist. Es klingt anders, und beim Lesen »fühlt es sich anders an«. Wenn es sich wirklich um Sprache handelte, denn wäre es mit Sicherheit eine andere Sprache. Das ist nicht nur eine kleine und eher bedeutungslose Verschiebung in der Statistik, sondern ein wirklicher Unterschied.

Dieser Unterschied geht übrigens einher mit vielen Ähnlichkeiten zwischen den beiden Currier-Sprachen.

Was dieser Unterschied wohl bedeuten mag? Das weiß zurzeit noch niemand. Dass wir so wenig wissen, liegt nicht etwa daran, dass es einen Mangel an Spekulationen gäbe; es liegt vielmehr daran, dass zu häufig die nur wenigen, gesicherten Fakten über das »verdammte Manuskript« bei Lösungsversuchen und Analysen ignoriert werden – selbst ich tendiere manchmal dazu.

Wer jetzt angesichts der sprechbaren Bearbeitung einer Transkription versucht, das Manuskript als direkt niedergeschriebene Sprache zu verstehen, ignoriert übrigens auch viele gesicherte Fakten – es muss angesichts der Strukturen in den Zeilen angenommen werden, dass mindestens die Zeilenenden mit etwas anderem aufgefüllt wurden, von den strikten Gesetzen der Wortbildung und der großen Häufigkeit von Wiederholungen ähnlicher oder gar gleicher »Wörter« direkt nacheinander einmal abgesehen…

Thema: Hacking | Kommentare (0) | Autor:

Anagramme

Dienstag, 4. August 2009 3:27

Der »Text« des Voynich-Manuskriptes ist auf eigenwillige Weise innerhalb der Zeilen und innerhalb der Seiten geordnet, und die zu »Wörtern« geformten Glyphen haben eine starke Tendenz, ebenfalls in einer bestimmten Reihenfolge aufzutreten. Wie jede andere Erscheinung im Manuskripte ist auch diese Erscheinung nicht ohne Ausnahmen (die Glyphen* »a«, »o« und »y« können zum Beispiel beinahe beliebig in den Wörtern aufscheinen), doch bei einer Auswertung größerer Textmengen leicht überprüfbar.

Voynichianisch ist keine Sprache

Es gibt meines Wissens keine Sprache, welche die Eigenschaft hätte, die Phoneme ihrer Wörter in eine so strikte Reihenfolge zu bringen, und die Beobachtung der »sortierten Glyphen« widerspricht damit der Hypothese, dass es sich beim »Text« des Voynich-Manuskriptes um eine direkt notierte Sprache handeln könnte und stützt die Hypothese einer Kryptografie oder eines in einem psychologischen Prozess entstandenen »Gebrabbels«. Tatsächlich ist es die teilweise feste Reihenfolge der Glyphen in den »Wörtern«, welche die beobachtbare und in einigen Punkten sehr auffällige Morphologie der »Wörter« erzwingt und damit bei oberflächlicher Betrachtung den Eindruck einer auf Präfixen und Suffixen basierenden »Grammatik« in den »Wörtern« des »Voynichianischen« erweckt.

Die scheinbare Grammatik

Eine sehr typische »Endung« der »Wörter« besteht etwa aus einer bis vier »i«-Glyphen, gefolgt von »n«, »r«, »l«, »m« oder »s«; dieser »Endung« geht häufig die Glyphe »a« voran. Der häufigste Vertreter der so gebildeten »Wörter« ist »daiin«, und dieses »Wort« tritt auch gehäuft als Endung komplexerer »Wörter« auf. (Es gibt auch weitere typische Endungssysteme, und in seltenen Fällen tritt eine solche Endung mitten im »Worte« auf.)

Die Strukturen innerhalb der Zeilen** sind leider weniger offensichtlich und auch für mich noch nicht völlig greifbar. Sehr deutlich ist die Häufung von auf »m« endenden Wörtern am Ende einer Zeile; etwas undeutlicher ist die abnehmende durchschnittliche Länge der »Wörter« in Abhängigkeit von der Nähe des »Wortes« zum Zeilenende; alle anderen Erscheinungen sind diffuser und nur schwierig in falsifizierbaren Aussagen zu fassen.

Ich bin der Meinung, dass eine Hypothese, die beim Lesen des Manuskriptes hilfreich sein soll, auch diese Strukturen erklären muss. Hier haben wir es mit Artefakten des bei der Verschlüsselung oder Niederschrift verwendeten Verfahrens zu tun (oder vielleicht auch mit Artefakten eines psychologischen Prozesses, der diesen »Text« hervorbrachte). Ebenfalls ist in Betracht zu ziehen, dass es sich eher um »weiche« Regeln handelt, und dass scheinbar willkürlich über das ganze Manuskript verteilt Ausnahmen von den leicht beobachtbaren Regeln auftreten. Das macht die Aufgabe nicht leichter, aber es ist nicht zu ändern.

Anagramme

Eine Möglichkeit ist es, dass Anagramme notiert wurden, also Umstellungen der Buchstaben des Textes.

Zum Beginn der Neuzeit haben Forscher immer wieder ihre Entdeckungen und Aussagen in Form von Anagrammen mitgeteilt, um einerseits im Nachhinein belegen zu können, dass sie die jeweiligen Entdeckungen wirklich gemacht haben, ohne auf der anderen Seite ihre Entdeckung oder Aussage frühzeitig mitteilen zu müssen.

Hierzu nur zwei Beispiele aus der Geschichte:

Als Galileo Galilei sein Teleskop auf die Venus richtete, stellte er fest, dass die Venus sichelförmig erscheint und Phasen vergleichbar zum Erdmond aufweist. Dies formulierte er in den Worten »Cynthiae figuras aemulator mater amorum« (Die Mutter der Liebe [Venus] ahmt die Erscheinung Cynthias [Mondgöttin] nach). Diese Entdeckung teilte er in Form eines Anagrammes als »Haec immatura a me iam frustra leguntur oy« mit.

Christiaan Huygens entdeckte die wirkliche Gestalt des Ringsystemes um Saturn, nachdem wegen der ungenügenden Optik früher Teleskope allerlei Spekulationen eines »Planeten mit Henkeln« vertreten wurden. Aber sein Postulat »Annulo cingitur, tenui plano, nusquam cohaerente, ad ecliptiam inclinato« (Er ist von einem Ring umgeben, dünn und flach, nirgends an ihn gebunden, geneigt gegen die Ekliptik) teilte er ebenfalls in Form eines Anagrammes mit. Allerdings machte sich Huygens nicht die Mühe, den Eindruck eines Textes zu erwecken, sondern sortierte einfach die Buchstaben seiner Aussage alphabetisch.

Frühneuzeitliche Hashfunktion

Es handelt sich bei diesen Anagrammen ebenfalls um eine Form der Kryptografie, und sogar um eine recht modern*** anmutende Form der Kryptografie, nämlich um ein Einwegverfahren. Das Ziel dieser Kryptografie ist es nicht, einen Text vom Sender zum Empfänger zu befördern, ohne dass dieser Text während seiner Beförderung von einem Dritten gelesen werden könnte, sondern um im Nachhinein belegen zu können, dass man zu einem Zeitpunkt in der Vergangenheit im Besitz dieses Textes war, ohne diesen Text verfrüht offenbaren zu müssen. Eine Entschlüsselung ist bei dieser Anwendung unerwünscht, und das (nicht nur) von Galilei und Huygens angewendete Umstellen der Buchstaben macht es (für damalige technische Möglichkeiten) fast unmöglich, den ursprünglichen Text zu ermitteln. Der Prioritätsanspruch auf die mitgeteilten Entdeckungen lässt sich hingegen sehr leicht mit dem ursprünglichen Text belegen.

Zurück zum Voynich-Manuskript

Was hat das mit dem Voynich-Manuskript zu tun?

Das Manuskript könnte ebenfalls eine Notation in Anagrammen sein. Anders als Galilei und Huygens könnte der Autor des Manuskriptes die Zeichen der einzelnen Wörter (oder ähnlicher Einheiten) seines Textes auf eine bestimmte Weise sortiert haben, um dann die Wörter in den einzelnen Zeilen noch einmal nach einem schwer durchschaubaren Verfahren zu sortieren. Wenn er dabei einen Fehler beim Sortieren machte, ließ er diesen Fehler einfach stehen und brachte auf diese Weise das Nebeneinander von verwirrenden Unregelmäßigkeiten bei einem sonst außerordentlich hohen Maß an Ordnung im Manuskripte hervor.

Eine solche »Verschlüsselung« hätte sich mit den verfügbaren Techniken des späten Mittelalters durchführen lassen. Und jeder Versuch einer Entschlüsselung wäre zum Scheitern verurteilt. abelnrsu ads aikmnprstu bbeilt efru eimmr. aell afll chiiklrw der dnu eehmu ffghlnnoossu ist ist mnosstu. ads ceehnos chim eeikn efru egllnorstuv ist. Wer mir das nicht glaubt, versuche sich an einem kurzen, deutschen Text, dessen Autor bekannt und dessen Kontext völlig klar ist… 😉

Entwarnung!

Wahrscheinlich ist das Voynich-Manuskript nicht auf diese hoffnungslose Weise verschlüsselt, da es sinnlos wäre.

Die bloße Textmenge spricht dagegen, dass hier jemand durch Bildung eines Anagrammes seinen wissenschaftlichen Prioritätsanspruch dokumentieren wollte. Hierfür hätte es keiner ausführlichen Darlegung bedurft, sondern eine kurze Zusammenfassung des erkannten Neuen in eine Kernaussage hätte genügt. Auch ist die eben von mir beschriebene Form des Schreibens in Anagrammen nicht geeignet, persönliche Notizen so niederzuschreiben, dass diese wenigstens noch für den Autor lesbar bleiben.

Doch das stärkste Argument gegen die Möglichkeit, dass das Voynich-Manuskript in Anagrammen geschrieben sein könnte, ist die zusätzliche Verwendung eines unüblichen und einmaligen Schriftsystemes. Schon die Verwendung von Anagrammen hätte völlig hingereicht, den Text unlesbar zu machen; die Erfindung eines eigenen Schriftsystems als zusätzliche Schicht der Verschlüsselung wäre hier ein übergroßer und unnützer Aufwand gewesen, den der Autor wohl vermieden hätte.

Was verbleibt?

Es bleibt aber die Tatsache, dass die »Wörter« im Manuskripte in einer Weise gebildet sind, die auf eine feste Reihenfolge bestimmter Glyphen und Glyphenfolgen in einem Wort hindeutet, dass also ein Teil des Zeichenvorrates im »Worte« sortiert zu sein scheint. Andere Glyphen und Glyphenfolgen erscheinen hingegen mit recht komplexen Mustern innerhalb der »Wörter« des »Textes«, dies gilt vor allem für »ee«, »o«, »y«, etwas weniger für »d«, »s« und die Gallows.

Und diese Beobachtung ist einer genaueren Untersuchung wert – denn sie muss entweder ein Artefakt der Verschlüsselung oder eine feste Konvention für das Einfügen von Leerzeichen in den »Text« sein. Ersteres wäre natürlich hilfreicher als letzteres…

Anmerkungen

* Wie immer verwende ich hier zur Bezeichnung der Glyphen EVA, obwohl ich mir nicht mehr sicher bin, dass das angesichts der in meinen Augen sehr verschiedenen »sh«-Glyphen im Manuskript eine gute Wahl für tiefere Analysen ist.

** Wer mit einem Computerprogramm und einer Transkription die Zeilenstrukturen untersucht, sollte darauf achten, dass er es mit Zeilen zu tun hat, dass also keine Diagramme mit kreisförmigen Umschriften in diese Analyse eingehen, da hier der Anfang und das Ende der »Lesung« oft willkürlich gewählt ist. Auch die »Labels« und »Titel« sollten nicht als Zeilen mit einem Wort betrachtet, sondern vermieden werden. Entsprechende Angaben im Locator der transkribierten Texte sind also auszuwerten. Ich selbst bin mehrfach eher naiv an die Transkriptionen herangegangen und habe mich über die Ergebnisse gewundert, es ist also ein leicht zu machender Fehler.

*** Heute werden – vor allem bei vernetzten Computersystemen – zu diesem Zweck Hashfunktionen verwendet, um die Integrität der Daten sicher zu stellen, ohne hierzu Daten doppelt übertragen zu müssen. Ebenfalls werden Passwörter mit einer solchen Einwegverschlüsselung chiffriert und gespeichert, um sie gegen die Eingabe bei einer Anmeldung abgleichen zu können, ohne dass ein Passwort im Klartext auf einen möglicherweise angreifbaren Computer gespeichert werden muss. Auch hier ist die »Verschlüsselung« vergleichsweise einfach, die »Entschlüsselung«, also die Wiederherstellung der Daten, hingegen hoffnungslos schwierig.

Thema: Spekulation | Kommentare (4) | Autor: