Beitrags-Archiv für die Kategory 'Hacking'

Der große Frust

Sonntag, 1. März 2009 0:51

Es ist nicht leicht möglich, sich rationell dem Anomalen zu nähern. Wenn sich ein Mensch einer Erscheinung gedanklich annähert, denn tut er dies in der Regel, indem er Muster darin sucht, um aus diesen Mustern eine Einsicht in die Beschaffenheit des Gegenstandes zu erhalten. Im Idealfall bekommt ein Mensch während dieses Unterfangens nach und nach aus seinen Irrtümern und weiter führenden Hypothesen das Gefühl, einen »festen Boden« unter den Füßen zu bekommen, und von dort ausgehend geht es dann voran, bis im Idealfall eine Einsicht zustande kommt.

Nehmen wir einmal ein Beispiel aus meinem Leben.

In der Mitte des Jahres 2000 stellte ich auf digitalen Fotografien im Internet und später auch auf solchen eines Freundes gelegentlich etwas fest, was wie schwach glimmende Kügelchen mit einer undeutlichen, inneren Struktur aussah. Natürlich durchsuchte ich daraufhin erst einmal das Internet, um eine Aufklärung zu finden. Dort fand ich nach kurzer Zeit Einiges zum Thema. Ich »lernte«, dass diese Leuchterscheinungen »Orbs« genannt wurden, und ich »lernte«, dass viele Menschen der Meinung waren, es handele sich hier um ein paranormales Phänomen. Angesichts der großen Anzahl solcher Bilder konnte ich die paranormale Hypothese nicht glauben, zumal die »Orbs« neben ihrer Fähigkeit, auf Fotos aufzuscheinen, keinerlei reproduzierbare Wechselwirkung mit der Umwelt zeigten. (Die immer wieder behauptete »Wahrnehmung« der »Orbs« durch Haustiere erwies sich bei erster Durchsicht des Bildmateriales als Haufen interpretierter Zufälligkeiten, es gab außerordentlich viele Bilder, auf denen die Hunde und Katzen mit offensichtlicher Gleichgültigkeit auf die »Orbs« reagierten.)

Aber es hatte mich gepackt, und so wollte ich erfahren, was es mit den »Orbs« wirklich auf sich hat. Sie tauchten ja auch auf Fotos eines Freundes auf, und ich setzte mich mit einer Mail mit diesem Freund in Kontakt, verwies auf ein im Internet veröffentlichtes Bild von ihm und fragte ihn, welchen Reim er sich auf die fahle Leuchterscheinung machen könnte. Er war zunächst genau so ratlos wie ich, hatte so etwas öfter einmal gesehen, aber deshalb die Fotos eher als »unbrauchbar« aussortiert. Zum Glück hatte er seine Fotos archiviert, und ich bat ihn, einmal einen flüchtigen Blick in sein Archiv zu tun, damit wir vielleicht Genaueres über diese »Erscheinungen« erfahren – dabei habe ich die »paranormale Hypothese«, die ich auf englischsprachigen Websites kennen lernte, bewusst nicht erwähnt.

Mein Freund nahm sich tatsächlich zwei Stunden Zeit für diese kleine Frage, und am Ende standen folgende Einsichten:

  • Er fotografierte damals sowohl digital (für das Internet) als auch auf klassischem Filmmaterial, aber alle »Orbs« sah er nur auf digitalen Fotos.
  • Die meisten »Orbs« wurden dann sichtbar, wenn Fotos aus Kneipen, Distotheken oder ähnlichen Etablissments im Betrieb geschossen wurden – dies machte er vor allem für die Internet-Arbeit.

Das war ja schon einmal ein Muster. Im nachfolgenden Mailverkehr kamen wir auf die Idee, einmal die EXIF-Daten in den Digitalfotos mit »Orbs« zu betrachten, um vielleicht einen weiteren Hinweis auf die Natur dieser Erscheinung zu bekommen.

Dabei stellte er fest, dass alle »Orbs« in seinen Fotos auf Blitzlichtaufnahmen erschienen, und zwar vor allem unter ungünstigen Lichtbedingungen.

Wir bildeten die Hypothese, dass es sich um defokussierte Staubteilchen handeln könnte, die vom Blitzlicht angeschienen werden. Die scheinbare Ausdehnung dieser »Orbs« wäre dann ein Effekt der Unschärfe. Mit dieser Hypothese war es meinem Freund sofort möglich, ein paar typische »Orb«-Fotos zu reproduzieren, indem er seine Kamera im Halbdunkel vor einer staubigen Matratze platzierte, auf die er vorm Auslösen einige Male mit seiner Hand schlug. Jetzt erst machte ich meinen Freund auf die teils recht esoterischen Deutungen des Phänomens aufmerksam, und wir lernten beide eine Menge darüber, wie sich Menschen eine unverstandene Erscheinung zurechtinterpretieren konnten.

So eine schnelle Einsicht ist ein Idealfall. Es war nicht viel »Forschung« erforderlich, um die Muster in der Erscheinung zu erkennen und um auf diesem Wege eine befriedigende Erklärung zu bekommen. Viel mehr fanden wir es beide erstaunlich, mit wie großem Ernst Menschen teilweise absurde Thesen vertreten, ohne auch nur einen Moment lang über mögliche andere Erklärungen nachzudenken. Die schiere Menge der »Orb«-Fotos hätte jeden darauf bringen können, dass es sich um etwas sehr alltägliches handeln musste.

(Später machte mein Freund auch »Orb«-Fotos bei Nieselregen, hier sind es allerdings feine Wassertröpfchen, die als »Orbs« erscheinen. Das Resultat ist sehr ähnlich. Wenn wir das wollten, könnten wir die Leichtgläubigkeit vieler Menschen ausnutzen, indem wir auf Bestellung »paranormale« Fotos anfertigen, aber diese Art »Geschäft« verachten wir.)

So weit eine kleine Erfolgsgeschichte.

Beim Voynich-Manuskript kann ich nicht einmal eine kleine Erfolgsgeschichte berichten. Der große Erfolg, ein endlich gelesenes und verstandenes Manuskript, liegt in noch größerer Ferne.

Denn das Voynich-Manuskript ist anomal. Es bleibt anomal, gleich, auf welcher Ebene es betrachtet wird. Das erschwert jede Beschäftigung mit dem »verdammten Manuskript«.

Das verwendete Schriftsystem ist einzigartig und nirgends anders belegt. Es hat dabei aber Ähnlichkeiten zu üblichen lateinischen Schriften und gängigen Abkürzungen des spätmittelalterlichen Europas.

Der »Text« weist zwar verheißungsvolle und sehr deutliche Regelmäßigkeiten in der Wortbildung auf, aber ein großer Anteil des Textkörpers weicht von diesen Regeln ab. Diese Abweichungen verteilen sich völlig unregelmäßig im Manuskript, nur das erste Wort einer pflanzenkundlichen Seite ist beinahe immer unregelmäßig gebildet.

Die innere Struktur der regelmäßig gebildeten »Wörter« erinnert an natürliche Sprachen, passt aber zu keiner Sprache, die im europäischen Raum Spuren hinterlassen hat.

Die Illustrationen scheinen reine Fantasiegebilde zu sein, sie lassen sich nicht biologischen, astronomischen, astrologischen oder esoterischen Erscheinungen außerhalb des Manuskriptes zuordnen. Das heißt aber nicht, dass sie nicht gelegentlich starke Ähnlichkeiten zu wirklichen Erscheinungen hätten.

Nach einigen Jahren mit dem »verdammten Manuskript« habe ich zumindest eines gelernt: Wann immer ich nach einem erkannten Muster greife – wie etwa den »harmonischen Regeln« für die Glyphenfolge – führt dieser Weg in eine Sackgasse. Die Regelmäßigkeit des Manuskriptes ist vorhanden, und sie deutet an, dass sich Bedeutung in ihr verbirgt, dass es sich nicht um eine zufällige Folge von Glyphen handelt. Aber die Ausnahmen von diesen Regeln verteilen sich völlig willkürlich über das Manuskript und machen jeden Versuch zunichte, weitere Einsichten zu gewinnen.

Es ist frustrierend.

Und dieser Frust greift nicht nur nach mir, sondern nach jedem Menschen, der sich mit dem Voynich-Manuskript beschäftigt. Seit etlichen Jahrzehnten beschäftigen sich Menschen von hohem akademischen Bildungsgrad, Spezialisten aller Art sowie diverse wissenschaftliche Laien wie ich mit diesem Buch, ohne dass auch nur die Spur einer Einsicht in die Bedeutung des Textes entstanden ist. Was uns allen bleibt, ist der begründete Glaube, dass der Text wohl wenigstens für seinen Schreiber eine Bedeutung gehabt haben wird – und auch der begründetste Glaube kann nicht eine rationelle, belegbare, zu Ergebnissen führende Einsicht ersetzen.

Anfangs, als ich das Problem unterschätzte, war ich noch etwas motivierter. Die flüchtige Schrift, die nicht nach einem schweren Rätsel aussah, hatte mich in den Bann gezogen, hatte mir durch die Jahrhunderte zugeflüstert, dass sie leicht zu schreiben gewesen sei, gar nicht nach einem Code aussieht und dass sie deshalb wohl auch leicht zu lesen sein würde.

Selbst darin widerspricht sich dieses Manuskript selbst.

Und manchmal halte ich das für die eigentliche Botschaft. Manchmal glaube ich, dass ich ein großartiges Kunstwerk vor mir sehe – nicht das »sinnlose Geschwafel«, das einige Forscher gern im Voynich-Manuskript sehen würden, sondern ein aufwändig und sehr genau und überlegt geschaffenes Werk, das mit allen Aspekten der menschlichen Wahrnehmung spielt, um ihr die Grenzen aufzuzeigen. Denn das erklärt für mich noch am besten, was im Voynich-Manuskript vor mir liegt.

Und dann verfolge ich doch wieder eine neue Idee, um mich schon nach kurzer Zeit in der inzwischen sehr vertrauten Sackgasse wiederzufinden…

So gut ist dieses Kunstwerk. ;-)

Thema: Interpretation, Kunst | Kommentare (1) | Autor:

Verteilung unharmonischer Wörter auf Zeilen

Dienstag, 23. September 2008 19:46

Nachdem die Datenbank um eine Tabelle erweitert ist, die eine Zählung von Verstößen gegen die harmonischen Gesetze in den »Wörtern« ermöglicht, liegt es nahe, einmal die Verteilung dieser »Wörter« auf den Seiten des Manuskriptes zu betrachten.

Es erscheint mir unwahrscheinlich, dass bei acht Prozent des »Textes« durch Fehler bei der Transkription oder bei den früheren Restaurationen solche Abweichungen entstanden sein sollten, vielmehr halte ich diese besonders gebildeten »Wörter« für eine Auffälligkeit im Manuskript.

In der ersten derartigen Untersuchung will ich überprüfen, in welcher Weise sich diese Wörter auf den Zeilen einer Seite verteilen. Hierbei ist mir eine Schwäche meiner Datenbank aufgefallen. Sie enthält bislang keine Information darüber, welches die Position der transkribierten Zeile auf der Seite ist. Deshalb habe ich ein kleines Python-Skript geschrieben, das diese Information erstellt, es steht hier zum freien Download: Python-Skript zum Hinzufügen einer Zeilennummer in die Zeilentabelle

Mit dieser Änderung ist eine Analyse nach Zeilen recht einfach geworden, es handelt sich um eine einfache SQL-Abfrage (hier für den pflanzenkundlichen Teil in der Currier-Sprache A aus der Transkription von Takeshi Takahashi angegeben):

SELECT 	lineno AS Line,
	SUM(wordcount) AS Words,
	SUM(harm_failcount) AS Enharm,
	SUM(harm_failcount) / SUM(wordcount) AS Percent
FROM	voy_line
JOIN	voy_lineword ON lword_line = line_id
JOIN	voy_word ON word_id = lword_word
JOIN	voy_harmony ON word_id = harm_word
JOIN	voy_page ON line_page = page_id
WHERE	illustration_type = 'H'
AND	currier_hand = 'A'
AND	line_trans = 'H'
GROUP 	BY lineno

Es ist nicht sehr sinnvoll, diese Analyse über jene Seiten zu machen, bei denen die Transkriptionen eine große Menge Labels enthalten. Diese Labels erscheinen in den Transkriptionen als eigene Zeilen, und die etwas unheitliche Benennung im Lokator einer solchen »Zeile« macht es nicht leicht, solche Zeilen auszuschließen. Diese künstlichen Zeilen sind auf zweierlei Weise besonders; sie sind sehr kurz (oft nur ein »Wort«), und die darin enthaltenen »Wörter« haben eine Häufung von Eigentümlichkeiten, die sie als eine besondere Klasse kennzeichnet. Deshalb habe ich mich auf den pflanzenkundlichen und abschließenden Teil beschränkt, in dem es große Mengen »Fließtext« gibt. Den biologischen Teil habe ich ebenfalls untersucht, aber hier sind alle Ergebnisse wegen der vielen Labels mit ganz besonderer Skepsis zu betrachten.

Die Ergebnisse dieser Untersuchung (durchgeführt an der Transkription von Takeshi Takahashi) stehen wie immer zum freien Download zur Verfügung – allerdings diesmal nur in der Form von Zahlenreihen. Denn es sind eigentlich keine besonderen Ergebnisse, es ist ein kompletter Fehlschlag: Download der Ergebnisse meiner Analyse

Was sich bei dieser einfachen Analyse nämlich zeigt, ist »nur«, dass die nicht den harmonischen Regeln entsprechenden Wörter ohne auffällige Regelmäßigkeit über die Zeilen verteilt sind. Das ist zwar auch eine Erkenntnis, aber nicht unbedingt eine erhellende.

Aber ich bleibe dran…

Thema: Ergebnisse | Kommentare (0) | Autor:

Überprüfung der harmonischen Gesetze

Freitag, 22. August 2008 21:58

Es ist eine Sache, nach einem Blick in die Transkriptionen und vor allem auch in die Bilder des Manuskriptes die »harmonischen« Gesetze für die Bildung der Glyphenfolgen in einem »Wort« zu erkennen. Eine solche Einsicht wirkt jedoch um einiges überzeugender, wenn man sie mit ein paar Zahlen belegen kann.

Um mich dieser Aufgabe zu widmen, habe ich ein Python-Skript geschrieben, dass meiner Voynich-Datenbank eine neue Tabelle hinzufügt. Das Skript für die harmonische Analyse der „Wörter“ im Manuskripte stelle ich hier wie üblich zum freien Download.

Nach der Anpassung der Zugangsdaten für die Datenbank und dem Start des Skriptes wird die neue Tabelle voy_harmony in der Datenbank erzeugt. Diese besteht nur aus zwei Spalten, nämlich

  • harm_word INTEGER
    Die ID des Wortes, für das die Verstöße gegen die Harmonieregeln gezählt wurden
  • harm_failcount INTEGER
    Die Anzahl der Verstöße gegen die harmonischen Regeln für dieses Wort

Das Skript zählt alle Verstöße gegen die harmonischen Regeln, außer, wenn sie in einigen Fällen die letzte Glyphe eines Wortes betreffen. Eine solche Zählung findet für jedes Wort statt, dass ausschließlich aus lesbaren Zeichen besteht. Jeder Weirdo wird – mit Ausnahme seines Auftretens an letzter Position im Wort – als Verstoß gegen die harmonischen Regeln gezählt.

Mit Hilfe dieser Tabelle lassen sich natürlich ausführliche Analysen machen. Um mich von der Gültigkeit der harmonischen Regeln für einen Großteil des Manuskriptes zu überzeugen, habe ich einmal eine kleine Zählung über alle Wörter aus allen Transkriptionen gemacht:

SELECT  COUNT(*) AS words,
        SUM(count) AS frequency,
        harm_failcount AS unharmonicals
FROM    voy_word
JOIN    voy_harmony ON word_id = harm_word
GROUP   BY unharmonicals;

Das Ergebnis dieser Zählung ist erstaunlich, zumal in diese Zählung auch alle »Wörter« derjenigen Seiten eingegangen sind, die eine besondere Häufung von Weirdos und ungewöhnlich geformten »Wörtern« zeigen.

+-------+-----------+---------------+
| words | frequency | unharmonicals |
+-------+-----------+---------------+
|  8384 |    111003 |             0 |
|  2329 |      7779 |             1 |
|   704 |      1836 |             2 |
|   116 |       194 |             3 |
|    14 |        15 |             4 |
|     1 |         1 |             5 |
+-------+-----------+---------------+
6 rows in set (0.91 sec)

Wenn man die verschieden geformten »Wörter« betrachtet, ohne ihre Häufigkeit in Rechnung zu stellen, denn sind 27,4 Prozent des gesamten »Wortschatzes« (der gewiss auch viele Fehler der Transkriptoren und der frühen Restauratoren enthält) »unharmonisch« geformt. Bezieht man jedoch die Häufigkeit dieser Wörter in Betracht, so erweisen sich nur 8,1 Prozent der »Wörter« des gesamten »Textes« im Manuskript als »unharmonisch«.

Die »harmonischen« Regeln erzwingen durch ihre starre Struktur eine recht hohe Redundanz des Textes. Die »unharmonischen« Wörter haben also einen höheren Gehalt an Information, sie tragen vielleicht auch eine (oder sogar: die) Bedeutung.

Was als nächster Schritt sehr interessant wäre, das wäre eine Analyse, ob die »unharmonischen« Wörter gehäuft an bestimmten Stellen des Manuskriptes (Position des »Wortes« in der Zeile, Position der Zeile auf der Seite, bestimmte Abschnitte im Manuskripte) auftreten, oder ob sich sich gleichmäßig über den gesamten Text verteilen. Eine solche Analyse werde ich in den nächsten Wochen einmal angehen.

Thema: Ergebnisse, Hilfsmittel | Kommentare (2) | Autor:

Die Harmonie der Glyphenfolgen

Samstag, 5. Juli 2008 0:21

Dieser Text ist »etwas« älter, ich hatte ihn am 15. Februar 2005 auf einer inzwischen nicht mehr verfügbaren Homepage veröffentlicht. Die geäußerten Gedanken erscheinen mir aber immer noch als wertvoll und wichtig, deshalb diese erneute Veröffentlichung.

Unabhängig von den Feinstrukturen der »Wörter« im Voynich-Manuskript lassen sich harmonische Regeln für die Folge der Glyphen in einem »Wort« feststellen. Diese Regeln sind verhältnismäßig einfach, wurden aber vom Autor im gesamten Manuskript angewandt. Beim Betrachten dieser Regeln kommen Zweifel daran auf, dass es sich beim Voynich-Manuskript um niedergeschriebene Sprache im gewöhnlichen Sinn des Wortes handeln kann.

Die Glyphenklassen im Voynich-ManuskriptIch werde mich für die folgenden Darlegungen des Transkriptions-Systemes EVA bedienen, die »Wörter«, Glyphen und Glyphfolgen werden zur leichteren Erkennung in fetter Schrift gesetzt. Für Wortzählungen habe ich die vollständige Transkription von Takeshi Takahashi verwendet.

Jemand, der sich längere Zeit mit dem Voynich-Manuskript beschäftigt, bekommt eine gewisse Intuition dafür, dass die Reihenfolge der Glyphen in einem Wort sehr festen Regeln folgt. Es kann nicht jede Glyphe an jeder Position stehen – bestimmte Glyphfolgen wirken auf der Stelle »falsch«.

Zunächst fällt ein erkennbares System von Präfixen und Suffixen auf. Das typische »Wort« im Manuskript beginnt mit q-, qo- oder o- und endet mit Glyphenfolgen aus einer recht großen Auswahl, in welcher die Gruppen -in, -ir, -il, -es und -dy besonders auffällig hervorstechen. Diese offensichtlichen Strukturmerkmale führten des öfteren zur Annahme, dass es sich hierbei um durchschimmernde Spuren einer Grammatik mit Flexionsystem handeln müsse – allerdings hat diese Annahme noch nicht bei der Identifikation der Sprache geholfen.

Ich möchte diesen vielbetrachteten Aspekt einmal außer Acht lassen und auf die zeichnerische Harmonie der Glyphfolgen eingehen.

Nach einigen Monaten des ernsthaften Forschens wird jedem Menschen intuitiv klar, dass es sich bei der Glyphenfolge qoteody um ein mögliches »Wort« handelt. Dieses »Wort« erscheint dann auch zwölf Mal im Manuskript – es ist damit eines der nicht besonders häufigen Worte, so dass diese »Klarheit« nicht (wie etwa beim sehr häufigen qoteedy) aus der Erinnerung kommen kann. Ebenso ist intuitiv klar, dass die Glyphenfolge qoteidy, die ja transkribiert auf dem ersten Blick sehr ähnlich aussieht, ein sehr ungewöhnliches »Wort« wäre. Und tatsächlich, dieses »Wort« kommt im Manuskript nicht vor.

Aber was unterscheidet diese Glyphenfolgen? Welches Bildungsgesetz für die »Wörter« nimmt man hier intuitiv auf, so dass man oft recht zielsicher entscheiden kann, ob ein bestimmtes »Wort« möglich ist oder nicht?

Die Beantwortung dieser Frage führt auf ein Harmoniegesetz für die aufeinanderfolgenden Glyphen, welches auch das beobachtete Suffixsystem auf natürliche Weise hervorbringt. Doch um dieses zu erkennen, muss man sich von den Transkriptionen abwenden und dem Schriftbild des Manuskriptes zuwenden. Zur besseren Erläuterung habe ich eine Grafik mit den hier postulierten Glyphenklassen und ein paar Beispielen in diese Seite eingefügt und die Glyphen der EVA-Transkription gegenübergestellt.

Die grundlegenden Glyphenklassen

Wenn man die Glyphen in den Bildern des Manuskriptes sorgfältig untersucht, stellt man schnell fest, dass der Glyphenvorrat relativ einfach aufgebaut ist. Es lassen sich drei Klassen von Glyphen an Hand ihres ersten Striches unterscheiden, dem zur Differenzierung in die speziellen Glyphen verschiedenste Dekorationen hinzugefügt werden können. Diese Reihenfolge beim Zeichnen der Glyphen lässt sich an vielen Stellen des Manuskriptes bestätigen, da durch das Absetzen der Feder Lücken in der Glyphe entstehen und häufig nach dem Absetzen die Feder in die Tinte getaucht wurde, so dass der folgende Strich dunkler erscheint.

Neben diesen drei Klassen gibt es noch zwei wichtige Ausnahmezeichen – leider kümmert sich die Wirklichkeit nicht immer um das analytische Streben nach Vereinfachung. Schon jetzt sei gesagt, dass eine dieser Ausnahmen für die »Wortbildung« im Rahmen der beobachteten Harmoniegesetze von Bedeutung ist.

Die nur an vereinzelten Stellen auftretenden »weirdos« werden hier nicht behandelt, fügen sich jedoch manchmal gut in das System ein. Manchmal allerdings auch nicht.

Die i-Klasse: Der erste Strich aller Glyphen dieser Klasse ist ein kurzer Abwärtsstrich, der um etwa 30 Grad gegen die Vertikale nach links geneigt ist. Beim EVA-Zeichen i wird die Glyphe nur von diesem Strich gebildet, darüber hinaus gibt es die wichtigen Glyphen n, r, l und m, die mit diesem Strich beginnen und ihm eine Verzierung hinzufügen.

Die e-Klasse: Der erste Strich dieser Klasse ist ein ungefähr halbkreisförmiger Bogen, dessen Anfang ähnlich geneigt ist wie der Abwärtsstrich der i-Klasse. Bei den EVA-Zeichen e, c und h wird die Glyphe nur von diesem Stich gebildet, darüber hinaus gibt es in dieser Klasse die wichtigen Glyphen o, d, s, y und die wegen ihrer Seltenheit als »weirdos« zu betrachtenden g und b.

Die Gallows: Der erste Strich dieser Klasse ist ein deutlich über der Scheiblinie angesetzter, strikt vertikaler Abwärtsstrich, dem immer eine weitere Dekoration hinzugefügt wird. Der Strich tritt also niemals allein als Glyphe auf. In diese Klasse gehören die EVA-Zeichen k, t, f und p, ferner sind einige der »weirdos« auf diese Art gebildet.

Die Ausnahmeglyphen

Wie schon erwähnt, gibt es genau zwei Glyphen, die aus diesem einfachen Schema der drei Klassen herausfallen. Beide scheinen wichtige Funktionen im Manuskript zu erfüllen, und eine dieser Ausnahmen (das a) ist entscheidend für die Aufrechterhaltung des später beschriebenen Harmoniegesetzes.

Die q-Glyphe: Diese Glyphe tritt nur am Anfang eines »Wortes« auf. Sie besteht aus einem strikt vertikalen Abwärtsstrich, der aber im Gegensatz zu den Glyphen der Gallow-Klasse auf Höhe der Schreiblinie angesetzt wird und diese Linie nach unten hin deutlich durchbricht. Am oberen Ende dieses Striches wird eine nach links gewandte gerade Linie im Winkel von ungefähr 45 Grad angesetzt, diese wird bis zur Mitte des Schreiblinienbereiches fortgesetzt und dort horizontal, aber leicht nach oben weisend abgeknickt. Die sehr häufig folgende Glyphe o wird mit diesem Horizontalstrich verbunden, so dass in diesem Fall der Eindruck einer Ligatur entsteht.

Die a-Glyphe: Diese Glyphe entsteht aus der Kombination (oder Ligatur) des Bogens der e-Klasse mit dem Abwärtsstrich der i-Klasse. Ihre besondere Bedeutung für die Harmoniegesetze wird an späterer Stelle klar werden.

Die Ligaturen

Es gibt einige sehr bemerkenswerte Glyphenfolgen, die einen starken Eindruck von Ligaturen erwecken und deshalb an dieser Stelle (mit allen Vorbehalten wegen des unbekannten Schriftsystemes) auch so genannt werden, die sich aber fast alle mit einer (relativ seltenen, aber sehr wichtigen) Ausnahme zwanglos in das System einfügen. Die häufigsten Formen seien hier kurz aufgelistet – es gibt aber darüber hinaus vereinzelt sehr komplexe Formen von drei oder mehr Glyphen sowie Ligaturen mit den Glyphen o und y.

Ligaturen der e-Klasse

Die folgenden Ligaturen fügen sich durch den ersten Strich zwanglos in die e-Klasse ein und werden im Folgenden auch so behandelt.

Die ch-Ligatur: Dies sind einfach zwei e-Glyphen, die am oberen Ansatzpunkt durch eine deutliche, strikt horizontale Linie verbunden sind.

Die sh-Ligatur: Sie entspricht der ch-Ligatur, enthält jedoch als zusätzliche Verzierung einen Bogen auf oder über der horizontalen Linie. Die Form dieses Bogens ist so variabel, dass immer wieder die Frage aufgeworfen wurde, ob sie nicht Information tragen könnte. Für die Betrachtung der »harmonischen Wortbildung« spielt diese Frage jedoch keine große Rolle.

Gemischte ie-Ligatur

Die ih-Ligatur: Dies ist die einzige Ligatur dieser Klasse und die zuvor benannte wichtige Ausnahme. Sie sieht der ch-Ligatur sehr ähnlich, aber das erste Zeichen ist der einfache Strich der i-Glyphe. Diese Ligatur tritt nur in dieser Reihenfolge auf, es gibt keine ci-Ligatur. Aus den späteren Darlegungen wird deutlich werden, dass eine hypothetische ci-Ligatur im Rahmen der Harmoniegesetze nicht erforderlich ist und daher wohl auch nicht auftritt.

Ligaturen mit eingebetteten Gallows

Die ch- und ih-Ligaturen (und die gelegentlichen ähnlich gebildeten Ligaturen mit o oder y) können ein eingebettetes Zeichen der Gallow-Klasse enthalten, welches die horizontale Linie kreuzt (cfh, cph, ckh, cth, ifh, iph, ikh und ith). Diese Kombination sieht dann so aus, als würde die Gallow-Glyphe auf einer Art von Podest stehen. Das Auftreten dieser Ligaturen ist sehr rätselhaft und einer umfassenden Betrachtung in einem eigenen Text würdig.

Und damit ist auch alles erklärt, was zum Verständnis der Harmoniegesetze erforderlich ist. Wer sich von den ausführlichen Erläuterungen zu den Zeichenklassen etwas »erschlagen« fühlt, sollte noch einmal einen Blick auf meine kleine Grafik werfen – manchmal sagt ein Bild wirklich mehr als tausend Worte. Alles in allem sollten die Kriterien für die Zuordnung einer Glyphe zu einer Klasse und die Bewertung einer Ligatur jetzt so klar sein, dass sie von jedem Leser verstanden und in einer Analyse angewendet werden können. Dabei ist auch für die meisten (aber natürlich nicht für alle) »weirdos« eine eindeutige Zuordnung zu einer dieser Klassen möglich. Für die wichtigsten Weirdos sei dies hier vorweggenommen:

»Weirdos« der i-Klasse: sind j und eventuell auch z, dessen Glyphe durch den strikt horizontalen ersten Strich zwischen den Gallows und der i-Klasse steht und den starken Eindruck eines zu klein geratenen k macht.

»Weirdos« der e-Klasse: sind b und eventuell u, dessen Glyphe allerdings zusammen mit der a-Glyphe eine Klasse bilden müsste, wenn sie häufiger wäre. Der Eindruck der Glyphe ist der einer Ligatur aus e und n.

»Weirdos« ohne mögliche Zuordnung: sind v und x – in beiden Fällen ist der »normale« Aufbau der Glyphen verlassen worden, die Zeichen scheinen aus einem völlig anderem Zusammenhang in dieses Manuskript geraten zu sein.

Die sieben Harmoniegesetze

Jetzt sind endlich alle Definitionen vorhanden, um die sieben Harmoniegesetze für die Glyphenfolge im Voynich-Manuskript zu postulieren. Verglichen mit den Erläuterungen im Vorfelde sind sie sehr einfach und kurz, die Reihenfolge spiegelt die Wichtigkeit der Gesetze (also den Mangel an Ausnahmen) wider.

Erstes Harmoniegesetz: Die e-Folge – Auf eine Glyphe der e-Klasse folgt eine weitere Glyphe der e-Klasse, eine ch-Ligatur, ein Gallow oder eine a-Glyphe.

Zweites Harmoniegesetz: Die i-Folge – Auf eine i-Glyphe folgt eine weitere Glyphe der i-Klasse oder eine Ligatur der ih-Klasse.

Drittes Harmoniegesetz: Der i-Abschluss – Eine Glyhpe der i-Klasse, die keine i- oder l-Glype ist, beendet in der Regel ein »Wort«.

Viertes Harmoniegesetz: Vermeidung »nackter« Abschlüsse – Ein »Wort« endet niemals mit einer »nackten« i- oder e-Glyphe, sondern immer mit einem komplexeren Zeichen aus diesen Glyphenklassen.

Fünftes Harmoniegesetz: Die l-Ausnahme – Die Glyphe l kann als Glyphe der e-Klasse verwendet werden, obwohl sie an sich eine Glype der i-Klasse ist.

Sechstes Harmoniegesetz: Der i-e-Wechsel – Wenn auf eine Glyphe der i-Klasse eine Ligatur der ih-Klasse folgt, wird das »Wort« mit Glyphen der e-Klasse fortgesetzt.

Siebentes Harmoniegesetz: Die e-Gallow Äquivalenz – Ein Gallow ist fast immer von Glyphen der e-Klasse umgeben oder in eine Ligatur der ih-Klasse eingebettet.

Als leicht verständliche Zusammenfassung dieser Harmoniegesetze, ohne komplizierte Formulierung ausgedrückt, können die folgenden Punkte gelten:

  • Auf i folgt i oder e in der Form ih.
  • Auf e folgt e oder i in der Form a.
  • l ist ein »Jokerzeichen«, das sowohl i als auch e sein kann.
  • Die Gallows gelten als e.

Es sind genau diese sehr einfachen und für einen Großteil des Textes angewandten Regeln, die das Schriftbild des Voynich-Manuskriptes so ästhetisch ansprechend wirken lassen. Jeder Verstoß gegen diese Regeln fällt sofort optisch als ein »unpassendes Zeichen« auf. Wer das nicht glauben kann, besorge sich den Zeichensatz »EVA Hand 1″, installiere ihn und lasse einen beliebigen Text mit diesem Zeichensatz darstellen – vom harmonischen Schriftbild des Voynich-Manuskriptes ist das Ergebnis weit entfernt.

Was hat das zu bedeuten?

Natürlich schreit dieses Ergebnis danach, interpretiert zu werden. Es kann sich auf keinen Fall um einen Zufall handeln, dass konsequent Regeln zum Aufrechterhalten eines harmonischen Schriftbildes angewandt wurden. Es ist sehr schwierig, eine Seite im pflanzenkundlichen Teil zu finden, in der mehr als zwei bis drei »Wörter« eine Ausnahme von diesen Regeln bilden. Die häufigste Ausnahme ist übrigens der Wechsel von i nach o und von o nach i — und ich vermute inzwischen regelmäßig einen Transkriptionsfehler oder eine übersehene »Wortgrenze«, wenn ich letzteres in einer Transkription sehe. Manchmal ist der kleine Strich, der a und o voneinander unterscheidet, fast unsichtbar, und manchmal ist die Erkennung des Zwischenraumes zwischen den »Wörtern« sehr schwierig.

Ich hätte diese sehr häufige Ausnahme durch eine achte Harmonieregel abdecken können. Aber es lag mir viel daran, das Paradigma »auf i folgt i, auf e folgt e und der Wechsel geschieht über a und ih« so deutlich wie nur möglich werden zu lassen. Mit einer Ausnahmenhäufigkeit im Bereich der 2 Prozent kann ich bei diesem Postulat gut leben – wird es doch andererseits so stark bestätigt.

Dennoch, eine »harmonische« Regel für das Schriftbild ist verwunderlich.

Der Schreiber des Voynich-Manuskriptes hat bemerkenswert wenig auf Layout geachtet, er hat in der Regel keine Linien für die »Schrift« vorgezeichnet und so ein recht unregelmäßiges Schriftbild in Kauf genommen. Da nimmt es Wunder, dass diese rigiden »Wortbildungsgesetze« für optische Harmonie im Schriftbild sorgen – das passt einfach nicht gut zusammen.

Dies ist eine leichte Bestätigung für den Verdacht, dass es sich beim vorliegenden Manuskript um eine Abschrift handelt. Die Aussicht, dass der Abschreiber vielleicht ein Manuskript kopierte, das er selbst nicht verstand und dabei gewiss Fehler machte, ist für alle Entzifferungsbemühungen ein Albtraum.

Haben wir es mit einem »Text« zu tun?

Wenn jemand am Voynich-Manuskript forscht und dieses große Rätsel lösen will, so geschieht dies unter der Voraussetzung, dass es einen »sinnvollen Klartext« gibt, der wiederhergestellt und gelesen werden will. Ob man annimmt, es handele sich um eine geistreich ersonnene Verschlüsselung oder eine verloren gegangene Schrift einer unbekannten Sprache, spielt in diesen Bemühungen keine Rolle.

Doch würde bei der Notation oder Verschlüsselung eines sprachlichen Textes ein derartiges, auf optische Harmonie optimiertes Schriftbild entstehen? Mir erscheint das etwas fragwürdig.

Ich will damit nicht sagen, dass im Manuskript keine sinnvolle Botschaft enthalten ist. Ich will nur sagen, dass man den Geist für die Möglichkeit offen halten sollte, dass diese Botschaft nicht unbedingt in der Form eines Textes im gewöhnlichen Sinne des Wortes vorliegen muss – also als Folge von phonetischen Zeichen und Wörtern, die eine Sprache abbilden, so etwas, wie jetzt bei Ihnen gerade im Browser sichtbar ist.

Deshalb meine schnelle Hypothese einer sinnvollen Notation, die kein Text ist – und bei der die harmonischen Regeln sogar ein sinnvolles Feature wären: Das Manuskript könnte eine musikalische Notation einer Form von Musik sein, die nach relativ strengen Regeln komponiert wurde. Eine solche »Botschaft« ist vollkommen sinnvoll, und ihre Niederschrift ist (für Musizierende) sehr nützlich. Nur mit dem »Lesen« wird es natürlich nichts, vielleicht sollte man es einmal mit Singen ausprobieren.

Viele rätselhafte Eigenarten würden auf Grund dieser einfachen Idee erklärlich.

  • Die deutlichen Strukturen, welche die Zeile des Manuskriptes als eine »Bedeutungseinheit« kennzeichnen, könnten die Zeile als eine musikalische »Bedeutungseinheit«, etwa eine Phrase erklären.
  • Die starke Neigung des »Textes« zu Wiederholungen und leichten Abänderungen im nächsten »Wort« sind als musikalisches Stilmittel wirklich nicht ungewöhnlich. Ein kurzes Thema wird mehrfach, eventuell mit leichten Abwandlungen oder in einer anderen Tonhöhe wiederholt — ob im Kinderlied oder in einer komplexen Sinfonie.
  • Die besonderen statistischen Eigenschaften der ersten Zeile eines »Absatzes« oder einer Seite könnten Besonderheiten zum Anfang einer musikalischen Komposition oder eines deutlich abgegrenzten Teiles einer solchen widerspiegeln.
  • Die typischen Endungen der »Wörter« entsprechen bestimmten harmonischen musikalischen Wendungen oder bestimmten, für das Ende einer musikalischen Bedeutungseinheit typischen rhythmischen Mustern.
  • Das hohe Maß an Ordnung, welches den »Text« des Manuskriptes prägt, findet sich in jeder »wohlklingenden« Musik. Ebenso findet sich ein gewisses Maß an Überraschung und Unordnung darin – ansonsten wird die Musik als »langweilig« empfunden.
  • Die beiden »Currier-Sprachen« könnten den heutigen Tongeschlechtern Dur und Moll entsprechen – ich weiß allerdings nicht, ob sich diese zum Erstellungszeitpunkt des Manuskriptes bereits aus den mittelalterlichen Kirchentonarten als wichtige Tonleitern herausgebildet hatten.
  • Das Scheitern aller bisherigen Versuche, den »Klartext« des Manuskriptes unter der Annahme einer sprachlichen Information wiederherzustellen, ist völlig verständlich. Es hat seine Ursache in einer falschen Annahme über die Beschaffenheit des Textes.

Auf Grund dieser Annahme kann die »optische Harmonie der Kursive« mit den hier dargelegten Harmonieregeln eine sinnvolle und vernünftige Eigenschaft sein. Es hätte sich jemand ein musikalisches Notationssystem ausgedacht, welches »wohlklingende« musikalische Stilelemente auch »gut aussehen« lässt. In unserer heutigen Notenschrift ist das gar nicht so sehr anders, krasse Dissonanzen wie der Gleichklang des Intervalles der Sekunde wirken in der Notation auffällig und tonartfremde Noten erfordern zusätzliche Zeichen, die in der Regel schon optisch klar machen, dass hier etwas »ungewöhnliches« erklingt.

Abschließendes

Ich erwarte nicht, dass ein einziger Forscher glücklich über diese etwas plumpe, zurzeit noch mit wenig »harten Daten« belegte Erklärung ist. Zu vieles bleibt dabei unerklärt, etwa die Natur der Illustrationen oder die Labels. Ich selbst werde ein wenig in dieser Richtung weiterforschen – aber ich bin selbst ein »ausgelernter Optimist« und glaube nicht an den großen Durchbruch nach einer einzigen guten Idee.

Fraglich bleibt es vor allem, warum es keinen anderen überlieferten Zeugen für ein derartiges Notationssystem geben sollte. Eine schnelle Erklärung wäre, dass auf diese Weise monophone (einstimmige) Musik notiert wurde – die im späten Mittelalter von der polyphonen (mehrstimmigen) Musik immer mehr abgelöst wurde. Das System verschwand, weil es nicht leicht an die neue »musikalische Mode« anzupassen war – und es begann der Siegeszug des heutigen Notensystemes. Diese geht in seinem Kern übrigens auch auf ein mittelalterliches Vorbild, die »Numensysteme« zurück.

Eines aber sollte jedem klar sein: Nach vielen Jahrzehnten der Forschung, mit vereinter Geisteskraft, großen Enthusiasmus und der verfügbaren Rechenleistung der Jetztzeit ist das Voynich-Manuskript immer noch vollkommen »unverstanden«. Dass es sich nicht um einen mittelalterlichen »Fake« handelt, steht für mich unter Berücksichtung der bekannten Fakten und der sehr fremdartigen Struktur des »Textes« außer Frage. Von daher sollte jeder in aller Ruhe prüfen, ob der Fehler nicht in den grundlegenden Annahmen der bisherigen Forschung liegen könnte. Wir alle wollen aus einer Folge von rätselhaften Glyphen jene Stimme aus dem späten Mittelalter hören, die ein so einzigartiges und rätselhaftes Werk geschaffen hat. Und warum sollte diese Stimme nicht singen?

Thema: Ergebnisse, Interpretation | Kommentare (4) | Autor:

Transkriptionen aus der Datenbank holen

Montag, 7. April 2008 1:36

So nützlich es auch ist, die Transkriptionen in einer relationalen Datenbank zu haben, so sehr wünscht man sich doch manchmal, dass diese als gewöhnlicher Text vorliegen. Um ein bequemes Extrahieren von Transkriptionen aus der Datenbank zu ermöglichen, habe ich noch ein kleines Python-Skript geschrieben. Dieses Skript steht hier zum freien Download, und wer sich immer mit diesem Manuskript plagt, der darf es gern benutzen oder für seine speziellen Bedürfnisse anpassen.

Download-Link: Ein Python-Skript zum Extrahieren von Transkriptionen aus der Datenbank

Wer das Skript benutzen will, muss die Zugangsdaten für seine Datenbank im Quelltext angeben. Dieser Teil des Quelltextes dürfte sich auch für jene selbst erklären, die sich mit Python sonst schwer tun. Deshalb habe ich keine andere Methode zur Konfiguration vorgesehen.

Die Verwendung ist relativ einfach. Es handelt sich um ein Skript für die Kommandozeile, mit Optionen kann gesteuert werden, welcher Anteil aus welcher Transkription extrahiert werden soll.

Übersicht über die Optionen

Bei allen Optionen muss die korrekte Groß-/Kleinschreibung beachtet werden.

-h
Ausgabe einer kurzen Hilfe zu den Optionen, die eine gute Gedächtnisstütze sein kann.

-O DATEINAME
Umleitung der Ausgabe in eine Datei. Das können allerdings auch fast alle Betriebssysteme.

-t TRANSCODE
Auswahl der gewünschten Transkription durch den ihr zugeordneten Code, der aus einem Buchstaben besteht. Wenn diese Angabe nicht gemacht wird, wird die Transkription von Takeshi Takahashi verwendet.

-H HANDCODE
Auswahl der Handschrift nach dem Schema von Currier. Definierte Codes sind 1, 2, 3, 4, 5, X und Y. Es können mehrere Codes angegeben werden, etwa 345. Wenn diese Angabe nicht gemacht wird, werden Seiten unabhängig von dieser Information extrahiert.

-l LANGCODE
Auswahl der Currier-Sprache. Definierte Codes sind A und B. Es kann auch AB angegeben werden, um nur jene Bereiche zu extrahieren, denen sich eine Currier-Sprache zuordnen lässt. Wenn diese Angabe nicht gemacht wird, werden Seiten unabhängig von dieser Information extrahiert.

-i ILLUCODE
Auswahl von Seiten nach ihrer Illustration. Definierte Codes sind T für reinen Text, H für Pflanzenkunde, A für astronomische Seiten, Z für den Tierkreis, B für biologische Seiten, C für Kosmologie, P für pharmazeutische Seiten und S für den abschließenden Teil. Auch hier können mehrere Codes angegeben werden. Wenn diese Angabe nicht gemacht wird, werden alle Seiten unabhängig von ihrer Illustration extrahiert.

-r BEREICH
Auswahl von Seiten nach ihrer Seitennummer. Die Bereiche können sehr flexibel angegeben werden, weitere Informationen weiter unten. Wenn diese Angabe nicht gemacht wird, dann wird aus dem gesamten Manuskript extrahiert.

-a ALPHABET
Auswahl eines Transkriptions-Alphabetes für die Ausgabe. Definiert sind EVA, Frogguy, FSG, Currier und Bennett. Wenn diese Angabe nicht gemacht wird, findet EVA Verwendung.

-T
Ausgabe aller definierten Transkriptionscodes mit Angaben zum Umfang der Transkription.

-v
Anzeige der Programmversion.

Zur Angabe von Seitenbereichen

In den Angaben der Seitenbereiche mit -r sind keine Leerzeichen gestattet.

Ein Seitenbereich kann eine Einzelseite sein, etwa f10r. Diese wird direkt angegeben.

Es kann sich um Seiten im Bereich von einer Startseite bis zu einer Endseite handeln. Dann werden die beiden Seiten durch einen Doppelpunkt getrennt. Um die Seiten von f20v bis f22r zu extrahieren, muss der Bereich f20v:f22r angegeben werden.

Es kann sich um Seiten vom Anfang bis zu einer bestimmten Seite handeln. Dann wird der Endseite ein Doppelpunkt vorangestellt. Um die Seiten bis f10r zu erhalten, muss der Bereich :f10r angegeben werden. Von von einer Seite beginned bis zum Ende des Manuskriptes zu extrahieren, wird der Doppelpunkt nachgestellt.

Das f zum Beginn der Seitennummer kann weggelassen werden. Statt f2r:f4r kann auch einfach 2r:4r geschrieben werden. Es ist im Kontext dieser Option immer klar, was gemeint ist, das »f« für »Folio« ist semantisch überflüssig.

Verschiedene Seitenbereiche können mit + kombiniert werden. Wer die Seiten von 1r bis 5v und von 30r bis 45v erhalten möchte, kann die Angabe 1r:5v+30r:45v machen. Überlappungen sind dabei kein Problem, es wird stets der größtmögliche Seitenbereich ausgewählt. Dieser kann durch die weiteren Optionen gefiltert werden.

Beispiele

Zunächst ein ganz einfaches Beispiel. Um die pflanzenkundlichen Seiten in der Currier-Sprache B zu erhalten, wird das folgende Kommando benutzt:

python voynich.py -i H -l B

Dieses Kommando kann etwas abgekürzt werden, indem die Leerzeichen zwischen den Optionen und ihren Parametern weggelassen werden.

python voynich.py -iH -lB

Mit der Angabe eines zusätzlichen Seitenbereiches können etwa nur die Seiten ab f48r erhalten werden.

python voynich.py -iH -lB -r48r:

Installation für die bequeme Anwendung

Wenn man dieses Skript häufiger verwendet, wird man es wohl über seinen normalen Suchpfad für Kommandos zugänglich machen. In Unix-artigen Systemen kann es direkt ausführbar gemacht werden und sollte auf Anhieb laufen, die beim Tippen etwas lästige Dateinamenserweiterung ».py« kann einfach entfernt werden.

Kurzlizenz

Jeder Mensch, der am Voynich-Manuskript forscht, darf mit diesem Skript machen, was er will. Wenn jemand nützliche Erweiterungen programmiert, wäre es nett, wenn diese erweiterte Version ebenso frei zur Verfügung gestellt würde.

Thema: Hacking, Hilfsmittel | Kommentare (0) | Autor: