Wenn es ein moderner Text wäre…

Montag, 29. September 2008 20:29

Wenn das Voynich-Manuskript ein moderner Text wäre, denn würde es gewiss in Form eines PDF-Dokumentes veröffentlicht. Und wenn man versuchte, dieses hypothetische Dokument im Acrobat Reader zu öffnen, denn erhielte man gewiss genau diese Fehlermeldung:

Beim Öffnen dieses Dokumentes ist ein Fehler aufgetreten. Das Dokument kann nicht entschlüsselt werden

Beim Öffnen des Dokments ist ein Fehler aufgetreten. Das Dokument kann nicht entschlüsselt werden.

Aber Pergament ist ja viel geduldiger… 😉

Thema: Diverses | Kommentare (0)

Verteilung unharmonischer Wörter auf Zeilen

Dienstag, 23. September 2008 19:46

Nachdem die Datenbank um eine Tabelle erweitert ist, die eine Zählung von Verstößen gegen die harmonischen Gesetze in den »Wörtern« ermöglicht, liegt es nahe, einmal die Verteilung dieser »Wörter« auf den Seiten des Manuskriptes zu betrachten.

Es erscheint mir unwahrscheinlich, dass bei acht Prozent des »Textes« durch Fehler bei der Transkription oder bei den früheren Restaurationen solche Abweichungen entstanden sein sollten, vielmehr halte ich diese besonders gebildeten »Wörter« für eine Auffälligkeit im Manuskript.

In der ersten derartigen Untersuchung will ich überprüfen, in welcher Weise sich diese Wörter auf den Zeilen einer Seite verteilen. Hierbei ist mir eine Schwäche meiner Datenbank aufgefallen. Sie enthält bislang keine Information darüber, welches die Position der transkribierten Zeile auf der Seite ist. Deshalb habe ich ein kleines Python-Skript geschrieben, das diese Information erstellt, es steht hier zum freien Download: Python-Skript zum Hinzufügen einer Zeilennummer in die Zeilentabelle

Mit dieser Änderung ist eine Analyse nach Zeilen recht einfach geworden, es handelt sich um eine einfache SQL-Abfrage (hier für den pflanzenkundlichen Teil in der Currier-Sprache A aus der Transkription von Takeshi Takahashi angegeben):

SELECT 	lineno AS Line,
	SUM(wordcount) AS Words,
	SUM(harm_failcount) AS Enharm,
	SUM(harm_failcount) / SUM(wordcount) AS Percent
FROM	voy_line
JOIN	voy_lineword ON lword_line = line_id
JOIN	voy_word ON word_id = lword_word
JOIN	voy_harmony ON word_id = harm_word
JOIN	voy_page ON line_page = page_id
WHERE	illustration_type = 'H'
AND	currier_hand = 'A'
AND	line_trans = 'H'
GROUP 	BY lineno

Es ist nicht sehr sinnvoll, diese Analyse über jene Seiten zu machen, bei denen die Transkriptionen eine große Menge Labels enthalten. Diese Labels erscheinen in den Transkriptionen als eigene Zeilen, und die etwas unheitliche Benennung im Lokator einer solchen »Zeile« macht es nicht leicht, solche Zeilen auszuschließen. Diese künstlichen Zeilen sind auf zweierlei Weise besonders; sie sind sehr kurz (oft nur ein »Wort«), und die darin enthaltenen »Wörter« haben eine Häufung von Eigentümlichkeiten, die sie als eine besondere Klasse kennzeichnet. Deshalb habe ich mich auf den pflanzenkundlichen und abschließenden Teil beschränkt, in dem es große Mengen »Fließtext« gibt. Den biologischen Teil habe ich ebenfalls untersucht, aber hier sind alle Ergebnisse wegen der vielen Labels mit ganz besonderer Skepsis zu betrachten.

Die Ergebnisse dieser Untersuchung (durchgeführt an der Transkription von Takeshi Takahashi) stehen wie immer zum freien Download zur Verfügung – allerdings diesmal nur in der Form von Zahlenreihen. Denn es sind eigentlich keine besonderen Ergebnisse, es ist ein kompletter Fehlschlag: Download der Ergebnisse meiner Analyse

Was sich bei dieser einfachen Analyse nämlich zeigt, ist »nur«, dass die nicht den harmonischen Regeln entsprechenden Wörter ohne auffällige Regelmäßigkeit über die Zeilen verteilt sind. Das ist zwar auch eine Erkenntnis, aber nicht unbedingt eine erhellende.

Aber ich bleibe dran…

Thema: Ergebnisse | Kommentare (0)

Ein ganz kurzer Hinweis

Donnerstag, 28. August 2008 3:55

Frisch erwähnt bei grenz|wissenschaft aktuell: Das Wiki voynich-ms.de.

Thema: Kommunikation | Kommentare (0)

Überprüfung der harmonischen Gesetze

Freitag, 22. August 2008 21:58

Es ist eine Sache, nach einem Blick in die Transkriptionen und vor allem auch in die Bilder des Manuskriptes die »harmonischen« Gesetze für die Bildung der Glyphenfolgen in einem »Wort« zu erkennen. Eine solche Einsicht wirkt jedoch um einiges überzeugender, wenn man sie mit ein paar Zahlen belegen kann.

Um mich dieser Aufgabe zu widmen, habe ich ein Python-Skript geschrieben, dass meiner Voynich-Datenbank eine neue Tabelle hinzufügt. Das Skript für die harmonische Analyse der „Wörter“ im Manuskripte stelle ich hier wie üblich zum freien Download.

Nach der Anpassung der Zugangsdaten für die Datenbank und dem Start des Skriptes wird die neue Tabelle voy_harmony in der Datenbank erzeugt. Diese besteht nur aus zwei Spalten, nämlich

  • harm_word INTEGER
    Die ID des Wortes, für das die Verstöße gegen die Harmonieregeln gezählt wurden
  • harm_failcount INTEGER
    Die Anzahl der Verstöße gegen die harmonischen Regeln für dieses Wort

Das Skript zählt alle Verstöße gegen die harmonischen Regeln, außer, wenn sie in einigen Fällen die letzte Glyphe eines Wortes betreffen. Eine solche Zählung findet für jedes Wort statt, dass ausschließlich aus lesbaren Zeichen besteht. Jeder Weirdo wird – mit Ausnahme seines Auftretens an letzter Position im Wort – als Verstoß gegen die harmonischen Regeln gezählt.

Mit Hilfe dieser Tabelle lassen sich natürlich ausführliche Analysen machen. Um mich von der Gültigkeit der harmonischen Regeln für einen Großteil des Manuskriptes zu überzeugen, habe ich einmal eine kleine Zählung über alle Wörter aus allen Transkriptionen gemacht:

SELECT  COUNT(*) AS words,
        SUM(count) AS frequency,
        harm_failcount AS unharmonicals
FROM    voy_word
JOIN    voy_harmony ON word_id = harm_word
GROUP   BY unharmonicals;

Das Ergebnis dieser Zählung ist erstaunlich, zumal in diese Zählung auch alle »Wörter« derjenigen Seiten eingegangen sind, die eine besondere Häufung von Weirdos und ungewöhnlich geformten »Wörtern« zeigen.

+-------+-----------+---------------+
| words | frequency | unharmonicals |
+-------+-----------+---------------+
|  8384 |    111003 |             0 |
|  2329 |      7779 |             1 |
|   704 |      1836 |             2 |
|   116 |       194 |             3 |
|    14 |        15 |             4 |
|     1 |         1 |             5 |
+-------+-----------+---------------+
6 rows in set (0.91 sec)

Wenn man die verschieden geformten »Wörter« betrachtet, ohne ihre Häufigkeit in Rechnung zu stellen, denn sind 27,4 Prozent des gesamten »Wortschatzes« (der gewiss auch viele Fehler der Transkriptoren und der frühen Restauratoren enthält) »unharmonisch« geformt. Bezieht man jedoch die Häufigkeit dieser Wörter in Betracht, so erweisen sich nur 8,1 Prozent der »Wörter« des gesamten »Textes« im Manuskript als »unharmonisch«.

Die »harmonischen« Regeln erzwingen durch ihre starre Struktur eine recht hohe Redundanz des Textes. Die »unharmonischen« Wörter haben also einen höheren Gehalt an Information, sie tragen vielleicht auch eine (oder sogar: die) Bedeutung.

Was als nächster Schritt sehr interessant wäre, das wäre eine Analyse, ob die »unharmonischen« Wörter gehäuft an bestimmten Stellen des Manuskriptes (Position des »Wortes« in der Zeile, Position der Zeile auf der Seite, bestimmte Abschnitte im Manuskripte) auftreten, oder ob sich sich gleichmäßig über den gesamten Text verteilen. Eine solche Analyse werde ich in den nächsten Wochen einmal angehen.

Thema: Ergebnisse, Hilfsmittel | Kommentare (2)

Die hohe Redundanz

Mittwoch, 30. Juli 2008 22:42

Es gibt eine Tatsache, die darauf hindeuten könnte, dass das Voynich-Manuskript eben doch »sinnloses Gestammel« und damit ein »Fake« ist. Diese Tatsache ist die hohe Redundanz des Textes, die weder zu einer menschlichen Sprache noch zu einem Code passen will. (Sie würde sehr wohl zu einer musikalischen Notation passen.)

Dieses hohe Maß an Redundanz – oder anders ausgedrückt: dieses geringe Maß in Information in der Glyphenfolge, diese Neigung zu repetitiven Passagen in den »Wörtern« – muss eine Erklärung finden.  Von allen seltsamen Eigenschaften des Manuskriptes ist es wohl diejenige, die am schwierigsten zu verstehen ist. Das Schreibmaterial ist ja nicht billig gewesen, so dass Sparsamkeit in der belegten Pergamentfläche auch ein wirtschaftlicher Vorteil gewesen wäre; und der zeitliche und psychische Aufwand bei der Anfertigung einer Handschrift würde eher zu einem System von Abkürzungen drängen. Beides würde nahelegen, dass mit einem verhältnismäßig geringem Maß an Redundanz geschrieben wird. In der gebieterischen Wirklichkeit des Manuskriptes ist jedoch das genaue Gegenteil der Fall.

Es ist dies ein Rätsel im Rätsel, das bislang jeder Erklärung trotzt. Dennoch verweist es direkt auf den Kern des Problemes, der Glyphenfolge des Manuskriptes eine Bedeutung zuzuordnen. Beim Mitlesen der englischen Mailingliste – ich nehme daran eher passiv teil und versuche, nur jenes Neue, Bedeutende und Weiterführende dort bekannt zu machen, das sich leider nicht jeden Tag findet – habe ich den Eindruck, dass die Redundanz im Manuskripte von beinahe allen aktiven Forschern ignoriert wird, wenn sie ihre Hypothesen bilden.

Tatsächlich gibt es nur genau drei Möglichkeiten, wie es zu der hohen Redundanz kommen konnte, wenn man nicht von einer »Fälschung« ausgeht:

Der Code (oder die Sprache) ist so redundant – Wenn diese Hypothese zutrifft, muss man sich auf eine verhältnismäßig kurze Gesamtnachricht des Manuskriptes einstellen. Eine Seite des Manuskriptes vermittelt denn vermutlich nur eine einzige Bedeutungseinheit, die den ungefähren Inhalt eines Satzes hat. Die große Weitschweifigkeit wurde bewusst eingesetzt, um einen relativ kurzen oder zu seiner Zeit gesellschaftlich brisanten Inhalt so zu verbergen, dass alle Ansätze des Lesens durch einen Nicht-Eingeweihten scheitern müssen. Und das ist dem Code bis heute gelungen, bis ins Zeitalter der computergestützten Kryptanalyse.

Die Redundanz ist nur eine scheinbare – Wenn man hochauflösende Bilder des Manuskriptes betrachtet, fallen einem schnell gewisse Variationen in bestimmten Glyphen auf. Die bislang üblichen Transkriptionen haben diese Variationen unter einem Code zusammengefasst. Was sich etwa in EVA als sh transkribiert, ist eine durchaus große Fülle von Abweichungen des Bogens über den beiden verbundenen e-Glypen, und auch die e-Glyphen selbst entsprechen nicht immer der Standardform. Die Frage, ob sich eine geringere Redundanz zeigt, wenn solche scheinbaren Kleinigkeiten in Betracht gezogen werden, ist durchaus einer ernsthaften Untersuchung würdig. Allerdings würden die Chancen auf eine Entzifferung sehr sinken, wenn sich die Subtilitäten des Schriftbildes als bedeutungstragend erweisen sollten. Der Erhaltungszustand des Manuskriptes ist doch eher bescheiden, es lassen sich die Spuren von mindestens zwei Restaurationen erkennen, von denen mindestens eine offenbar ohne Kenntnis des Schriftsystemes beim Restaurator durchgeführt wurde. Dabei wäre dann gewiss auch Information verloren gegangen. Das Scheitern der heutigen Leseversuche spiegelt den Informationsverlust in der Vergangenheit wider, und ohne großen Aufwand in der physikalischen Untersuchung des Manuskriptes werden die verlorenen Informationen wohl nicht mehr ans Licht kommen.

Es handelt sich nicht um eine Notation gewöhnlicher Sprache – Eine musikalische Notation (immer noch eine meiner Lieblingshypothesen, für deren Beleg ich bislang viel zu wenig getan habe) könnte durchaus eine hohe Redundanz aufweisen. Sie würde auch die leicht beobachtbaren Harmonieregeln bei der Bildung der »Wörter« ein wenig erklären, ebenso wie auch das Scheitern des bisherigen Ansätze zur Entzifferung verständlich würde. Unerklärt blieben hierbei allerdings die Bedeutung der »Labels« zu Illustrationen im Manuskripte und der Bezug der Illustrationen zu einem dann bestehenden musikalischen Kontext.

Tatsächlich denke ich jedes Mal, wenn ich etwas mit hoher Redundanz sehe, sofort an das Voynich-Manuskript. Allerdings gibt es »Mitteilungen« vergleichbarer Redundanz beinahe nur in gewissen Formen der Spam; dort wird des Öfteren mit Hilfe von Software so genannte »Spamprosa« aus anderen Texten im Internet erzeugt, um die Filterung der Inhalte durch Spamfilter auszutricksen. So viel dürfte allerdings gesichert sein: Weder hatte der Autor des Manuskriptes einen Computer zur Verfügung, noch hatte er die Absicht, Spam hinter Pseudomitteilungen zu verstecken.

Thema: Kommunikation, Spekulation | Kommentare (0)

Die Harmonie der Glyphenfolgen

Samstag, 5. Juli 2008 0:21

Dieser Text ist »etwas« älter, ich hatte ihn am 15. Februar 2005 auf einer inzwischen nicht mehr verfügbaren Homepage veröffentlicht. Die geäußerten Gedanken erscheinen mir aber immer noch als wertvoll und wichtig, deshalb diese erneute Veröffentlichung.

Unabhängig von den Feinstrukturen der »Wörter« im Voynich-Manuskript lassen sich harmonische Regeln für die Folge der Glyphen in einem »Wort« feststellen. Diese Regeln sind verhältnismäßig einfach, wurden aber vom Autor im gesamten Manuskript angewandt. Beim Betrachten dieser Regeln kommen Zweifel daran auf, dass es sich beim Voynich-Manuskript um niedergeschriebene Sprache im gewöhnlichen Sinn des Wortes handeln kann.

Die Glyphenklassen im Voynich-ManuskriptIch werde mich für die folgenden Darlegungen des Transkriptions-Systemes EVA bedienen, die »Wörter«, Glyphen und Glyphfolgen werden zur leichteren Erkennung in fetter Schrift gesetzt. Für Wortzählungen habe ich die vollständige Transkription von Takeshi Takahashi verwendet.

Jemand, der sich längere Zeit mit dem Voynich-Manuskript beschäftigt, bekommt eine gewisse Intuition dafür, dass die Reihenfolge der Glyphen in einem Wort sehr festen Regeln folgt. Es kann nicht jede Glyphe an jeder Position stehen – bestimmte Glyphfolgen wirken auf der Stelle »falsch«.

Zunächst fällt ein erkennbares System von Präfixen und Suffixen auf. Das typische »Wort« im Manuskript beginnt mit q-, qo- oder o- und endet mit Glyphenfolgen aus einer recht großen Auswahl, in welcher die Gruppen -in, -ir, -il, -es und -dy besonders auffällig hervorstechen. Diese offensichtlichen Strukturmerkmale führten des öfteren zur Annahme, dass es sich hierbei um durchschimmernde Spuren einer Grammatik mit Flexionsystem handeln müsse – allerdings hat diese Annahme noch nicht bei der Identifikation der Sprache geholfen.

Ich möchte diesen vielbetrachteten Aspekt einmal außer Acht lassen und auf die zeichnerische Harmonie der Glyphfolgen eingehen.

Nach einigen Monaten des ernsthaften Forschens wird jedem Menschen intuitiv klar, dass es sich bei der Glyphenfolge qoteody um ein mögliches »Wort« handelt. Dieses »Wort« erscheint dann auch zwölf Mal im Manuskript – es ist damit eines der nicht besonders häufigen Worte, so dass diese »Klarheit« nicht (wie etwa beim sehr häufigen qoteedy) aus der Erinnerung kommen kann. Ebenso ist intuitiv klar, dass die Glyphenfolge qoteidy, die ja transkribiert auf dem ersten Blick sehr ähnlich aussieht, ein sehr ungewöhnliches »Wort« wäre. Und tatsächlich, dieses »Wort« kommt im Manuskript nicht vor.

Aber was unterscheidet diese Glyphenfolgen? Welches Bildungsgesetz für die »Wörter« nimmt man hier intuitiv auf, so dass man oft recht zielsicher entscheiden kann, ob ein bestimmtes »Wort« möglich ist oder nicht?

Die Beantwortung dieser Frage führt auf ein Harmoniegesetz für die aufeinanderfolgenden Glyphen, welches auch das beobachtete Suffixsystem auf natürliche Weise hervorbringt. Doch um dieses zu erkennen, muss man sich von den Transkriptionen abwenden und dem Schriftbild des Manuskriptes zuwenden. Zur besseren Erläuterung habe ich eine Grafik mit den hier postulierten Glyphenklassen und ein paar Beispielen in diese Seite eingefügt und die Glyphen der EVA-Transkription gegenübergestellt.

Die grundlegenden Glyphenklassen

Wenn man die Glyphen in den Bildern des Manuskriptes sorgfältig untersucht, stellt man schnell fest, dass der Glyphenvorrat relativ einfach aufgebaut ist. Es lassen sich drei Klassen von Glyphen an Hand ihres ersten Striches unterscheiden, dem zur Differenzierung in die speziellen Glyphen verschiedenste Dekorationen hinzugefügt werden können. Diese Reihenfolge beim Zeichnen der Glyphen lässt sich an vielen Stellen des Manuskriptes bestätigen, da durch das Absetzen der Feder Lücken in der Glyphe entstehen und häufig nach dem Absetzen die Feder in die Tinte getaucht wurde, so dass der folgende Strich dunkler erscheint.

Neben diesen drei Klassen gibt es noch zwei wichtige Ausnahmezeichen – leider kümmert sich die Wirklichkeit nicht immer um das analytische Streben nach Vereinfachung. Schon jetzt sei gesagt, dass eine dieser Ausnahmen für die »Wortbildung« im Rahmen der beobachteten Harmoniegesetze von Bedeutung ist.

Die nur an vereinzelten Stellen auftretenden »weirdos« werden hier nicht behandelt, fügen sich jedoch manchmal gut in das System ein. Manchmal allerdings auch nicht.

Die i-Klasse: Der erste Strich aller Glyphen dieser Klasse ist ein kurzer Abwärtsstrich, der um etwa 30 Grad gegen die Vertikale nach links geneigt ist. Beim EVA-Zeichen i wird die Glyphe nur von diesem Strich gebildet, darüber hinaus gibt es die wichtigen Glyphen n, r, l und m, die mit diesem Strich beginnen und ihm eine Verzierung hinzufügen.

Die e-Klasse: Der erste Strich dieser Klasse ist ein ungefähr halbkreisförmiger Bogen, dessen Anfang ähnlich geneigt ist wie der Abwärtsstrich der i-Klasse. Bei den EVA-Zeichen e, c und h wird die Glyphe nur von diesem Stich gebildet, darüber hinaus gibt es in dieser Klasse die wichtigen Glyphen o, d, s, y und die wegen ihrer Seltenheit als »weirdos« zu betrachtenden g und b.

Die Gallows: Der erste Strich dieser Klasse ist ein deutlich über der Scheiblinie angesetzter, strikt vertikaler Abwärtsstrich, dem immer eine weitere Dekoration hinzugefügt wird. Der Strich tritt also niemals allein als Glyphe auf. In diese Klasse gehören die EVA-Zeichen k, t, f und p, ferner sind einige der »weirdos« auf diese Art gebildet.

Die Ausnahmeglyphen

Wie schon erwähnt, gibt es genau zwei Glyphen, die aus diesem einfachen Schema der drei Klassen herausfallen. Beide scheinen wichtige Funktionen im Manuskript zu erfüllen, und eine dieser Ausnahmen (das a) ist entscheidend für die Aufrechterhaltung des später beschriebenen Harmoniegesetzes.

Die q-Glyphe: Diese Glyphe tritt nur am Anfang eines »Wortes« auf. Sie besteht aus einem strikt vertikalen Abwärtsstrich, der aber im Gegensatz zu den Glyphen der Gallow-Klasse auf Höhe der Schreiblinie angesetzt wird und diese Linie nach unten hin deutlich durchbricht. Am oberen Ende dieses Striches wird eine nach links gewandte gerade Linie im Winkel von ungefähr 45 Grad angesetzt, diese wird bis zur Mitte des Schreiblinienbereiches fortgesetzt und dort horizontal, aber leicht nach oben weisend abgeknickt. Die sehr häufig folgende Glyphe o wird mit diesem Horizontalstrich verbunden, so dass in diesem Fall der Eindruck einer Ligatur entsteht.

Die a-Glyphe: Diese Glyphe entsteht aus der Kombination (oder Ligatur) des Bogens der e-Klasse mit dem Abwärtsstrich der i-Klasse. Ihre besondere Bedeutung für die Harmoniegesetze wird an späterer Stelle klar werden.

Die Ligaturen

Es gibt einige sehr bemerkenswerte Glyphenfolgen, die einen starken Eindruck von Ligaturen erwecken und deshalb an dieser Stelle (mit allen Vorbehalten wegen des unbekannten Schriftsystemes) auch so genannt werden, die sich aber fast alle mit einer (relativ seltenen, aber sehr wichtigen) Ausnahme zwanglos in das System einfügen. Die häufigsten Formen seien hier kurz aufgelistet – es gibt aber darüber hinaus vereinzelt sehr komplexe Formen von drei oder mehr Glyphen sowie Ligaturen mit den Glyphen o und y.

Ligaturen der e-Klasse

Die folgenden Ligaturen fügen sich durch den ersten Strich zwanglos in die e-Klasse ein und werden im Folgenden auch so behandelt.

Die ch-Ligatur: Dies sind einfach zwei e-Glyphen, die am oberen Ansatzpunkt durch eine deutliche, strikt horizontale Linie verbunden sind.

Die sh-Ligatur: Sie entspricht der ch-Ligatur, enthält jedoch als zusätzliche Verzierung einen Bogen auf oder über der horizontalen Linie. Die Form dieses Bogens ist so variabel, dass immer wieder die Frage aufgeworfen wurde, ob sie nicht Information tragen könnte. Für die Betrachtung der »harmonischen Wortbildung« spielt diese Frage jedoch keine große Rolle.

Gemischte ie-Ligatur

Die ih-Ligatur: Dies ist die einzige Ligatur dieser Klasse und die zuvor benannte wichtige Ausnahme. Sie sieht der ch-Ligatur sehr ähnlich, aber das erste Zeichen ist der einfache Strich der i-Glyphe. Diese Ligatur tritt nur in dieser Reihenfolge auf, es gibt keine ci-Ligatur. Aus den späteren Darlegungen wird deutlich werden, dass eine hypothetische ci-Ligatur im Rahmen der Harmoniegesetze nicht erforderlich ist und daher wohl auch nicht auftritt.

Ligaturen mit eingebetteten Gallows

Die ch- und ih-Ligaturen (und die gelegentlichen ähnlich gebildeten Ligaturen mit o oder y) können ein eingebettetes Zeichen der Gallow-Klasse enthalten, welches die horizontale Linie kreuzt (cfh, cph, ckh, cth, ifh, iph, ikh und ith). Diese Kombination sieht dann so aus, als würde die Gallow-Glyphe auf einer Art von Podest stehen. Das Auftreten dieser Ligaturen ist sehr rätselhaft und einer umfassenden Betrachtung in einem eigenen Text würdig.

Und damit ist auch alles erklärt, was zum Verständnis der Harmoniegesetze erforderlich ist. Wer sich von den ausführlichen Erläuterungen zu den Zeichenklassen etwas »erschlagen« fühlt, sollte noch einmal einen Blick auf meine kleine Grafik werfen – manchmal sagt ein Bild wirklich mehr als tausend Worte. Alles in allem sollten die Kriterien für die Zuordnung einer Glyphe zu einer Klasse und die Bewertung einer Ligatur jetzt so klar sein, dass sie von jedem Leser verstanden und in einer Analyse angewendet werden können. Dabei ist auch für die meisten (aber natürlich nicht für alle) »weirdos« eine eindeutige Zuordnung zu einer dieser Klassen möglich. Für die wichtigsten Weirdos sei dies hier vorweggenommen:

»Weirdos« der i-Klasse: sind j und eventuell auch z, dessen Glyphe durch den strikt horizontalen ersten Strich zwischen den Gallows und der i-Klasse steht und den starken Eindruck eines zu klein geratenen k macht.

»Weirdos« der e-Klasse: sind b und eventuell u, dessen Glyphe allerdings zusammen mit der a-Glyphe eine Klasse bilden müsste, wenn sie häufiger wäre. Der Eindruck der Glyphe ist der einer Ligatur aus e und n.

»Weirdos« ohne mögliche Zuordnung: sind v und x – in beiden Fällen ist der »normale« Aufbau der Glyphen verlassen worden, die Zeichen scheinen aus einem völlig anderem Zusammenhang in dieses Manuskript geraten zu sein.

Die sieben Harmoniegesetze

Jetzt sind endlich alle Definitionen vorhanden, um die sieben Harmoniegesetze für die Glyphenfolge im Voynich-Manuskript zu postulieren. Verglichen mit den Erläuterungen im Vorfelde sind sie sehr einfach und kurz, die Reihenfolge spiegelt die Wichtigkeit der Gesetze (also den Mangel an Ausnahmen) wider.

Erstes Harmoniegesetz: Die e-Folge – Auf eine Glyphe der e-Klasse folgt eine weitere Glyphe der e-Klasse, eine ch-Ligatur, ein Gallow oder eine a-Glyphe.

Zweites Harmoniegesetz: Die i-Folge – Auf eine i-Glyphe folgt eine weitere Glyphe der i-Klasse oder eine Ligatur der ih-Klasse.

Drittes Harmoniegesetz: Der i-Abschluss – Eine Glyhpe der i-Klasse, die keine i- oder l-Glype ist, beendet in der Regel ein »Wort«.

Viertes Harmoniegesetz: Vermeidung »nackter« Abschlüsse – Ein »Wort« endet niemals mit einer »nackten« i- oder e-Glyphe, sondern immer mit einem komplexeren Zeichen aus diesen Glyphenklassen.

Fünftes Harmoniegesetz: Die l-Ausnahme – Die Glyphe l kann als Glyphe der e-Klasse verwendet werden, obwohl sie an sich eine Glype der i-Klasse ist.

Sechstes Harmoniegesetz: Der i-e-Wechsel – Wenn auf eine Glyphe der i-Klasse eine Ligatur der ih-Klasse folgt, wird das »Wort« mit Glyphen der e-Klasse fortgesetzt.

Siebentes Harmoniegesetz: Die e-Gallow Äquivalenz – Ein Gallow ist fast immer von Glyphen der e-Klasse umgeben oder in eine Ligatur der ih-Klasse eingebettet.

Als leicht verständliche Zusammenfassung dieser Harmoniegesetze, ohne komplizierte Formulierung ausgedrückt, können die folgenden Punkte gelten:

  • Auf i folgt i oder e in der Form ih.
  • Auf e folgt e oder i in der Form a.
  • l ist ein »Jokerzeichen«, das sowohl i als auch e sein kann.
  • Die Gallows gelten als e.

Es sind genau diese sehr einfachen und für einen Großteil des Textes angewandten Regeln, die das Schriftbild des Voynich-Manuskriptes so ästhetisch ansprechend wirken lassen. Jeder Verstoß gegen diese Regeln fällt sofort optisch als ein »unpassendes Zeichen« auf. Wer das nicht glauben kann, besorge sich den Zeichensatz »EVA Hand 1″, installiere ihn und lasse einen beliebigen Text mit diesem Zeichensatz darstellen – vom harmonischen Schriftbild des Voynich-Manuskriptes ist das Ergebnis weit entfernt.

Was hat das zu bedeuten?

Natürlich schreit dieses Ergebnis danach, interpretiert zu werden. Es kann sich auf keinen Fall um einen Zufall handeln, dass konsequent Regeln zum Aufrechterhalten eines harmonischen Schriftbildes angewandt wurden. Es ist sehr schwierig, eine Seite im pflanzenkundlichen Teil zu finden, in der mehr als zwei bis drei »Wörter« eine Ausnahme von diesen Regeln bilden. Die häufigste Ausnahme ist übrigens der Wechsel von i nach o und von o nach i — und ich vermute inzwischen regelmäßig einen Transkriptionsfehler oder eine übersehene »Wortgrenze«, wenn ich letzteres in einer Transkription sehe. Manchmal ist der kleine Strich, der a und o voneinander unterscheidet, fast unsichtbar, und manchmal ist die Erkennung des Zwischenraumes zwischen den »Wörtern« sehr schwierig.

Ich hätte diese sehr häufige Ausnahme durch eine achte Harmonieregel abdecken können. Aber es lag mir viel daran, das Paradigma »auf i folgt i, auf e folgt e und der Wechsel geschieht über a und ih« so deutlich wie nur möglich werden zu lassen. Mit einer Ausnahmenhäufigkeit im Bereich der 2 Prozent kann ich bei diesem Postulat gut leben – wird es doch andererseits so stark bestätigt.

Dennoch, eine »harmonische« Regel für das Schriftbild ist verwunderlich.

Der Schreiber des Voynich-Manuskriptes hat bemerkenswert wenig auf Layout geachtet, er hat in der Regel keine Linien für die »Schrift« vorgezeichnet und so ein recht unregelmäßiges Schriftbild in Kauf genommen. Da nimmt es Wunder, dass diese rigiden »Wortbildungsgesetze« für optische Harmonie im Schriftbild sorgen – das passt einfach nicht gut zusammen.

Dies ist eine leichte Bestätigung für den Verdacht, dass es sich beim vorliegenden Manuskript um eine Abschrift handelt. Die Aussicht, dass der Abschreiber vielleicht ein Manuskript kopierte, das er selbst nicht verstand und dabei gewiss Fehler machte, ist für alle Entzifferungsbemühungen ein Albtraum.

Haben wir es mit einem »Text« zu tun?

Wenn jemand am Voynich-Manuskript forscht und dieses große Rätsel lösen will, so geschieht dies unter der Voraussetzung, dass es einen »sinnvollen Klartext« gibt, der wiederhergestellt und gelesen werden will. Ob man annimmt, es handele sich um eine geistreich ersonnene Verschlüsselung oder eine verloren gegangene Schrift einer unbekannten Sprache, spielt in diesen Bemühungen keine Rolle.

Doch würde bei der Notation oder Verschlüsselung eines sprachlichen Textes ein derartiges, auf optische Harmonie optimiertes Schriftbild entstehen? Mir erscheint das etwas fragwürdig.

Ich will damit nicht sagen, dass im Manuskript keine sinnvolle Botschaft enthalten ist. Ich will nur sagen, dass man den Geist für die Möglichkeit offen halten sollte, dass diese Botschaft nicht unbedingt in der Form eines Textes im gewöhnlichen Sinne des Wortes vorliegen muss – also als Folge von phonetischen Zeichen und Wörtern, die eine Sprache abbilden, so etwas, wie jetzt bei Ihnen gerade im Browser sichtbar ist.

Deshalb meine schnelle Hypothese einer sinnvollen Notation, die kein Text ist – und bei der die harmonischen Regeln sogar ein sinnvolles Feature wären: Das Manuskript könnte eine musikalische Notation einer Form von Musik sein, die nach relativ strengen Regeln komponiert wurde. Eine solche »Botschaft« ist vollkommen sinnvoll, und ihre Niederschrift ist (für Musizierende) sehr nützlich. Nur mit dem »Lesen« wird es natürlich nichts, vielleicht sollte man es einmal mit Singen ausprobieren.

Viele rätselhafte Eigenarten würden auf Grund dieser einfachen Idee erklärlich.

  • Die deutlichen Strukturen, welche die Zeile des Manuskriptes als eine »Bedeutungseinheit« kennzeichnen, könnten die Zeile als eine musikalische »Bedeutungseinheit«, etwa eine Phrase erklären.
  • Die starke Neigung des »Textes« zu Wiederholungen und leichten Abänderungen im nächsten »Wort« sind als musikalisches Stilmittel wirklich nicht ungewöhnlich. Ein kurzes Thema wird mehrfach, eventuell mit leichten Abwandlungen oder in einer anderen Tonhöhe wiederholt — ob im Kinderlied oder in einer komplexen Sinfonie.
  • Die besonderen statistischen Eigenschaften der ersten Zeile eines »Absatzes« oder einer Seite könnten Besonderheiten zum Anfang einer musikalischen Komposition oder eines deutlich abgegrenzten Teiles einer solchen widerspiegeln.
  • Die typischen Endungen der »Wörter« entsprechen bestimmten harmonischen musikalischen Wendungen oder bestimmten, für das Ende einer musikalischen Bedeutungseinheit typischen rhythmischen Mustern.
  • Das hohe Maß an Ordnung, welches den »Text« des Manuskriptes prägt, findet sich in jeder »wohlklingenden« Musik. Ebenso findet sich ein gewisses Maß an Überraschung und Unordnung darin – ansonsten wird die Musik als »langweilig« empfunden.
  • Die beiden »Currier-Sprachen« könnten den heutigen Tongeschlechtern Dur und Moll entsprechen – ich weiß allerdings nicht, ob sich diese zum Erstellungszeitpunkt des Manuskriptes bereits aus den mittelalterlichen Kirchentonarten als wichtige Tonleitern herausgebildet hatten.
  • Das Scheitern aller bisherigen Versuche, den »Klartext« des Manuskriptes unter der Annahme einer sprachlichen Information wiederherzustellen, ist völlig verständlich. Es hat seine Ursache in einer falschen Annahme über die Beschaffenheit des Textes.

Auf Grund dieser Annahme kann die »optische Harmonie der Kursive« mit den hier dargelegten Harmonieregeln eine sinnvolle und vernünftige Eigenschaft sein. Es hätte sich jemand ein musikalisches Notationssystem ausgedacht, welches »wohlklingende« musikalische Stilelemente auch »gut aussehen« lässt. In unserer heutigen Notenschrift ist das gar nicht so sehr anders, krasse Dissonanzen wie der Gleichklang des Intervalles der Sekunde wirken in der Notation auffällig und tonartfremde Noten erfordern zusätzliche Zeichen, die in der Regel schon optisch klar machen, dass hier etwas »ungewöhnliches« erklingt.

Abschließendes

Ich erwarte nicht, dass ein einziger Forscher glücklich über diese etwas plumpe, zurzeit noch mit wenig »harten Daten« belegte Erklärung ist. Zu vieles bleibt dabei unerklärt, etwa die Natur der Illustrationen oder die Labels. Ich selbst werde ein wenig in dieser Richtung weiterforschen – aber ich bin selbst ein »ausgelernter Optimist« und glaube nicht an den großen Durchbruch nach einer einzigen guten Idee.

Fraglich bleibt es vor allem, warum es keinen anderen überlieferten Zeugen für ein derartiges Notationssystem geben sollte. Eine schnelle Erklärung wäre, dass auf diese Weise monophone (einstimmige) Musik notiert wurde – die im späten Mittelalter von der polyphonen (mehrstimmigen) Musik immer mehr abgelöst wurde. Das System verschwand, weil es nicht leicht an die neue »musikalische Mode« anzupassen war – und es begann der Siegeszug des heutigen Notensystemes. Diese geht in seinem Kern übrigens auch auf ein mittelalterliches Vorbild, die »Numensysteme« zurück.

Eines aber sollte jedem klar sein: Nach vielen Jahrzehnten der Forschung, mit vereinter Geisteskraft, großen Enthusiasmus und der verfügbaren Rechenleistung der Jetztzeit ist das Voynich-Manuskript immer noch vollkommen »unverstanden«. Dass es sich nicht um einen mittelalterlichen »Fake« handelt, steht für mich unter Berücksichtung der bekannten Fakten und der sehr fremdartigen Struktur des »Textes« außer Frage. Von daher sollte jeder in aller Ruhe prüfen, ob der Fehler nicht in den grundlegenden Annahmen der bisherigen Forschung liegen könnte. Wir alle wollen aus einer Folge von rätselhaften Glyphen jene Stimme aus dem späten Mittelalter hören, die ein so einzigartiges und rätselhaftes Werk geschaffen hat. Und warum sollte diese Stimme nicht singen?

Thema: Ergebnisse, Interpretation | Kommentare (4)

Das Voynich-Manuskript im »Skeptiker«

Samstag, 31. Mai 2008 17:06

Das kritische Magazin »Skeptiker – Zeitschrift für Wissenschaft und kritisches Denken« wird sich in seiner in einigen Wochen erscheinenden Ausgabe auch des Voynich-Manuskriptes annehmen. Natürlich ist mir noch nicht der Inhalt des Artikels bekannt, aber es ist so gut wie sicher, dass »esoterischen« Spekulationen mit zersetzender Kritik begegnet werden wird. Wer sich an einer strikt materialistischen Kritik an bestimmten Aspekten der Untersuchung des Manuskriptes nicht stört, wird in diesem Artikel gewiss eine anregende Lektüre haben.

Thema: Medien | Kommentare (0)

f3v: Traumgewächse

Montag, 19. Mai 2008 14:34

Mehr zur Seite f3vMan muss gar nicht so lange in das Manuskript schauen, um zu der Überzeugung zu kommen, dass die darin dargestellten »Pflanzen« wirklich surreal sind und eher einer Traumwelt entspringen. Schon die sechste Seite macht auf dem ersten Blick klar, dass es zumindest einige »Pflanzen« des Manuskriptes gar nicht in der Realität geben kann. Der Versuch, durch eine Identifikation der »Pflanzen« einen Ansatzpunkt für eine Entschlüsselung des Textes zu bekommen, ist zum Scheitern verurteilt.

Das heißt allerdings nicht, dass ich es nicht auch versucht hätte. Eine Zeitlang habe ich mir gesagt, dass diese Pflanzen vermutlich stark stilisiert gezeichnet wurden und deshalb nicht ganz so leicht zu identifizieren sind, dass es aber dennoch möglich sein könnte. Immerhin verspricht die Analyse der dargestellten botanischen Erscheinungen auch einen Weg, den Ort zu finden, an dem dieses Buch geschrieben wurde – und gibt damit eventuell einen wichtigen Fingerzeig auf die darin verwendete Sprache. Leider ist dieser Weg nicht gangbar, weil diese »Pflanzen« nirgends auf der Erde wachsen.

Das wird auf Seite f3v recht deutlich.

Ein Blatt der Pflanze auf Seite f3vSchon die Form der Blätter ist auffällig. Sie ist so auffällig, dass eine ähnliche Pflanze in der botanischen Wirklichkeit sofort identifiziert werden sollte.

Was einem auf dieser Seite als Blatt einer »Pflanze« entgegentritt, erinnert eher an die Karikatur eines Frosches als an ein Organ zur Photosynthese. Da scheinen zwei Beine zu sein, zwei Arme, ein Körper und ein seltsam deformierter Kopf. Selbst bei einer abstrakten Stilisierung einer Pflanze in einem Buch würde doch die Form der wesentlichen Gestaltmerkmale erhalten bleiben.

Aber nicht nur die Blätter sorgen für Zweifel an der botanischen Realität der Pflanze, auch die Wurzel macht einen unwirklichen Eindruck.

Die Wurzel der Pflanze von f3v

Diese Wurzel erweckt den Eindruck mehrerer aufeinandergesteckter Wurzelteile. Am oberen Ende eines solchen Teiles scheint jeweils eine »Plattform« zu sein, aus der die nächste Wurzel entsprießt.

Die Blüte der Pflanze von Seite f3vVöllig sicher scheint jedoch der surreale Charakter der Pflanzen zu sein, wenn man sich einige Blüten anschaut.

Diese Blüte erweckt nicht den Anschein eines pflanzlichen Organes zur Fortpflanzung. Es scheint sich um einen großen, fleischigen Körper zu handeln, der an einem Ende wie aufgeschnitten wirkt. In diesem Ende befinden sich einige nicht besonders deutlich gezeichnete Elemente, die nicht an Fruchtknoten oder Staubgefäße erinnern, sondern eher an unscheinbare Blüten in einer Scheinblüte. Umrahmt wird dieses Angebot an bestäubende Insekten von einem Kranz farbloser Kronblätter, die im Rahmen einer Scheinblüte wenig Signalwirkung entfalten könnten. Es ist eine biologisch sinnlose Blüte.

Auch wenn eine geographische Lokalisierung an Hand solcher »Pflanzen« zum Scheitern verurteilt ist, bleibt der eingangs geäußerte Gedanke vollgültig. Es ist immer noch möglich, an Hand dieser Gewächse einen Ort zu finden, an welchem dieses Manuskript wahrscheinlich entstanden ist. Das Wort »wahrscheinlich« meint hier allerdings nur, dass dieser Schluss wahr zu sein scheint, es ist keine sichere Aussage. Alle diese (oder doch sehr viele dieser) Pfanzen wachsen in der Fantasie eines menschlichen Geistes und nirgendwo auf der Erde. Es sind Traumgewächse.

Das könnte durchaus auch ein Hinweis darauf sein, dass die geschriebenen Teile des Manuskriptes den gleichen Ursprung haben, Trauminhalte sein könnten, die in einer Traumsprache verfasst sind. Jeder Versuch, einen gewöhnlichen sprachlichen Text in diesem Buch zu finden, wäre dann zum Scheitern verurteilt. Die reflektierten Leistungen des wachen Bewusstseins unterscheiden sich nun einmal deutlich von den unbewussten Leistungen des Traumes, der zwar ein vollwertiger, aber doch im Wesentlichen regressiver und ältere Schichten der Psyche offen legender psychischer Akt ist. Natürlich ist dieser Akt dennoch kein strukturloses Rauschen, und er könnte durchaus die im Voynich-Manuskript beobachteten Strukturen hervorbringen. (Über die Strukturen muss ich demnächst einmal einen längeren Text verfassen.)

Das kollektive Scheitern aller wissenschaftlichen Kryptografie der Neuzeit mit ihrer computergestützen Analyse könnte durchaus als ein weiteres Indiz für diese Hypothese aufgefasst werden. Natürlich bedeutet das nicht, dass das Manuskript nicht doch einem Verständnis zugänglich wäre, es ist nur eher etwas für mutige Psychologen als für »harte« Wissenschaftler. Allerdings habe ich noch keine Idee, wie in dieser Richtung geforscht werden könnte und welchen Beitrag ich dazu leisten könnte. Selbst in einer solchen Forschung wären mir »harte« Daten und reproduzierbare Ergebnisse wichtig.

Und denn gibt es natürlich noch einen psychischen Akt, der dem des Träumens mehr als nur oberflächlich verwandt ist: Das Schaffen von Kunst. Es ist durchaus möglich, dass das Voynich-Manuskript »nur« ein zugegebenermaßen recht ungewöhnliches Kunstwerk ist, das keine Nachricht im Sinn einer Sprache transportieren soll. Auch dann würden alle Ansätze scheitern, einen »Sinn« in diesem »Text« zu finden.

Thema: Kunst, Seiten, Spekulation | Kommentare (0)

Geheimnis oder Geschwafel?

Freitag, 18. April 2008 6:33

Die von mir sehr geschätzte Gesellschaft zur wissenschaftlichen Untersuchung der Parawissenschaften befasst sich in ihrem Blog mit einem geplanten Vortrag zum Voynich-Manuskript. Auf der kommenden GWUP-Konferenz wird der Informatiker Klaus Schmeh verschiedene Theorien beleuchten und beabsichtigt dabei auch, etwas Licht in das Dunkel zu bringen.

Nun gut, das beabsichtige ich ja auch. Allerdings halte ich es nicht für die wahrscheinlichste Lösung, dass es sich beim Inhalt dieses Buches um bedeutungslosen Unfug handelt, sondern ich will dieses Buch eines Tages lesen. Aber zumindest das eine habe ich mit Herr Schmeh gemeinsam: »Völlig sicher bin ich mir da aber nicht«. 😉

In einer anderen Sache hingegen bin ich mir sehr sicher. Im Gegensatz zu Herrn Schmeh halte ich die Untersuchungen von Gordon Rugg nicht für schlüssig. (Aber durchaus für interessant und ausbaufähig.) Bei aller optischer Ähnlichkeit der von Rugg erzeugten »Texte« ist es Rugg in seinem vorgelegten Textmaterial nicht gelungen, die recht deutlichen Verteilungen der Wortlängen innerhalb der Zeilen und die in für tiefere Zeilen abnehmenden Gallow-Häufigkeiten innerhalb der Seiten zu reproduzieren. Diese Strukturen erwecken im richtigen Manuskript den starken Eindruck, dass es sich sowohl bei den Zeilen als auch bei den Seiten um Informationeinheiten handele.

Auch gelingt es Ruggs »Pseudo-Voynichianisch« nicht, die besonders auffällige Anhäufung von Glyphen wie m in den letzten Wörtern der Zeilen zu reproduzieren. Vielmehr wirken die Glyphen über die Zeile gleichmäßig verteilt, was im deutlichen Kontrast zum Text des Manuskriptes steht.

Leider hat Gordon Rugg zwar nach eigener Publikation ein Computerprogramm für seine Methode erstellt, es aber weder für nötig erachtet, mit Hilfe dieses Programmes eine ausreichend große Menge Nonsens-Text (sagen wir einmal: um dreißig Seiten herum) zu generieren und für Vergleiche zur Verfügung zu stellen, noch hielt er es für eine gute Idee, sein Programm und die verwendeten Eingabedaten öffentlich zugänglich zu machen. Angesichts der etwas kryptischen Arbeitsmethoden und der Tatsache, dass aufgrund einer eher oberflächlichen Ähnlichkeit des Ergebnisses ein weit reichender Schluss postuliert wurde, ist dieser ganze Ansatz mit einem Makel behaftet, der ebenso arg ist wie die Leistungen einiger wirrköpfiger »Entzifferer«. Und das ist schade, denn es fügt der ernsthaften Auseinandersetzung mit dem »verdammten Manuskript« anhaltend Schaden zu.

Gerade bei Menschen, die Skeptiker sind, sollte bei einer solchen wissenschaftlichen Arbeitsweise jede Alarmlampe angehen, wenn auch die »Ergebnisse« solchen Arbeitens im Scientific American publiziert wurden.

Natürlich kann der Vortrag dennoch interessant sein. Wer sich in der Zeit zwischen dem 1. und 3. Mai in Darmstadt aufhält, sollte sich diese Gelegenheit nicht entgehen lassen. Der GWUP wäre (wohl nicht nur) ich sehr zu Dank verpflichtet, wenn Inhalte dieses Vortrages und ergänzende Materialien – ein Kryptografie-Experte und Informatiker wird sich gewiss sehr gründlich mit dem Manuskript und einigen »Lösungen« auseinandersetzen, da bin ich mir ganz sicher – frei im Internet verfügbar gemacht würden, damit ich zusammen mit den ganzen anderen Voynichologen auch etwas davon habe.

[via Voynich News]

Thema: Kommunikation, Sonstiges im Netz | Kommentare (0)

Transkriptionen aus der Datenbank holen

Montag, 7. April 2008 1:36

So nützlich es auch ist, die Transkriptionen in einer relationalen Datenbank zu haben, so sehr wünscht man sich doch manchmal, dass diese als gewöhnlicher Text vorliegen. Um ein bequemes Extrahieren von Transkriptionen aus der Datenbank zu ermöglichen, habe ich noch ein kleines Python-Skript geschrieben. Dieses Skript steht hier zum freien Download, und wer sich immer mit diesem Manuskript plagt, der darf es gern benutzen oder für seine speziellen Bedürfnisse anpassen.

Download-Link: Ein Python-Skript zum Extrahieren von Transkriptionen aus der Datenbank

Wer das Skript benutzen will, muss die Zugangsdaten für seine Datenbank im Quelltext angeben. Dieser Teil des Quelltextes dürfte sich auch für jene selbst erklären, die sich mit Python sonst schwer tun. Deshalb habe ich keine andere Methode zur Konfiguration vorgesehen.

Die Verwendung ist relativ einfach. Es handelt sich um ein Skript für die Kommandozeile, mit Optionen kann gesteuert werden, welcher Anteil aus welcher Transkription extrahiert werden soll.

Übersicht über die Optionen

Bei allen Optionen muss die korrekte Groß-/Kleinschreibung beachtet werden.

-h
Ausgabe einer kurzen Hilfe zu den Optionen, die eine gute Gedächtnisstütze sein kann.

-O DATEINAME
Umleitung der Ausgabe in eine Datei. Das können allerdings auch fast alle Betriebssysteme.

-t TRANSCODE
Auswahl der gewünschten Transkription durch den ihr zugeordneten Code, der aus einem Buchstaben besteht. Wenn diese Angabe nicht gemacht wird, wird die Transkription von Takeshi Takahashi verwendet.

-H HANDCODE
Auswahl der Handschrift nach dem Schema von Currier. Definierte Codes sind 1, 2, 3, 4, 5, X und Y. Es können mehrere Codes angegeben werden, etwa 345. Wenn diese Angabe nicht gemacht wird, werden Seiten unabhängig von dieser Information extrahiert.

-l LANGCODE
Auswahl der Currier-Sprache. Definierte Codes sind A und B. Es kann auch AB angegeben werden, um nur jene Bereiche zu extrahieren, denen sich eine Currier-Sprache zuordnen lässt. Wenn diese Angabe nicht gemacht wird, werden Seiten unabhängig von dieser Information extrahiert.

-i ILLUCODE
Auswahl von Seiten nach ihrer Illustration. Definierte Codes sind T für reinen Text, H für Pflanzenkunde, A für astronomische Seiten, Z für den Tierkreis, B für biologische Seiten, C für Kosmologie, P für pharmazeutische Seiten und S für den abschließenden Teil. Auch hier können mehrere Codes angegeben werden. Wenn diese Angabe nicht gemacht wird, werden alle Seiten unabhängig von ihrer Illustration extrahiert.

-r BEREICH
Auswahl von Seiten nach ihrer Seitennummer. Die Bereiche können sehr flexibel angegeben werden, weitere Informationen weiter unten. Wenn diese Angabe nicht gemacht wird, dann wird aus dem gesamten Manuskript extrahiert.

-a ALPHABET
Auswahl eines Transkriptions-Alphabetes für die Ausgabe. Definiert sind EVA, Frogguy, FSG, Currier und Bennett. Wenn diese Angabe nicht gemacht wird, findet EVA Verwendung.

-T
Ausgabe aller definierten Transkriptionscodes mit Angaben zum Umfang der Transkription.

-v
Anzeige der Programmversion.

Zur Angabe von Seitenbereichen

In den Angaben der Seitenbereiche mit -r sind keine Leerzeichen gestattet.

Ein Seitenbereich kann eine Einzelseite sein, etwa f10r. Diese wird direkt angegeben.

Es kann sich um Seiten im Bereich von einer Startseite bis zu einer Endseite handeln. Dann werden die beiden Seiten durch einen Doppelpunkt getrennt. Um die Seiten von f20v bis f22r zu extrahieren, muss der Bereich f20v:f22r angegeben werden.

Es kann sich um Seiten vom Anfang bis zu einer bestimmten Seite handeln. Dann wird der Endseite ein Doppelpunkt vorangestellt. Um die Seiten bis f10r zu erhalten, muss der Bereich :f10r angegeben werden. Von von einer Seite beginned bis zum Ende des Manuskriptes zu extrahieren, wird der Doppelpunkt nachgestellt.

Das f zum Beginn der Seitennummer kann weggelassen werden. Statt f2r:f4r kann auch einfach 2r:4r geschrieben werden. Es ist im Kontext dieser Option immer klar, was gemeint ist, das »f« für »Folio« ist semantisch überflüssig.

Verschiedene Seitenbereiche können mit + kombiniert werden. Wer die Seiten von 1r bis 5v und von 30r bis 45v erhalten möchte, kann die Angabe 1r:5v+30r:45v machen. Überlappungen sind dabei kein Problem, es wird stets der größtmögliche Seitenbereich ausgewählt. Dieser kann durch die weiteren Optionen gefiltert werden.

Beispiele

Zunächst ein ganz einfaches Beispiel. Um die pflanzenkundlichen Seiten in der Currier-Sprache B zu erhalten, wird das folgende Kommando benutzt:

python voynich.py -i H -l B

Dieses Kommando kann etwas abgekürzt werden, indem die Leerzeichen zwischen den Optionen und ihren Parametern weggelassen werden.

python voynich.py -iH -lB

Mit der Angabe eines zusätzlichen Seitenbereiches können etwa nur die Seiten ab f48r erhalten werden.

python voynich.py -iH -lB -r48r:

Installation für die bequeme Anwendung

Wenn man dieses Skript häufiger verwendet, wird man es wohl über seinen normalen Suchpfad für Kommandos zugänglich machen. In Unix-artigen Systemen kann es direkt ausführbar gemacht werden und sollte auf Anhieb laufen, die beim Tippen etwas lästige Dateinamenserweiterung ».py« kann einfach entfernt werden.

Kurzlizenz

Jeder Mensch, der am Voynich-Manuskript forscht, darf mit diesem Skript machen, was er will. Wenn jemand nützliche Erweiterungen programmiert, wäre es nett, wenn diese erweiterte Version ebenso frei zur Verfügung gestellt würde.

Thema: Hacking, Hilfsmittel | Kommentare (0)