Überprüfung der harmonischen Gesetze
Es ist eine Sache, nach einem Blick in die Transkriptionen und vor allem auch in die Bilder des Manuskriptes die »harmonischen« Gesetze für die Bildung der Glyphenfolgen in einem »Wort« zu erkennen. Eine solche Einsicht wirkt jedoch um einiges überzeugender, wenn man sie mit ein paar Zahlen belegen kann.
Um mich dieser Aufgabe zu widmen, habe ich ein Python-Skript geschrieben, dass meiner Voynich-Datenbank eine neue Tabelle hinzufügt. Das Skript für die harmonische Analyse der „Wörter“ im Manuskripte stelle ich hier wie üblich zum freien Download.
Nach der Anpassung der Zugangsdaten für die Datenbank und dem Start des Skriptes wird die neue Tabelle voy_harmony
in der Datenbank erzeugt. Diese besteht nur aus zwei Spalten, nämlich
harm_word
INTEGER
Die ID des Wortes, für das die Verstöße gegen die Harmonieregeln gezählt wurdenharm_failcount
INTEGER
Die Anzahl der Verstöße gegen die harmonischen Regeln für dieses Wort
Das Skript zählt alle Verstöße gegen die harmonischen Regeln, außer, wenn sie in einigen Fällen die letzte Glyphe eines Wortes betreffen. Eine solche Zählung findet für jedes Wort statt, dass ausschließlich aus lesbaren Zeichen besteht. Jeder Weirdo wird – mit Ausnahme seines Auftretens an letzter Position im Wort – als Verstoß gegen die harmonischen Regeln gezählt.
Mit Hilfe dieser Tabelle lassen sich natürlich ausführliche Analysen machen. Um mich von der Gültigkeit der harmonischen Regeln für einen Großteil des Manuskriptes zu überzeugen, habe ich einmal eine kleine Zählung über alle Wörter aus allen Transkriptionen gemacht:
SELECT COUNT(*) AS words, SUM(count) AS frequency, harm_failcount AS unharmonicals FROM voy_word JOIN voy_harmony ON word_id = harm_word GROUP BY unharmonicals;
Das Ergebnis dieser Zählung ist erstaunlich, zumal in diese Zählung auch alle »Wörter« derjenigen Seiten eingegangen sind, die eine besondere Häufung von Weirdos und ungewöhnlich geformten »Wörtern« zeigen.
+-------+-----------+---------------+ | words | frequency | unharmonicals | +-------+-----------+---------------+ | 8384 | 111003 | 0 | | 2329 | 7779 | 1 | | 704 | 1836 | 2 | | 116 | 194 | 3 | | 14 | 15 | 4 | | 1 | 1 | 5 | +-------+-----------+---------------+ 6 rows in set (0.91 sec)
Wenn man die verschieden geformten »Wörter« betrachtet, ohne ihre Häufigkeit in Rechnung zu stellen, denn sind 27,4 Prozent des gesamten »Wortschatzes« (der gewiss auch viele Fehler der Transkriptoren und der frühen Restauratoren enthält) »unharmonisch« geformt. Bezieht man jedoch die Häufigkeit dieser Wörter in Betracht, so erweisen sich nur 8,1 Prozent der »Wörter« des gesamten »Textes« im Manuskript als »unharmonisch«.
Die »harmonischen« Regeln erzwingen durch ihre starre Struktur eine recht hohe Redundanz des Textes. Die »unharmonischen« Wörter haben also einen höheren Gehalt an Information, sie tragen vielleicht auch eine (oder sogar: die) Bedeutung.
Was als nächster Schritt sehr interessant wäre, das wäre eine Analyse, ob die »unharmonischen« Wörter gehäuft an bestimmten Stellen des Manuskriptes (Position des »Wortes« in der Zeile, Position der Zeile auf der Seite, bestimmte Abschnitte im Manuskripte) auftreten, oder ob sich sich gleichmäßig über den gesamten Text verteilen. Eine solche Analyse werde ich in den nächsten Wochen einmal angehen.
Dienstag, 23. September 2008 19:46
[…] die Datenbank um eine Tabelle erweitert ist, die eine Zählung von Verstößen gegen die harmonischen …, liegt es nahe, einmal die Verteilung dieser „Wörter“ auf den Seiten des […]
Freitag, 3. Oktober 2008 21:20
[…] kam ich zu meinen „harmonischen“ Gesetzen für die Glyphenfolge, und diese Gesetze werden von 92 Prozent der „Wörter“ im Manuskript erfüllt. Es ist eine weitere Eigenschaft des Textes, die einer Erklärung bedarf — und sei es […]