Beiträge vom 22. August 2008

Überprüfung der harmonischen Gesetze

Freitag, 22. August 2008 21:58

Es ist eine Sache, nach einem Blick in die Transkriptionen und vor allem auch in die Bilder des Manuskriptes die »harmonischen« Gesetze für die Bildung der Glyphenfolgen in einem »Wort« zu erkennen. Eine solche Einsicht wirkt jedoch um einiges überzeugender, wenn man sie mit ein paar Zahlen belegen kann.

Um mich dieser Aufgabe zu widmen, habe ich ein Python-Skript geschrieben, dass meiner Voynich-Datenbank eine neue Tabelle hinzufügt. Das Skript für die harmonische Analyse der „Wörter“ im Manuskripte stelle ich hier wie üblich zum freien Download.

Nach der Anpassung der Zugangsdaten für die Datenbank und dem Start des Skriptes wird die neue Tabelle voy_harmony in der Datenbank erzeugt. Diese besteht nur aus zwei Spalten, nämlich

  • harm_word INTEGER
    Die ID des Wortes, für das die Verstöße gegen die Harmonieregeln gezählt wurden
  • harm_failcount INTEGER
    Die Anzahl der Verstöße gegen die harmonischen Regeln für dieses Wort

Das Skript zählt alle Verstöße gegen die harmonischen Regeln, außer, wenn sie in einigen Fällen die letzte Glyphe eines Wortes betreffen. Eine solche Zählung findet für jedes Wort statt, dass ausschließlich aus lesbaren Zeichen besteht. Jeder Weirdo wird – mit Ausnahme seines Auftretens an letzter Position im Wort – als Verstoß gegen die harmonischen Regeln gezählt.

Mit Hilfe dieser Tabelle lassen sich natürlich ausführliche Analysen machen. Um mich von der Gültigkeit der harmonischen Regeln für einen Großteil des Manuskriptes zu überzeugen, habe ich einmal eine kleine Zählung über alle Wörter aus allen Transkriptionen gemacht:

SELECT  COUNT(*) AS words,
        SUM(count) AS frequency,
        harm_failcount AS unharmonicals
FROM    voy_word
JOIN    voy_harmony ON word_id = harm_word
GROUP   BY unharmonicals;

Das Ergebnis dieser Zählung ist erstaunlich, zumal in diese Zählung auch alle »Wörter« derjenigen Seiten eingegangen sind, die eine besondere Häufung von Weirdos und ungewöhnlich geformten »Wörtern« zeigen.

+-------+-----------+---------------+
| words | frequency | unharmonicals |
+-------+-----------+---------------+
|  8384 |    111003 |             0 |
|  2329 |      7779 |             1 |
|   704 |      1836 |             2 |
|   116 |       194 |             3 |
|    14 |        15 |             4 |
|     1 |         1 |             5 |
+-------+-----------+---------------+
6 rows in set (0.91 sec)

Wenn man die verschieden geformten »Wörter« betrachtet, ohne ihre Häufigkeit in Rechnung zu stellen, denn sind 27,4 Prozent des gesamten »Wortschatzes« (der gewiss auch viele Fehler der Transkriptoren und der frühen Restauratoren enthält) »unharmonisch« geformt. Bezieht man jedoch die Häufigkeit dieser Wörter in Betracht, so erweisen sich nur 8,1 Prozent der »Wörter« des gesamten »Textes« im Manuskript als »unharmonisch«.

Die »harmonischen« Regeln erzwingen durch ihre starre Struktur eine recht hohe Redundanz des Textes. Die »unharmonischen« Wörter haben also einen höheren Gehalt an Information, sie tragen vielleicht auch eine (oder sogar: die) Bedeutung.

Was als nächster Schritt sehr interessant wäre, das wäre eine Analyse, ob die »unharmonischen« Wörter gehäuft an bestimmten Stellen des Manuskriptes (Position des »Wortes« in der Zeile, Position der Zeile auf der Seite, bestimmte Abschnitte im Manuskripte) auftreten, oder ob sich sich gleichmäßig über den gesamten Text verteilen. Eine solche Analyse werde ich in den nächsten Wochen einmal angehen.

Thema: Ergebnisse, Hilfsmittel | Kommentare (2) | Autor: