Glyphenhäufigkeit pro Seite

In einer Mail wurde ich mit einer sehr einfachen Frage konfrontiert: Wie sieht es mit einer Betrachtung der Glyphenhäufigkeit für die einzelnen Seiten des Manuskriptes aus?

Es sind manchmal die einfachen Fragen, die sich zwar relativ leicht beantworten lassen, an die ich selbst aber noch nie gedacht habe. Das habe ich für alle Freunde der nummerischen Auswertung gern nachgeholt. Die Ergebnisse dieser Auswertung und das dafür verwendete Skript stelle ich hier zum freien Download zur Verfügung, damit sich niemand noch einmal diese Mühe machen muss.

Das ZIP-Archiv enthält zwei Dateien.

  1. gcount.pl ist das Perl-Skript, mit dem ich die Ergebnisse erhalten habe, und
  2. gcount.txt ist das Ergebnis der Zählung für die vollständige Transkription von Takeshi Takahashi in der von Jorge Stolfi normalisierten Form
  3. .

Das Ergebnis ist eine einfache Textdatei. Die Zeilenenden sind nach Unix-Konvention markiert. Jede Zeile enthält drei durch Tabulatorzeichen getrennte Felder, nämlich

  1. die F-Nummer der Seite,
  2. die gezählte Glyphe und
  3. die Häufigkeit dieser Glyphe auf der Seite.

Leerzeichen erscheinen als Punkte, und unlesbare Glyphen sowie Weirdos als Asterisk. Die Auswertungen für die einzelnen Seiten sind nach Häufigkeit der Glyphen absteigend sortiert. Am Ende erscheint eine Seitenbezeichnung »total«, welche die Häufigkeiten für das gesamte Manuskript wiedergibt.

Das Skript sollte sich problemlos auf andere Transkriptionen anwenden lassen, so lange sie aus einem Lokator in spitzen Klammern bestehen, der die mit einem Punkt beendete F-Nummer enthält und von einer beliebigen Menge Leerzeichen (auch Null) vom Text getrennt ist; es entfernt allerdings keine in die Zeile eingebetteten Kommentare in geschweiften Klammern. Das Skript kann aus der Standardeingabe lesen, es ist aber auch möglich, beliebig viele Dateinamen als Parameter zu übergeben. Die Ausgabe sollte sich in jede Tabellenkalkulation importieren lassen und leicht weiterzuverarbeiten sein.

Tags »

Autor:
Datum: Samstag, 7. Mai 2011 22:51
Trackback: Trackback-URL Themengebiet: Hacking

Feed zum Beitrag: RSS 2.0 Diesen Artikel kommentieren

2 Kommentare

  1. 1

    Manuscript writen Czech language + Gematrie system.

  2. 2

    Guten Morgen,
    Meine Annahme ist, Roger Bacon, (1214- 1294) Universalgelehrte, er muss der Verfasser des Originals sein!

    Denn nur er konnte dieses Wissen- lesen Sie nach – haben und Anagramme damit schreiben. Diese Theorie kann nicht widerlegt werden, nur weil eine Radiokarbon-Datierung, der Untersuchung in 2009. des Materials etc des MS 408, aus der Beinecke-Library in Connecticut (USA) den Zeitraum der Entstehung auf 1409 bis 1494 begrenzen, ist dies noch kein Beweis wer der Schreiber der Kopie bzw. des Originals war!

    Diese Feststellung lässt andere Annahmen und mögliche Schreiber des Voynich-Manuscriptes nicht völlig ausschließen.

    Zusammenhang:

    Es wird sogar dadurch erheblich wahrscheinlicher die geheimnisvollste Handschrift hat im Original Roger Bacon geschrieben. Denn dies würde dann vom Zeitraum vorher exakt passen, da es keinen anderen gibt der in dieser Zeit von 1250- 1410 so etwas schreiben konnte! Roger Bacon konnte auch in Anagrammen schreiben.

    Es bleibt für mich nur das Rätsel warum dieser Inhalt so wichtig war es abzuschreiben. Daher gehe ich davon aus, der Auftraggeber oder der Schreiber der Abschrift des Voynich- Manuskriptes konnte es damals lesen, sonst hätte dieser es nicht anfertigen lassen, denn die Zeit und die Kosten waren zu hoch. Andere abenteuerliche Hinweise werden hier ausgeschlossenen, da diese keinen wirklichen Sinn ergeben.

    Nach dem ich viele Meinungen von Forschern gesichtet habe, und diese selber sich widersprechen, oder von anderen als falsch dargestellt werden müssen, bleiben sehr wenige über, die aber vorher ins Feld geführt wurden.
    Jede Tinte ist bei späterer Zusammensetzung anders.
    So komme ich zu der Annahme, da sich Forscher einig sind, dieses MS 408 ist eine Abschrift, da durch keine offensichtlichen Korrekturen, also ohne Fehler abgeschrieben wurde ist es eine Meisterleistung, aber auch ein Indiz dafür es gab eine Vorlage des Textes und davon wurde das Voynich-Manuskript abgeschrieben, welches uns nun vorliegt.

    Diese wichtigen Ergänzungen meines großen Beitrages zu MS 408 auf WordPress Umweltansicht Eric Hoyer grüßt Sie alle freundlich

    vom 18.03.2014, wurden zu meinem Beitrag unten hier gemacht und vorangestellt.

Kommentar abgeben