Download der Konkordanz

Freitag, 14. April 2006 15:58

Da es doch immer wieder Probleme mit den allgemeinen Tücken von Perl-Skripten unter verschiedenen Betriebssystemen und mit den besonderen Tücken meiner Programmierung zu geben scheint, habe ich die vollständige Konkordanz aller Transkriptionen des Voynich-Manuskriptes zum Download gestellt. Es handelt sich um ein mit gzip komprimiertes tar-Archiv mit einer noch relativ download-freundlichen Dateigröße von 8,1 Megabyte, dieses Archiv lässt sich zum Beispiel unter Microsoft Windows mit WinZip oder WinRar entpacken.

Ich habe mich dazu entschlossen, die Konkordanz nicht einfach zu zippen, weil die gezippte Konkordanz zu einer gut sechsmal größeren Datei führt — für den Download mit einer schmalbandigen Anbindung am Internet wäre das eine Zumutung, und auch der mir zur Verfügung stehende Webspace ist nicht unbegrenzt. Da praktisch jedes Archiv-Tool auch tar-Archive zumindest entpacken kann, sehe ich auch kein großes Problem in der Verwendung eines Formates, das vielen Menschen mit nicht unixoiden Betriebssystemen vielleicht etwas ungewöhnlich erscheint.

Thema: Hacking | Kommentare (3)

Erstellen einer Konkordanz

Montag, 10. April 2006 21:20

Wer sich mit der »Wortfolge« des Voynich-Manuskriptes beschäftigen möchte, bekommt schnell den Wunsch, eine vollständige Konkordanz aller Transkriptionen zu verwenden. In einer solchen Konkordanz werden sämtliche »Wörter« mit allen ihren Fundstellen aufgelistet, zu jedem Wort wird jeweils noch ein Stück Kontext der Zeile aufgeführt, in der dieses Wort auftritt.

Ich habe mein kleines Programm zum Erstellen einer solchen Konkordanz in HTML ja schon vor vielen Monaten hier veröffentlicht, und die damit erstellte Konkordanz stellt mich vollständig zufrieden. Besonders angenehm ist die Auszeichnung aller »Wörter« als Hyperlinks, so dass die gesamte Konkordanz mit der Maus navigierbar wird. Wer einmal einen Eindruck haben möchte, wie so etwas aussieht: Ich habe mal die Seite für das Wort qokain in der Transkription von Takeshi Takahashi zum Download gestellt — natürlich funktionieren dabei die Links nicht, weil die weiteren Seiten fehlen.

Allerdings hat sich inzwischen der Leser- und Nutzerkreis dieses Blogs etwas verändert, da dieses Blog nun auch als Informationssammlung für die deutschsprachige Voynich-Group bei Yahoo dient. Deshalb kann ich hier nicht mehr bei jedem so viel Hintergrundwissen voraussetzen, dass die sehr knappen Erläuterungen zur Erstellung einer Konkordanz ausreichend wären. Ich habe schon daran gedacht, die Konkordanz als Ganzes zum Download zu stellen, sie hat allerdings einen Umfang von knapp 110 Megabyte, was sowohl eine erhebliche Last für den zur Verfügung stehenden Webspace und Traffic als auch für den Download über langsame Leitungen eine Zumutung wäre.

Deshalb gebe ich hier eine sehr genaue Anleitung, wie die Konkordanz der Transkriptionen des Voynich-Manuskriptes aus frei verfügbaren Dateien mit Hilfe eines Computers erstellt werden kann. Wer dabei das erste Mal in seinem Leben mit Programmierung konfrontiert ist, sollte deshalb nicht verzagen: Die Programme sind bereits fertig, sie müssen nur zum Laufen gebracht werden. Und der Ablauf eines Computerprogrammes ist ein strikt deterministischer Vorgang, der aus den gleichen Eingabedateien überall die gleichen Ausgabedateien macht. Es ist also nicht halb so schlimm, wie es hier auf dem ersten Blick aussieht.

Was benötigt wird

Folgendes wird benötigt, um die Konkordanz zu erstellen — vor dem Erstellen ist also ein bisschen Download gesetzt.

  • Ein Perl-Interpreter für ihr System
    Alle Programme sind in der Programmiersprache Perl geschrieben. Der Interpreter für diese Sprache ist für beinahe jedes Betriebssystem frei verfügbar und kann unter www.perl.org kostenlos heruntergeladen werden. Wenn sie allerdings Mircosoft Windows benutzen, ist ActivePerl von ActiveState wohl die beste Wahl für ihr System. Anwender von Linux oder MacOS X sollten bereits ein Perl auf ihrem System installiert haben.
  • Den Zeichensatz EVA Hand 1
    Die generierten HTML-Dokumente verwenden diesen Zeichensatz, um eine möglichst große Nähe zur optischen Erscheinung der Glyphen im Manuskript zu erreichen. Natürlich können sie die Konkordanz auch ohne diesen Zeichensatz verwenden, wenn sie sehr geübt im Lesen von EVA sind.
  • Das Interlinear-Archiv der Transkriptionen in EVA
    Diese große Arbeit von Jorge Stolfi ist im Moment noch die am besten zu verwendende Zusammenstellung der Arbeit vieler Menschen. Alle meine Programme bauen auf diesem Werk auf.
  • Mein Programm viat
    Dieses Perl-Programm wird verwendet, um interessierende Bereiche aus Jorge Stolfis Interlinear-Archiv zu extrahieren. Es ist auch für andere eigene Forschungen sehr hilfreich, wenn man etwa für bestimmte Untersuchungen eine Datei erstellen möchte, die nur aus den biologischen Seiten in der Transkription von Currier besteht.
  • Mein Programm voyconc
    Dieses Perl-Programm erstellt die vollständige Konkordanz mit Hilfe des Programmes viat.

Um die Programme anzuwenden, müssen sie sie nicht verstehen. Alle meine Programme sind auf einem unixoiden Betriebssystem entstanden und folgen den dortigen Gepflogenheiten, sie werden also an der Kommandozeile aufgerufen. Es gibt auch kein besonderes Installationsprogramm, und so haben sie etwas Mühe und müssen von Hand installieren.

Installation des Perl-Interpreters

Folgen sie einfach den Anweisungen, die sie dort finden, wo sie ihren Perl-Interpreter herunterladen. Wenn sie ActivePerl unter Microsoft Windows verwenden, ist die Installation genau so einfach wie die Installation jeder anderen Windows-Anwendung.

Installation des Zeichensatzes

Der Zeichensatz befindet sich in einer ZIP-komprimierten Datei, sie extrahieren ihn mit dem Entpacker ihrer Wahl. Unter Windows XP ist das bequeme Entpacken durch einen einfachen Klick bereits mit Mitteln der graphischen Oberfläche möglich, unter früheren Versionen von Windows verwenden sie entweder WinRAR oder WinZIP, wenn sie kein UNZIP.EXE für das Entpacken an der Kommandozeile verwenden wollen. Auch alle anderen Dateien sind ZIP-komprimiert und werden auf die gleiche Weise entpackt.

Die Installation von Zeichensätzen ist von Betriebssystem zu Betriebssystem verschieden, deshalb kann hier keine genaue Anleitung gegeben werden. Unter Microsoft Windows wird die TTF-Datei einfach in den entsprechenden Ordner verschoben, das Betriebssystem löst alle weiteren Aktionen im Hintergrund aus. Unter anderen Systemen kann deutlich mehr Mühe erforderlich sein, um einen neuen Zeichensatz zu installieren.

Weitere Vorbereitungen

Entpacken sie alle weiteren Dateien in ein Verzeichnis.

Die weitere Vorgehensweise ist wieder von System zu System verschieden, ich gebe hier eine Anleitung für unixoide Systeme (nicht nur Linux, sondern auch MacOS X) und für Microsoft Windows.

Unixoide Systeme

Für die folgende Kommandofolge wird vorausgesetzt, dass sie die bash als Shell verwenden. Dies ist beinahe immer der Fall, und wenn sie bewusst etwas anderes verwenden, dann werden sie sich zu helfen wissen. Sie müssen auf jeden Fall eine Shell öffnen und mit cd in das Verzeichnis wechseln, in dem sich die Dateien befinden. Für dieses Beispiel habe ich angenommen, dass sich die Dateien im Verzeichnis /home/es/voy befinden. Das Zeichen $ soll ihren Prompt repräsentieren, es ist nicht einzugeben.

$ cd /home/es/voy
$ chmod +x viat voyconc
$ export VOYNICH=/home/es/voy
$ voyconc

Danach hat der Rechner etwas zu tun. Am Ende befindet sich die gesamte Konkordanz im Verzeichnis concordance, die Datei index.html kann mit jedem Webbrowser verwendet werden. Die Benutzung der Konkordanz erklärt sich hoffentlich von selbst.

Microsoft Windows

Auch hier müssen sie an der Kommandozeile bedienen, und es wird auch leider ein kleines bisschen komplizierter. Zunächst müssen sie eine »MS/DOS-Eingabeaufforderung« öffnen; unter Windows NT, 2000 oder XP können sie hierzu vom Startmenü aus »Ausführen…« wählen und als Programm cmd.exe eingeben. Auch dort müssen sie in das Verzeichnis wechseln, in dem sich die entpackten Dateien befinden, für das Beispiel wurde C:\voy angenommen. Das Zeichen > am Anfang der Zeilen soll ihren Prompt darstellen, es ist nicht einzugeben. Ich gehe davon aus, dass sie ActivePerl verwenden und dass folglich das Programm pl2bat bei ihnen installiert ist.

> cd c:\voy
> pl2bat viat
> set VOYNICH=C:\voy
> perl voyconc

Auch unter Windows ist der Rechner eine Weile beschäftigt, um ca. 110 MB Konkordanz zu erstellen.

Fertig

Wenn alles ohne Fehler durchgelaufen ist, haben sie eine vollständige Konkordanz über sämtliche Transkriptionen des Vonyich-Manuskriptes zur Verfügung. Das war doch das bisschen Mühe wert…

Thema: Hacking | Kommentare (0)

Deutsche Yahoo-Group eröffnet

Sonntag, 2. April 2006 1:15

Jonathan Dilas hat eine deutschsprache Yahoo Group für das Voynich-Manuskript eröffnet. Darüber wird auch eine deutschsprachige Mailing-Liste zur Verfügung gestellt, die dem offenen Austausch über das Manuskript dient. Alles weitere erfährst Du dort, natürlich auch, wie Du Dich anmeldest, um an diesem Austausch teilzuhaben.

Es kam sehr schnell das Bedürfnis nach einer einführenden Darlegung der wesentlichen Themen zum Voynich-Manuskript auf. Leider hatte ich keine geeigneten Texte zur Verfügung.

In diesem Zusammenhang habe ich mich wieder an dieses Blog erinnert, der ja leider in den letzten Monaten von mir etwas stiefmütterlich behandelt wurde. Es könnte ein guter Ort sein, um zunächst Informationen aller Art zu sammeln und sie in einem zweiten Schritt über erläuternde Seiten mit vielen Links systematisch aufzubereiten. Dies ist eine durchaus bedeutende Neuausrichtung der Absicht dieses Blogs, da es nun nicht mehr in erster Linie um meine persönliche Begegnung mit diesem Rätsel geht, sondern um eine zunächst unsystematische Sammelstelle, die auch anderen Interessierten offen stehen muss.

Dies führte wiederum zu einigen technischen Änderungen. Zunächst ist es einmal nicht mehr jedem Menschen möglich, hier anonym zu kommentieren, sondern das Kommentieren bedarf einer Anmeldung. Dafür ist nur ein selbstgewählter Benutzername und eine gültige Mailadresse erforderlich, selbstverständlich werden diese Daten nur intern verwendet. Weitere Angaben zur Person sind freiwillig, können aber für den Austausch nützlich sein. Über die Möglichkeit zum Kommentieren hinaus werde ich jedem Interessierten auf seine Bitte hin die Möglichkeit geben, hier auch reguläre Einträge zu erstellen.

Dies soll in keiner Weise als Konkurrenz zur jetzt bestehenden Mailing-Liste verstanden werden, sondern als Ergänzung. Ein mehr interner Austausch ist etwas völlig anderes als die Veröffentlichung im öffentlich zugänglichen Internet, die auch einem »Einsteiger« nützlich und hilfreich sein soll.

Die alten Einträge mit meinen kleinen Betrachtungen werde ich zunächst so belassen, sie können aber in Zukunft in einen übergeordneten Zusammenhang eingefügt werden.

Thema: Kommunikation | Kommentare (0)

Auch eine Betrachtung…

Montag, 21. November 2005 3:50

Aus den Referern des Webservers habe ich’s erfahren, dass sich in einem Counterstrike-Forum über das Voynich-Manuskript unterhalten wurde. Das Thema des Threads lautete: Verborgenes Wissen aus der Hohlern Erde.

Mit manchen Thesen kann man eben alles erklären, und deshalb erklären diese Thesen nichts.

Thema: Diverses | Kommentare (0)

Rohonczi Codex

Mittwoch, 16. November 2005 4:27

Viele Menschen, die auf das Voynich-Manuskript stoßen, halten es für ein einmaliges Werk. Das stimmt aber nicht ganz, es gibt auch andere verschlüsselte Werke aus dem späten Mittelalter, deren Code bis heute nicht gelöst ist. Ein Beispiel dafür ist der auf Papier geschriebene Rohonczi Codex, dessen eigentümliches, offenbar von rechts nach links geschriebenes Schriftbild ebenfalls große Rätsel aufgibt und nicht einmal Mutmaßungen darüber zulässt, in welcher Sprache das Buch verfasst ist:

Eine Beispielseite

Die sonderbaren Illustrationen sind auch hier keine große Hilfe, ihr scheinbar dem Alltagsleben und der Begegnung der großen monotheistischen Relgionen entsprungener Themenkreis wirkt aber deutlich »irdischer« als die wie ein Patchwork zusammengesetzten Pflanzen und kosmologischen Entwürfe des Voynich-Manuskriptes. Leider liegt von diesem Manuskript nicht einmal eine gute Transkription vor.

Thema: Andere Rätsel | Kommentare (1)

Eine interessante Theorie

Donnerstag, 15. September 2005 19:46

Eine recht interessante Theorie zum Aufbau des Codes äußerte gestern Elmar Vogt auf der Mailing-Liste zum Manuskript. Ich finde diesen Ansatz recht interessant und erkläre deshalb an dieser Stelle kurz den grundlegenden Gedanken.

Die Theorie geht von der Beobachtung aus, dass die Zeichen des lateinischen Alphabetes aus einer relativ kleinen Menge geometrischer Figuren aufgebaut sind. Etwas vergleichbares gilt für die Glyphen des Voynich-Manuskriptes, die nur aus wenigen Linienzügen komponiert sind.

Die Verschlüsselung im Manuskript könnte daher auf die folgende Weise hergestellt worden sein:

  • Es wird eine Tabelle aus den Formen erstellt, mit denen lateinsche Buchstaben gebildet werden können
  • Jeder Buchstabe des Klartextes (und vielleicht auch weitere Zeichen wie Ziffern, diakritische Symbole, gängige Abkürzungen) wird in seine einzelnen Formen zerlegt.
  • Und abschließend werden diese Formen in die Linienzüge der Glyphen des Manuskriptes übersetzt

Diese verblüffend einfache Theorie deckt sich in den folgenden Punkten mit den rätselhaften Eigenschaften des Manuskriptes:

  1. Der Verschlüsselung und Entschlüsselung könnte schnell und manuell mit einfachen Hilfsmitteln vorgenommen werden. Selbst im 15. Jhdt. wäre dies problemlos möglich gewesen.
  2. Ein solches Verfahren wäre einzigartig oder doch wenigstens sehr ungewöhnlich.
  3. Es gäbe keine 1:1-Korrespondenz zwischen Voynich-Glyphen und Buchstaben des Klartextes, was das bisherige Scheitern aller Versuche erklären hilft.
  4. Die geringe Entropie des Textes wäre erklärlich.
  5. Der Zeichensatz des Manuskriptes könnte sehr klein sein. Schon fünfzehn Zeichen wären hinreichend.
  6. Die Leerzeichen hätten keinen Bezug zu Wortgrenzen im Klartext, sondern könnten zur Vermeidung von Doppeldeutigkeiten eingefügt sein. Der Buchstabe »d« setzt sich ja aus den gleichen Formen wie die Buchstabenkombination »ol« zusammen, die Trennung im Schlüsseltext könnte solche Mehrdeutigkeiten beseitigen.
  7. Bei so motivierten Leerzeichen könnte auch die entdeckte »Grammatik« der »Wörter« im Manuskript erklärlich sein, da nur vor und nach bestimmten Formen eine unzweideutige Trennung erforderlich wäre

Eventuell werde ich, wenn ich in den nächsten Tagen die Muße dazu finde, selbst einige Untersuchungen dieser kurz dargestellten Theorie unternehmen.

Thema: Spekulation | Kommentare (0)

(Nur) ein Kunstwerk?

Sonntag, 21. August 2005 2:21

Was bei der Betrachtung des Voynich-Manuskriptes sofort in’s Auge fällt, ist seine sehr eigentümliche Bebilderung, die schnell den Eindruck erweckt, aus einer »anderen Welt« zu kommen. Das Schriftbild wirkt hingegen auf dem ersten Blick beinahe vertraut, und die Vermutung, dass es sich um eine unentzifferbare Geheimschrift handelt, liegt fern.

Einer der Gründe, warum diese Schrift nicht gelesen werden kann, könnte darin liegen, dass diese Schrift nicht zu lesen ist. (Das klingt dumm, ich weiß…)

Es ist durchaus denkbar, dass es sich beim gesamten Manuskript um ein Kunstwerk handelt, das eben Bilder einer anderen Welt zeigen soll. Natürlich nicht solche, die aus einem UFO heraus flugs gezeichnet wurden, sondern eher Bilder einer uns recht fremden geistigen Welt, ein künstlerischer Entwurf einer anderen Welt oder einer Traumwelt. Dann überrascht es auch weniger, dass jede Identifikation der »Pflanzen« bislang gescheitert ist (obwohl das eine so einfache Möglichkeit gewesen wäre, sich der Bedeutung des »Textes« zu nähern) und viele der Kräuter wie ein Patchwork zusammengesetzt erscheinen.

Auch das gesamte Schriftsystem könnte in einer solchen Konzeption eine allein künstlerische Komposition sein. Zu entziffern wäre dann nichts daran, und die ganze analytische Mühe mit den Transkriptionen ginge am Geist eines Werkes vorbei, dessen Mitteilung völlig andere Komponenten unserer Bewusstheit anzusprechen sucht. Der bisherige Misserfolg dieser Mühe wäre so auch kein Wunder mehr.

Wäre das ein einmaliges Werk? Nein, es gibt sogar ein vergleichbares Werk aus der modernen Zeit, nämlich den Codex Seraphinianus des italienischen Künstlers Luigi Serafini. (Im Gegensatz zum Hinweis in der englischsprachigen Webseite ist das Buch nicht mehr erhältlich.) Auch hier werden fremdartige, aber doch an Vertrautes anklingende Illustrationen in einer unlesbaren Phantasieschrift »beschrieben«. Und das Befremden beim Betrachten ist ähnlich, nur dass hier völlig klar ist, dass es sich um künstlerischen Ausdruck handelt. Das hat allerdings einige »Leser« nicht davon abgehalten, sich sehr mit diesem Text zu beschäftigen.

Einen wichtigen Unterschied gibt es aber doch. Das Schriftsystem des Voynich-Manuskriptes ist bemerkenswert gut entworfen und wird über das gesamtes Manuskript hindurch ohne nennenswerte Abweichungen verwendet. Hingegen ist das »Schriftsystem« des Codex Seraphinianus während der Erstellung des Werkes sichtbar gewachsen und erfuhr beachtliche Modifikationen, und die daraus gebildeten »Wörter« weisen keine über das ganze Buch einheitlichen Bildungsgesetze auf.

Und irgendwie will eine derartige Gründlichkeit beim Entwurf des Schriftsystemes im Voynich-Manuskript dann doch nicht zur Schlampigkeit und Eile der Ausführung dieses Werkes passen.

Thema: Kunst | Kommentare (0)

Vergleich mit anderen Texten

Sonntag, 14. August 2005 2:28

Ein Problem bei Analysen von Transkriptionen des Voynich-Manuskiptes ist es, dass kein Vergleichsmaterial in »natürlichen« Sprachen zur Verfügung steht. Ein Analyse-Programm für eine Transkription erwartet doch ein sehr spezielles Format, und die händische Aufbereitung von bestehendem Textmaterial in diesem Format wäre sehr mühsam.

So etwas kann ein Computer besser. Und deshalb habe ich das Programm html2evt geschrieben, welches Dateien im HTML-Format in das richtige Format bringt. Allerdings bedient es sich zu diesem Zweck des Textbrowsers Lynx, was aber den angenehmen Nebeneffekt hat, dass auch direkt Texte aus dem Internet umgewandelt werden können. Hierzu muss einfach nur die URL als Parameter angegeben werden.

Eine kurze Dokumentation ist im Programm enthalten und kann mit perldoc extrahiert werden.

Thema: Hacking | Kommentare (0)

Du hast ja recht!

Dienstag, 9. August 2005 1:06

Frank, Du hast ja völlig recht. Die Links auf die RSS-Feeds da unten im Footer sind kaum zu sehen und deshalb auch kaum zu finden. Und ganz wie Du es vorgeschlagen hast, sind die Feeds jetzt an die rechte Seite gewandert, zusammen mit der ganz normalen Navigation in einem eigenen Punkt. Und dort sollte jetzt doch jeder leicht die RSS-Links finden können, und von dort aus sollte sich der Link auch leicht in eine entsprechende Software einkopieren lassen.

Und wenn da einer mit manchem Browser drauf klickt, dann darf er sich ein ordentliches XML-Dokument anschauen, was den meisten Menschen gewiss nicht zusagt. Aber wer gedankenlos auf jeden Link klickt, ohne den Linktext zu lesen, dem kann niemand mehr helfen. Auch die beste Navigation nicht.

Thema: Diverses | Kommentare (0)

Was war zuerst?

Dienstag, 9. August 2005 0:05

Eine Frage, die vielleicht manchem etwas sonderbar erscheint, ist die Frage nach der Reihenfolge, in der die einzelnen Seiten des Manuskriptes entstanden. Beinahe jede Seite enthält neben äußerst fremdartigem »Text« auch nicht weniger seltsame Illustrationen, und die Frage, die ich heute aufwerfen möchte, ist die folgende: Wurde beim Schreiben des Manuskriptes mit dem Text oder mit den Illustrationen begonnen.

Auf den meisten Seiten entsteht der Eindruck, dass der Text um die Illustrationen »herumfließt«, davon kann sich jeder selbst überzeugen. Und deshalb ist es eine schnelle Annahme, dass zunächst die Illustrationen wenigstens vorgezeichnet wurden, und anschließend erst der »Text« niedergeschrieben wurde.

Was daran zweifeln lässt, ist allerdings Seite f81r im biologischen Teil des Manuskriptes.

Der rechte »Rand« des Textes wirkt hier in einer Weise »flatterhaft«, wie es auf keiner anderen Seite beobachtet werden kann. Sicher, der Schreiber hat generell kaum Wert auf die Herstellung eines guten Layouts gelegt, und vieles an der Ausführung des Manuskriptes erweckt den starken Eindruck von Schlampigkeit und Eile — aber so einen rechten Rand sieht man denn doch nirgends. Wenn man diese Seite mit der Folgeseite f81v vergleicht, die im unteren Bereich einige badende Nymphen zeigt und dabei einen sehr abgeschlossen wirkenden rechten Rand hat, dann wirkt dieser Unterschied sehr auffallend.

Man möchte fast glauben, beim Schreiben der Seite f81r sei bewusst Platz für etwas gelassen worden, was erst nach dem Schreiben auf dem rechten Rand erstellt werden sollte — und aus unklaren Gründen ist es zu dieser Ausführung des Geplanten niemals gekommen. Und angesichts der Form dieser Ausbuchtung könnte hier durchaus eine für den biologischen Abschnitt typische Illustration mit in von Röhren verbundenen Becken badenden Nymphen geplant gewesen sein.

»Könnte«! Denn es ist nur eine Spekulation. Aber wenn die Spekulation zuträfe, dann wäre wenigstens ein Anteil der Illustrationen erst nach dem Schreiben gezeichnet worden, und das wäre etwas seltsam. Immerhin würde es erklären, warum der »Text« auf so vielen Seiten so gut passt. Das, worin er passen soll, entstand erst nach dem »Text«.

Thema: Spekulation | Kommentare (0)