Vergleich mit anderen Texten

Ein Problem bei Analysen von Transkriptionen des Voynich-Manuskiptes ist es, dass kein Vergleichsmaterial in »natürlichen« Sprachen zur Verfügung steht. Ein Analyse-Programm für eine Transkription erwartet doch ein sehr spezielles Format, und die händische Aufbereitung von bestehendem Textmaterial in diesem Format wäre sehr mühsam.

So etwas kann ein Computer besser. Und deshalb habe ich das Programm html2evt geschrieben, welches Dateien im HTML-Format in das richtige Format bringt. Allerdings bedient es sich zu diesem Zweck des Textbrowsers Lynx, was aber den angenehmen Nebeneffekt hat, dass auch direkt Texte aus dem Internet umgewandelt werden können. Hierzu muss einfach nur die URL als Parameter angegeben werden.

Eine kurze Dokumentation ist im Programm enthalten und kann mit perldoc extrahiert werden.

Tags »

Autor:
Datum: Sonntag, 14. August 2005 2:28
Trackback: Trackback-URL Themengebiet: Hacking

Feed zum Beitrag: RSS 2.0 Diesen Artikel kommentieren

Kommentar abgeben