Wortweise

Es scheint sinnvoll, die Folge der einzelnen Wörter einer Analyse zu unterwerfen. Zu diesem Zweck habe ich drei einfache Programme geschrieben. Diese werde ich ebenfalls als elementare Tools für weitere Analysen verwenden.

Alle Programme sind dokumentiert, die Dokumentation kann mit dem perldoc-Tool extrahiert werden. Des weiteren liegt eine kurze Einführung in englischer Sprache bei.

Es ist empfehlenswert, diese Programme in den Suchpfad für Kommandos zu kopieren.

  • wsplit zerlegt einen Text in einzelne Wörter, wobei jedes Wort in einer eigenen Zeile ausgegeben wird. Kommentare einer Transkription werden dabei entfernt. Über Optionen können Wörter mit Asterisk und Passagen in eckigen Klammern ausgeschlossen werden.
  • wdup zählt aufeinanderfolgende identische Wörter, die ja im Manuskript außerordentlich häufig sind. Es kann aber auch für andere Zwecke benutzt werden.
  • shuffle mischt die Zeilen einer Eingabedatei durch, bringt sie also in eine zufällige, neue Reihenfolge.
Tags »

Autor:
Datum: Mittwoch, 3. August 2005 2:20
Trackback: Trackback-URL Themengebiet: Hacking

Feed zum Beitrag: RSS 2.0 Diesen Artikel kommentieren

Kommentar abgeben