Hinweise zum Mogeln
Name Zuletzt verändert Größe Beschreibung
[DIR] Parent Directory 31-Jan-2002 18:37 - Inhalt der CD
[DIR] 20010827/ 31-Jan-2002 21:17 - Beispieldateien für die Datenbank neu17
[DIR] 20011028/ 31-Jan-2002 21:18 - unklar und evtl. unvollständig
Anmerkungen
Zum Mogeln sind folgende Schritte notwendig:
- ggf. einen kleinen Korpus eintragen, der die gewünschten
Korpusbelege enthält. Details zu den einzelnen Schritten
können dem Abschlussbericht entnommen werden.
- mogel-de.txt und
mogel-en.txt schreiben
- index.xml anlegen
- bin/preproc.py ausführen
- Die als erkannt einzutragenden Phrasen werden in der Datei
phrases zusammengestellt.
Sie enthält je Phrase die deutschen und englischen Tag-Zeilen und
die Liste der Segment-IDs der Korpusbelege.
Die Segment-IDs können mit dem Skript
align/demo-qdb.py
ermittelt werden.
Siehe Dokumentation.
- Das Skript bin/mogel.py trägt
die Phrasen in die Datenbank ein. Aufruf:
mogel.py phrases
Die Dateien vom 28. Oktober 2001 dienen anscheint zum Eintragen des
Beispielkorpus für die Folien der Abschlusspräsentation.
Es ist aber nicht mehr bekannt, warum das Skript
phrase.py geschrieben wurde.
Joachim Wagner, 31. Januar 2002