Re: Übersetzen
sps-concept schrieb:
Das gilt insbesondere für Netzwerktitel usw. Hier können erst komplette Zeilen (mit Platzhalterfunktion) übersetzt werden und danach die restlichen Zeilen Wort für Wort. Eine Fehlwortliste wird ausgegeben. Wie macht ihr eure Übersetzungen? Die erste Stufe der Übersetzung ist sinnig bei Frequenzumrichter Station __ Störung u ä.
Ein paar Anregungen:
Ich habe vor Jahren mal ein schwedisches Kochbuch ins Deutsche übersetzt, ohne eigentlich Schwedisch zu können. Ich habe mir ein Programm gemacht, das so vorging: Es schaut in eine Tabelle schwedisch-deutsch nach dem längsten passenden Ausdruck. Das kann ein Wort, ein ganzer Satz, 4 Worte oder auch nur der Bruchteil eines Wortes (milch in Milchbrötchen) sein.
Ich habe einfach mit der leeren Tabelle angefangen. Das Programm ersetzt was es findet und meldet sich entweder beim 1. nicht gefundenen Wort.oder markiert die alle. Danach ergänzt man die Tabelle und startet es von vorne. So "lernt" es dazu. Das Ergebnis war erstaunlich gut, da auch in Kochrezepten typische Wendungen aus 2 bis 5 Wörtern immer wieder vorkommen.
An anderer Stelle habe ich mal eine fehlertolerante Suche nach Artikeln programmiert.
Beim Vergleich habe ich 2 Methoden angewandt, Abweichungen von der genauen Schreibweise zuzulassen:
Zunächst werden nicht die Worte an sich, sondern eine vereinfachte From davon verglichen. Für Deutsch z.B.:
- Ersetze alle "ä" durch "a" ersetze alle "ae" durch "a".
- Ersetze alle Doppelkonsonanten durch einfache.
- Ersetze k, und z durch c.
- Ersetze y,v und ü durch u.
Der Vergleich findet mit der vereinfachten Form von Suchbegriff und Muster statt.
Je nach Sprache und Randbedingungen kann man da weitere Regeln einbauen
Das ist für gedruckte Werke nicht SO nützlich, aber für von Hand getippte sehr: Ich habe die Regel verwendet "Ersetze 5 durch S". Das fand viele Dinge, wo eine Bestellnummer oder Typenbezeichnung von unleserlicher Handschrift abgetippt worden war...
Das zweite ist die Levenstein-Distanz. Sie mißt den Abstand zweier Worte dadurch, daß man zählt, wieviele Zeichen man minimal auslassen, einfügen oder ersetzen muß. Das kann man dann noch gewichten, in der Art, daß die Ersetzung eines "v" durch ein "w" (lautlich ähnlich) oder "m" durch"n" (Schriftbild ähnlich, nebeneinander auf der Tastatur) weniger zählt als andere Ersetzungen.