LLM-Übersetzungsbenchmark: Polnisch → Vietnamesisch (2026)
Vergleich der Qualität maschineller Übersetzungen (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) für Polnisch → Vietnamesisch. Studie durchgeführt von 100 AT.
Methodik
Jedes der 4 Übersetzungssysteme übersetzte 4 Quelltexte vom Polnischen ins Vietnamesische. Die Übersetzungen wurden von 2 Juroren (GPT 5.4 XHigh und Claude 4.6 Sonnet) nach drei Kriterien bewertet: Genauigkeit, Flüssigkeit und Stil, auf einer Skala von 1–10. Die Tabelle zeigt die Durchschnittswerte.
Ergebnisse: Polnisch → Vietnamesisch
Durchschnittswerte (Skala 1–10), vergeben von 2 Juroren an 4 Übersetzungssysteme für polnisch‑vietnamesische Texte.
| Übersetzungssystem | GPT 5.4 (Juror) | Claude 4.6 (Juror) | Enddurchschnitt |
|---|---|---|---|
| GPT 5.4 (XHigh) | 8.90 | 9.17 | 9.04 |
| Claude 4.6 Sonnet | 9.30 | 8.92 | 9.11 |
| Google Translate ref | 7.40 | 7.75 | 7.58 |
| DeepL ref | 8.10 | 7.83 | 7.97 |
Wichtigste Erkenntnisse
- 1
KI‑Modelle (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) schneiden deutlich besser ab als klassische Übersetzungsmaschinen.
- 2
Google Translate (7.58) erzielt auf dem Paar PL→VI die niedrigste Bewertung, insbesondere bei Stil und Natürlichkeit.
- 3
DeepL (7.97) liegt dazwischen — besser als Google, aber deutlich hinter den KI‑Modellen.
- 4
Der Abstand zwischen der besten KI und der besten klassischen Engine beträgt über 1.1 Punkte — ein deutlicher Qualitätsunterschied.