Datensatz · Benchmark 2026

LLM-Übersetzungsbenchmark: Polnisch → Vietnamesisch (2026)

Vergleich der Qualität maschineller Übersetzungen (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) für Polnisch → Vietnamesisch. Studie durchgeführt von 100 AT.

Polnisch → Vietnamesisch · 4 systems · 2 judges

Methodik

Jedes der 4 Übersetzungssysteme übersetzte 4 Quelltexte vom Polnischen ins Vietnamesische. Die Übersetzungen wurden von 2 Juroren (GPT 5.4 XHigh und Claude 4.6 Sonnet) nach drei Kriterien bewertet: Genauigkeit, Flüssigkeit und Stil, auf einer Skala von 1–10. Die Tabelle zeigt die Durchschnittswerte.

Ergebnisse: Polnisch → Vietnamesisch

Durchschnittswerte (Skala 1–10), vergeben von 2 Juroren an 4 Übersetzungssysteme für polnisch‑vietnamesische Texte.

Übersetzungssystem GPT 5.4 (Juror) Claude 4.6 (Juror) Enddurchschnitt
GPT 5.4 (XHigh)
8.90 9.17 9.04
Claude 4.6 Sonnet
9.30 8.92 9.11
Google Translate ref
7.40 7.75 7.58
DeepL ref
8.10 7.83 7.97

Wichtigste Erkenntnisse

  1. 1

    KI‑Modelle (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) schneiden deutlich besser ab als klassische Übersetzungsmaschinen.

  2. 2

    Google Translate (7.58) erzielt auf dem Paar PL→VI die niedrigste Bewertung, insbesondere bei Stil und Natürlichkeit.

  3. 3

    DeepL (7.97) liegt dazwischen — besser als Google, aber deutlich hinter den KI‑Modellen.

  4. 4

    Der Abstand zwischen der besten KI und der besten klassischen Engine beträgt über 1.1 Punkte — ein deutlicher Qualitätsunterschied.