Benchmark des traductions LLM : polonais → vietnamien (2026)
Comparaison de la qualité de la traduction automatique (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) pour la paire polonais → vietnamien. Étude menée par 100 AT.
Méthodologie
Chacun des 4 systèmes de traduction a traduit 4 textes sources du polonais vers le vietnamien. Les traductions ont été évaluées par 2 juges (GPT 5.4 XHigh et Claude 4.6 Sonnet) selon trois critères : Exactitude, Fluidité et Style, sur une échelle de 1 à 10. Le tableau présente les scores moyens.
Résultats : Polonais → Vietnamien
Scores moyens (échelle 1–10) attribués par 2 juges à 4 systèmes de traduction sur des textes polono‑vietnamiens.
| Système de traduction | GPT 5.4 (Juge) | Claude 4.6 (Juge) | Moyenne finale |
|---|---|---|---|
| GPT 5.4 (XHigh) | 8.90 | 9.17 | 9.04 |
| Claude 4.6 Sonnet | 9.30 | 8.92 | 9.11 |
| Google Translate ref | 7.40 | 7.75 | 7.58 |
| DeepL ref | 8.10 | 7.83 | 7.97 |
Principales conclusions
- 1
Les modèles IA (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) surpassent nettement les moteurs de traduction traditionnels.
- 2
Google Translate (7.58) obtient le score le plus bas sur la paire PL→VI, notamment en style et en naturel.
- 3
DeepL (7.97) se situe entre les deux — meilleur que Google mais nettement derrière les modèles IA.
- 4
L’écart entre le meilleur modèle IA et le meilleur moteur traditionnel dépasse 1.1 point — une différence de qualité notable.