Dataset · Benchmark 2026

Бенчмарк перекладів LLM: польська → в'єтнамська (2026)

Порівняння якості машинних перекладів (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) на маршруті польська → в'єтнамська. Дослідження проведено 100 AT.

Польська → В'єтнамська · 4 системи · 2 судді

Методологія

Кожна з 4 систем перекладу переклала 4 вихідних тексти з польської на в'єтнамську. Переклади оцінили 2 судді (GPT 5.4 XHigh і Claude 4.6 Sonnet) за трьома критеріями: Точність, Плавність та Стиль за шкалою 1–10. Таблиця показує усереднені результати.

Результати: Польська → В'єтнамська

Середні оцінки (шкала 1–10), виставлені 2 суддями 4 системам перекладу на польсько-в'єтнамських текстах.

Система перекладу GPT 5.4 (Суддя) Claude 4.6 (Суддя) Фінальне середнє
GPT 5.4 (XHigh)
8.90 9.17 9.04
Claude 4.6 Sonnet
9.30 8.92 9.11
Google Translate ref
7.40 7.75 7.58
DeepL ref
8.10 7.83 7.97

Ключові висновки

  1. 1

    Моделі AI (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) значно перевершують класичні системи перекладу.

  2. 2

    Google Translate (7.58) показує найнижчий результат на парі PL→VI, особливо в категорії стилю та природності.

  3. 3

    DeepL (7.97) посідає проміжне місце — кращий за Google, але значно поступається моделям AI.

  4. 4

    Різниця між найкращим AI та найкращим класичним рушієм становить понад 1.1 бала — суттєва різниця в якості.