Bộ dữ liệu · Benchmark 2026

Benchmark dịch LLM: Ba Lan → tiếng Việt (2026)

So sánh chất lượng dịch máy (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) cho cặp Ba Lan → Việt. Nghiên cứu do 100 AT thực hiện.

Ba Lan → Tiếng Việt · 4 systems · 2 judges

Phương pháp

Mỗi trong 4 hệ thống dịch đã dịch 4 văn bản nguồn từ tiếng Ba Lan sang tiếng Việt. Bản dịch được đánh giá bởi 2 giám khảo (GPT 5.4 XHigh và Claude 4.6 Sonnet) theo ba tiêu chí: Độ chính xác, Độ trôi chảy và Phong cách, trên thang điểm 1–10. Bảng hiển thị điểm trung bình.

Kết quả: Ba Lan → Tiếng Việt

Điểm trung bình (thang 1–10) do 2 giám khảo chấm cho 4 hệ thống dịch trên các văn bản Ba Lan‑Việt.

Hệ thống dịch GPT 5.4 (Giám khảo) Claude 4.6 (Giám khảo) Trung bình cuối
GPT 5.4 (XHigh)
8.90 9.17 9.04
Claude 4.6 Sonnet
9.30 8.92 9.11
Google Translate ref
7.40 7.75 7.58
DeepL ref
8.10 7.83 7.97

Kết luận chính

  1. 1

    Các mô hình AI (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) vượt trội rõ rệt so với các công cụ dịch truyền thống.

  2. 2

    Google Translate (7.58) có điểm thấp nhất ở cặp PL→VI, đặc biệt về phong cách và độ tự nhiên.

  3. 3

    DeepL (7.97) nằm ở khoảng giữa — tốt hơn Google nhưng kém xa các mô hình AI.

  4. 4

    Khoảng cách giữa AI tốt nhất và công cụ truyền thống tốt nhất vượt quá 1.1 điểm — chênh lệch chất lượng đáng kể.