Benchmark dịch LLM: Ba Lan → tiếng Việt (2026)
So sánh chất lượng dịch máy (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) cho cặp Ba Lan → Việt. Nghiên cứu do 100 AT thực hiện.
Phương pháp
Mỗi trong 4 hệ thống dịch đã dịch 4 văn bản nguồn từ tiếng Ba Lan sang tiếng Việt. Bản dịch được đánh giá bởi 2 giám khảo (GPT 5.4 XHigh và Claude 4.6 Sonnet) theo ba tiêu chí: Độ chính xác, Độ trôi chảy và Phong cách, trên thang điểm 1–10. Bảng hiển thị điểm trung bình.
Kết quả: Ba Lan → Tiếng Việt
Điểm trung bình (thang 1–10) do 2 giám khảo chấm cho 4 hệ thống dịch trên các văn bản Ba Lan‑Việt.
| Hệ thống dịch | GPT 5.4 (Giám khảo) | Claude 4.6 (Giám khảo) | Trung bình cuối |
|---|---|---|---|
| GPT 5.4 (XHigh) | 8.90 | 9.17 | 9.04 |
| Claude 4.6 Sonnet | 9.30 | 8.92 | 9.11 |
| Google Translate ref | 7.40 | 7.75 | 7.58 |
| DeepL ref | 8.10 | 7.83 | 7.97 |
Kết luận chính
- 1
Các mô hình AI (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) vượt trội rõ rệt so với các công cụ dịch truyền thống.
- 2
Google Translate (7.58) có điểm thấp nhất ở cặp PL→VI, đặc biệt về phong cách và độ tự nhiên.
- 3
DeepL (7.97) nằm ở khoảng giữa — tốt hơn Google nhưng kém xa các mô hình AI.
- 4
Khoảng cách giữa AI tốt nhất và công cụ truyền thống tốt nhất vượt quá 1.1 điểm — chênh lệch chất lượng đáng kể.