Home / Sharenewshort / Translumo – Công cụ dịch màn hình thời gian thực tiên tiến dành cho game và video

Translumo – Công cụ dịch màn hình thời gian thực tiên tiến dành cho game và video

Giới thiệu chung

Translumo là một dự án mã nguồn mở (Apache 2.0) do tác giả ramjke phát triển, chuyên dịch văn bản trên màn hình máy tính theo thời gian thực. Công cụ này đặc biệt hướng tới người chơi game PC, những người cần đọc và dịch phụ đề, hội thoại, hoặc bất kỳ văn bản tĩnh nào xuất hiện trên màn hình — bao gồm cả phụ đề được “hardcode” (nhúng sẵn) trong video.

Translumo Banner

Tính đến thời điểm hiện tại, dự án đã đạt hơn 5.200 sao (stars), 302 fork238 lần commit trên GitHub — cho thấy mức độ quan tâm rất lớn từ cộng đồng người dùng toàn cầu.


Các chức năng chính của Translumo

Dưới đây là tổng hợp tất cả các chức năng và tính năng mà Translumo cung cấp dựa trên nội dung repository:

1. Nhận diện văn bản (OCR) với độ chính xác cao

Translumo cho phép kết hợp nhiều công cụ OCR đồng thời. Hệ thống sử dụng một mô hình Machine Learning (ML.NET) để chấm điểm kết quả OCR từ từng engine và tự động chọn ra kết quả tốt nhất. Điều này giúp giảm thiểu sai sót trong nhận diện văn bản, đặc biệt khi văn bản hiển thị trên nền phức tạp (như trong game).

OCR Engine Selection

Các engine OCR được tích hợp:

| Engine OCR | Trạng thái | Ghi chú |
|—|—|—|
| Windows OCR | ✅ Khuyến nghị | Tích hợp sẵn trong Windows, nhanh và chính xác nhất |
| Tesseract 5.2 | ⚠️ Legacy (cũ) | Chậm, nhiều lỗi nhận diện |
| EasyOCR | ⚠️ Legacy (cũ) | Còn chậm hơn Tesseract, đòi hỏi GPU NVIDIA và tài nguyên lớn |

Khuyến nghị từ tác giả: Nên chỉ sử dụng WindowsOCR. Tesseract và EasyOCR vẫn được giữ lại vì lý do lịch sử, nhưng không còn được khuyến khích sử dụng. Tesseract cũ, chậm và tạo nhiều lỗi. EasyOCR thậm chí còn chậm hơn, đòi hỏi tài nguyên đáng kể (kể cả GPU cụ thể) và thường dẫn đến lỗi.

2. Hỗ trợ dịch thuật qua nhiều dịch vụ

Translumo tích hợp 4 dịch vụ dịch thuật khác nhau:

  • DeepL (khuyến nghị) — chất lượng dịch cao nhất
  • Google Translate — phổ biến, hỗ trợ nhiều ngôn ngữ
  • Yandex Translate — dịch vụ từ Nga
  • Naver Papago — đặc biệt tốt cho tiếng Hàn, tiếng Nhật

3. Danh sách ngôn ngữ hỗ trợ nhận diện (OCR)

Translumo hỗ trợ nhận diện 5 ngôn ngữ:

  • Tiếng Anh (English)
  • Tiếng Nga (Russian)
  • Tiếng Nhật (Japanese)
  • Tiếng Trung giản thể (Chinese Simplified)
  • Tiếng Hàn (Korean)

4. Danh sách ngôn ngữ hỗ trợ dịch

Phía dịch thuật hỗ trợ rất nhiều ngôn ngữ đầu ra, bao gồm:

English, Russian, Japanese, Chinese (Simplified), Korean, French, Spanish, German, Portuguese, Italian, Vietnamese, Thai, Turkish, Arabic, Greek, Brazilian Portuguese, Polish, Belarusian, Persian, Indonesian, Bulgarian, Czech, Danish, Estonian, Finnish, Hungarian, Lithuanian, Latvian, Dutch, Romanian, Slovak, Slovenian, Swedish, Ukrainian.

Trong đó có tiếng Việt — đây là tin tốt cho người dùng Việt Nam muốn dịch các ngôn ngữ khác sang tiếng Việt.

5. Hướng tới game (Game Oriented)

Translumo được thiết kế đặc biệt cho việc dịch thời gian thực trong game PC, nhưng cũng hoạt động trên bất kỳ vùng nào của màn hình với bất kỳ ứng dụng nào. Người dùng chỉ cần chọn vùng cần dịch, phần mềm sẽ tự động chụp màn hình, nhận diện văn bản và dịch liên tục.

6. Độ trễ thấp (Low Latency)

Nhiều tối ưu hóa telah được áp dụng để giảm tác động lên hệ thốnggiảm thiểu độ trễ giữa thời điểm văn bản xuất hiện trên màn hình và thời điểm bản dịch hiển thị. Điều này cực kỳ quan trọng khi chơi game, nơi văn bản (như hội thoại NPC, hệ thống thông báo) thay đổi liên tục.

7. Chọn vùng chụp màn hình tùy chỉnh

  • Người dùng có thể tự định nghĩa vùng chụp bằng phím tắt Alt+Q.
  • Khuyến nghị: chọn vùng nhỏ nhất có thể để giảm xác suất nhận diện nhầm ký tự từ nền, đồng thời tăng tốc độ xử lý vì khung hình lớn sẽ mất nhiều thời gian hơn.

8. Hỗ trợ Proxy để tránh bị chặn

Một số dịch vụ dịch thuật có thể chặn client gửi quá nhiều request. Translumo cho phép cấu hình danh sách proxy IPv4 (cá nhân hoặc dùng chung, chỉ cần 1-2 proxy) trong tab Languages → Proxy. Ứng dụng sẽ luân phiên xen kẽ các proxy để giảm số lượng request từ một địa chỉ IP duy nhất.

9. Hiển thị bản dịch dạng overlay

Bản dịch được hiển thị dưới dạng overlay trực tiếp trên màn hình, cho phép người dùng đọc bản dịch mà không cần chuyển cửa sổ.

  • Lưu ý: Để overlay hiển thị đúng trong game, game cần chạy ở chế độ Borderless hoặc Windowed (không phải Fullscreen).
  • Nếu game không hỗ trợ, tác giả gợi ý sử dụng công cụ Borderless Gaming.

10. Các phím tắt (Hotkeys)

| Phím tắt | Chức năng |
|—|—|
| Alt+G | Mở Cài đặt (Settings) |
| Alt+Q | Chọn vùng chụp màn hình (capture area) |
| ~ (dấu ngã) | Bắt đầu / chạy dịch thuật |
| Alt+T | Ẩn/hiện cửa sổ bản dịch (mặc định) |

11. Xử lý sự cố (FAQ tích hợp)

Translumo cung cấp sẵn các câu hỏi thường gặp và cách xử lý:

  • Lỗi “Failed to capture screen”: Đảm bảo cửa sổ đích đang active, khởi động lại Translumo hoặc mở lại cửa sổ đích.
  • Cửa sổ dịch nằm dưới game: Nhấn Alt+T để ẩn/hiện cửa sổ dịch.
  • Lỗi tải EasyOCR: Thử cài lại khi đã kết nối VPN.
  • Phím tắt không hoạt động: Có thể ứng dụng khác đang chiếm phím tắt.
  • Lỗi “Text detection failed” với Tesseract: Đảm bảo đường dẫn ứng dụng chỉ chứa ký tự Latinh.

Demo hoạt động

Translumo Demo Preview

Ảnh GIF trên minh họa toàn bộ quy trình hoạt động: từ lúc chọn vùng chụp, nhận diện văn bản trên màn hình, cho đến khi bản dịch hiển thị dạng overlay.


Yêu cầu hệ thống

Cấu hình tối thiểu (khi dùng Tesseract và Windows OCR)

| Yêu cầu | Chi tiết |
|—|—|
| Hệ điều hành | Windows 10 phiên bản 2004 (build 19041) trở lên, hoặc Windows 11 |
| GPU | Tương thích DirectX 11 |
| RAM | 2 GB |

Cấu hình tối thiểu (khi dùng EasyOCR)

| Yêu cầu | Chi tiết |
|—|—|
| GPU | NVIDIA hỗ trợ CUDA SDK 11.8 (GTX 750, 8xxM, 9xx series trở lên) |
| RAM | 8 GB |
| Ổ cứng | Ít nhất 5 GB dung lượng trống |


Hướng dẫn sử dụng nhanh

  1. Mở Cài đặt bằng phím tắt Alt+G.
  2. Chọn ngôn ngữ nguồn (để OCR nhận diện) và ngôn ngữ đích (để dịch sang).
  3. Chọn engine OCR — khuyến nghị chỉ dùng WindowsOCR.
  4. Định nghĩa vùng chụp: nhấn Alt+Q và kéo chọn vùng trên màn hình cần dịch.
  5. Chạy dịch thuật bằng phím ~ (dấu ngã).

Thông tin kỹ thuật

| Thông tin | Chi tiết |
|—|—|
| Ngôn ngữ lập trình chính | C# (chiếm 99.6%), Batchfile (0.4%) |
| Framework | .NET 8 SDK |
| IDE yêu cầu | Visual Studio 2022 |
| License | Apache 2.0 |
| Phiên bản mới nhất | v1.0.2 (phát hành 15/09/2025) |
| Số lượng release | 10 releases |
| Số lượng commit | 238 commits |

Build từ source

git clone https://github.com/ramjke/Translumo.git

Lưu ý: Trong quá trình build, file binaries_extract.bat sẽ tự động tải và giải nén models và Python binaries (~400 MB) vào thư mục output.

Các thư viện được sử dụng (Credits)


Tải xuống

Link tải trực tiếp phiên bản mới nhất:

🔗 Translumo_1.0.2.zip

Sau khi tải về, giải nén file ZIP và chạy Translumo.exe.


Kết luận

Translumo là một công cụ rất mạnh mẽ và trựcဆ giác dành cho bất kỳ ai cần dịch văn bản trên màn hình PC theo thời gian thực. Với khả năng kết hợp nhiều OCR engine bằng Machine Learning, hỗ trợ nhiều ngôn ngữ (bao gồm cả tiếng Việt), độ trễ thấpgiao diện thân thiện, Translumo xứng đáng là một trong những lựa chọn hàng đầu cho game thủ, người học ngôn ngữ, hoặc bất kỳ ai làm việc với nội dung đa ngôn ngữ trên máy tính.

Đặc biệt, việc dự án hoàn toàn mã nguồn mở theo giấy phép Apache 2.0, cộng với việc hỗ trợ tiếng Việt trên phía dịch thuật, khiến Translumo trở thành một công cụ cực kỳ hữu ích cho cộng đồng người dùng Việt Nam.


Source link: Translumo – ramjke

Leave a Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *