My favorites | Sign in
Project Logo
Project hosting will be READ-ONLY Wednesday at 8am PST due to brief network maintenance.
                
Search
for
Updated Feb 04 (5 days ago) by myquartz
Introduction_Vietnamese  

Tổng quát

Dự án này cung cấp 1 gói, định nghĩa phương pháp gõ tiếng Việt Telex/VNI phổ biến tại VN, thông qua Scim-tables, giúp bạn gõ được tiếng Việt trên các hệ thống cài đặt scim và scim-tables.

Gói này sử dụng một phương pháp khác với các phần mềm gõ tiếng Việt hiện thời, đó là việc định nghĩa một loạt các cụm từ/ngữ hoặc vần có trong tiếng Việt tương ứng với mỗi cụm chữ gõ vào theo quy tắc Telex/VNI, nhừ là 1 từ điển, thay vì lập trình bằng một ngôn ngũ nào đó để tạo vần và bỏ dấu. Do không phải phần mềm độc lập, Scim-tables-Vietnamese-Ext này đòi hỏi phải có Scim và Scim-tables mới hoạt động được. Gói này hoạt động trên mọi nền tảng mà Scim/Scim-tables hoạt động được (Linux, AIX hay Solaris).

Bảng định nghĩa và các hạn chế

Hiện tại có khoảng gần 4000 cụm vần khác nhau được định nghĩa, cho cả chữ hoa, chữ thường và một số "vần" tiếng Anh, giúp bạn gõ được một số từ tiếng Anh lẫn với tiếng Việt mà không phải chuyển đổi chế độ gõ Anh/Việt.

Do việc phải định nghĩa cứng mọi cụm vần mà bạn cần gõ với Tiếng Việt, nên việc bỏ dấu của gói này hết sức cố định, cứng nhắc. Vị trí dấu bỏ được định nghĩa (ví dụ vần oà, oè) được lựa chọn là duy nhất khi định nghĩa. Ngoài ra, bảng mã chữ tiếng Việt cũng cố định là dạng Unicode UTF-8. Tất nhiên bạn có thể copy các cụm vần này và chuyển nó thành dạng mã tiếng Việt khác (ví dụ TCVN hay VNI), hoặc bạn có thể thay đổi vị trí bỏ dấu, nhưng như thế dẫn đến có nhiều "bảng định nghĩa" khác nhau, sẽ khó sửa đổi.

Ưu điểm của việc định nghĩa trước là do tôi chỉ định nghĩa các vần "có nghĩa" hoặc "tồn tại" trong tiếng Việt, tương tự như 1 từ điền các vần, nên bạn khó có thể gõ sai chính tả được. Ví dụ trong tiếng Việt không thể có cụm vần ềt hoặc ệc, vì thế, khi gõ Telex với các chữ eetf hoặc eecj sẽ không gõ được (tất nhiên, nếu là gõ ieecj ra iệc thì vẫn gõ được). Một số bộ gõ tốt khác cũng có tích hợp từ điển kiểu này để kiểm tra sự đúng đắn của từ được gõ.

Vì bị bó cứng theo từ điển, việc gõ lẫn tiếng Anh/Việt có thể bất tiện và được xử lý bằng cách định nghĩa thêm một số cụm vần tiếng Anh, ví dụ update (nếu tách làm 3 cụm, thì up không có nghĩa trong tiếng Việt, phải là úp, hoặc ụp, đòi hỏi gõ ký tự là dấu hợp lệ đi sau, upd sẽ không hợp lệ nếu gõ kiểu Telex hay VNI, nhưng vẫn được chấp nhận).

Quá khứ và tương lai

Gói này bắt đầu được xây dựng từ đầu năm 2007, khi tôi sử dụng Fedora 6 mà không cài được xvnkb. Scim là bộ gõ đa ngữ có trên Fedora 6 từ đó cho tới nay, nên tôi sử dụng chính Scim là môi trường để phát triển. Scim-tables và ví dụ của nó ở http://www.scim-im.org được tôi tìm thấy đầu tiên và tôi bắt đầu xây dựng bằng ví dụ ở đó.

Tôi hi vọng bảng định nghĩa này sẽ nằm trong bộ scim-tables, ở đó có 1 gói scim-tables-vietnamese nhưng chỉ có cách gõ VIQR và cũng rất đơn giản vì chỉ định nghĩa giới hạn một số nguyên âm, không bỏ dấu cuối từ.

Tôi cũng có ý tưởng đưa bảng định nghĩa sang Windows, dựa trên Windows IME sẵn có, nhưng chưa có nhiều thông tin về cái này. Có ý tưởng bạn có thể chia sẽ và giúp nó sống được trong môi trường Windows, nhất là các phiên bản mới như Windows Vista hoặc Windows Mobile.


Sign in to add a comment
Hosted by Google Code