Tầm nhìn

Ba trụ cột của dự án

Không chỉ là từ điển — đây là dự án bảo tồn ký ức, kết nối thế hệ và đưa ngôn ngữ dân tộc vào thế giới số.

🌿

Bảo tồn

Hơn 1,4 triệu người Mường ở Việt Nam, nhưng chưa có từ điển số hóa toàn diện. Thế hệ trẻ ngày càng ít dùng tiếng mẹ đẻ. Người cao tuổi — những người giữ giọng chuẩn nhất — dần ra đi. Mỗi ngày không ghi lại là một ngày mất mát vĩnh viễn.
🤝

Kết nối

Không có "tiếng Mường chuẩn" — và không nên có. Mường Hòa Bình nói khác Mường Thanh Hóa, và cả hai đều đúng. Dự án kết nối người bản ngữ với nhà nghiên cứu, thế hệ trẻ với ông bà, cộng đồng trong nước với người Mường xa quê.
🌍

Hội nhập

Mục tiêu dài hạn: đưa tiếng Mường lên Google Translate, vào các hệ thống AI đa ngôn ngữ, vào chương trình giảng dạy. Toàn bộ dữ liệu phát hành mã nguồn mở CC-BY để bất kỳ ai cũng có thể tiếp tục phát triển.

Triển vọng

Lộ trình 5 giai đoạn

Từ một trang web đơn giản đến một ngôn ngữ được Google Translate hỗ trợ — rõ ràng, từng bước một.

Giai đoạn 1 · 2025

Xây dựng nền tảng

Thiết kế website, hệ thống đóng góp từ vựng có kiểm duyệt theo vùng phương ngữ, brand guideline với logo cạp váy Mường, component system nhất quán.

Đã hoàn thành

Giai đoạn 2 · 2025 · Đang diễn ra

Thu thập từ vựng & audio

Mục tiêu 5.000 từ vựng cơ bản được người bản ngữ xác nhận từ ít nhất 2 vùng. Ưu tiên thu âm giọng người cao tuổi tại Tân Lạc (Hòa Bình) và Ngọc Lặc (Thanh Hóa).

4.128 / 5.000 từ · Đang tiến hành
3

Giai đoạn 3 · 2026

Xây dựng kho câu song ngữ

Từ kho từ vựng đã có, xây dựng 50.000 cặp câu Việt–Mường hoàn chỉnh. Tổ chức các buổi thu thập thực địa định kỳ tại cộng đồng người Mường ở Hòa Bình, Thanh Hóa, Phú Thọ.

4

Giai đoạn 4 · 2027

Nộp lên Google Translate Community

Nộp dữ liệu theo quy trình chính thức. Đồng thời phát hành toàn bộ dataset dưới giấy phép CC-BY để cộng đồng nghiên cứu ngôn ngữ học toàn cầu tiếp cận.

5

Giai đoạn 5 · Dài hạn

Mô hình dịch thuật tự chủ

Xây dựng mô hình NMT (Neural Machine Translation) riêng cho tiếng Mường — không phụ thuộc AI bên ngoài, dịch nhanh và chính xác, tích hợp được vào ứng dụng di động và hệ thống giáo dục.

Hành động

Bạn có thể làm gì ngay hôm nay?

Mỗi người một cách tham gia. Không cần biết lập trình, không cần là nhà nghiên cứu.

✍️

Đóng góp từ vựng

Nhập từ tiếng Việt và cách nói trong tiếng Mường của vùng bạn. 2 phút mỗi từ.

Cần người Mường
🎙️

Ghi âm phát âm

Điện thoại là đủ. Ưu tiên giọng người cao tuổi bản địa — quý nhất, hiếm nhất.

Cần người Mường

Kiểm duyệt từ

Bình chọn từ đúng / sai của người cùng vùng. Không tốn nhiều thời gian.

Cần người Mường
📢

Chia sẻ dự án

Giới thiệu cho người Mường bạn biết, đặc biệt người cao tuổi biết nhiều từ cổ.

Ai cũng làm được

Đóng góp tài chính

Tiền đi đâu, dùng vào việc gì, do ai quản lý — đều công khai cụ thể.

Câu hỏi thường gặp

Bạn muốn biết thêm?

Tiếng Mường là ngôn ngữ của hơn 1,4 triệu người Việt Nam nhưng chưa có từ điển số hóa toàn diện và chưa có mặt trên Google Translate. Thế hệ trẻ người Mường ngày càng ít nói tiếng mẹ đẻ, trong khi người cao tuổi đang dần ra đi. Dự án ra đời để ghi lại trước khi quá muộn — và để cộng đồng người Mường tự xây dựng di sản số của chính mình.

Logo lấy cảm hứng trực tiếp từ hoa văn cạp váy Mường — di sản phi vật thể đặc trưng nhất của người Mường. Hình thoi 4 góc là motif trung tâm của cạp váy, tượng trưng cho 4 vùng phương ngữ. Đường kẻ vàng là hoa văn thổ cẩm. Vòng tròn trung tâm rỗng biểu trưng cho sự tiếp nối — ngôn ngữ sống là ngôn ngữ còn được truyền đi.

Tiếng Việt "chuẩn" có được nhờ chuẩn hóa hàng thế kỷ, lấy giọng Hà Nội làm trung tâm. Tiếng Mường chưa trải qua quá trình đó. Bộ chữ viết đầu tiên mới được UBND tỉnh Hòa Bình phê duyệt năm 2016. Dự án này không chọn phương ngữ chuẩn — thay vào đó ghi nhận tất cả biến thể với nhãn rõ ràng, không phán xét.

Google Translate hỗ trợ ngôn ngữ mới qua Google Translate Community khi có đủ dữ liệu song ngữ được người bản ngữ xác nhận. Mục tiêu là đạt 50.000 cặp câu Việt–Mường, sau đó nộp theo quy trình chính thức. Toàn bộ dataset phát hành CC-BY.

Tiền chuyển trực tiếp qua tài khoản chính thức của Hội Văn học Nghệ thuật tỉnh Phú Thọ hoặc Sở VHTTDL — không qua tài khoản cá nhân. Sau mỗi dự án sẽ có báo cáo ảnh/video công khai trên website.

Hoàn toàn có thể: chia sẻ dự án, ủng hộ qua Buy Me a Coffee, hoặc tham gia kiểm tra giao diện. Riêng việc đóng góp từ vựng và kiểm duyệt cần là người bản ngữ hoặc có hiểu biết thực tế về tiếng Mường vùng đó.

Toàn bộ dữ liệu phát hành dưới Creative Commons CC-BY 4.0 — ai cũng dùng được miễn phí, kể cả thương mại, với điều kiện ghi nguồn "Tiếng Mường — muong.wiki". Cam kết mã nguồn mở lâu dài.

Sẵn sàng đồng hành?

Dù bạn nói tiếng Mường hay không — đều có cách để góp phần.