Dịch ngôn ngữ Teen Việt - Teen (1 người xem)

Liên hệ QC

Người dùng đang xem chủ đề này

hungns.k19

Thành viên mới
Tham gia
15/11/13
Bài viết
5
Được thích
3
Xin chào cả nhà.
Tôi thấy ngôn ngữ teen đã đánh đố rất nhiều bậc phụ huynh và cũng có 1 số nghiên cứu về nội dung này nhưng chưa thật sự tiện dụng. Vì vậy xin mạo mội đưa ra đây để mọi người cùng tham gia đề tài mở này:
1. Về ngôn ngữ teen:
- viết tắt, ghép, thay thế ký hiệu,... theo ý nghĩa của người viết. vd: 2a = chào anh, g9 = chúc ngủ ngon,...
- Ngôn ngữ vùng miền
- Ngữ pháp giữ nguyên
2. Đề tài mở:
- Viết 1 công cụ để dịch từ ngôn ngữ teen sang tiếng việt chuẩn và ngược lại
- Thuật toán:
+ Xây dựng 2 bộ từ điển:
> Từ hoàn chỉnh: những từ dùng chung nhất đã được chấp nhận và diễn giải thành cụm từ tương ứng.
> Từ cắt ghép: những từ chèn ký tự lạ (đầu, giữa, cuối), từ có nhiều nghĩa (vd: tk = thích, thank; ko = không, knock-out - hạ đo ván,...) dùng gợi ý theo văn cảnh.
+ Nếu tìm được từ hoàn chỉnh thì đưa ra ngay. Nếu không tìm được thì đưa từ gốc và đưa ra 2-5 gợi ý (tham số) có đánh giá mức độ hợp lý nhất (rank)
Hiện tại, tôi đã sưu tầm được 1 bộ từ điển Teen và xây dựng 1 công cụ dịch nhưng chưa hoàn chỉnh phần gợi ý. File excel+vba đính kèm.
Xin mời các cao thủ cùng ra tay với Đề tài mở này. Hy vọng hữu ích cho các vị phụ huynh.
 

File đính kèm

Chỉnh sửa lần cuối bởi điều hành viên:
Mời các cao thủ góp ý cho phần cắt và xử lý chuỗi cho các ký tự đầu, giữa, cuối
để xử lý các ký tự lạ với.
 
Upvote 0
Mời các cao thủ góp ý cho phần cắt và xử lý chuỗi cho các ký tự đầu, giữa, cuối
để xử lý các ký tự lạ với.

Thật lòng mà nói: Mình không cảm thấy chương trình này có lợi ích gì cả (nên rất lười xem)
Những ai muốn giao tiếp với người khác thông qua văn viết thì đương nhiên phải cố mà viết sao cho trong sáng, dễ hiểu nhất. Chẳng lẽ viết "tào lao" gì đó rồi bắt người ta phải "dịch" và hiểu ý mình sao?
Viết theo kiểu TEEN, người khác không hiểu thì mình ráng chịu thôi (đâu có ai bắt mình viết theo kiểu này)
 
Upvote 0
Đầu tiên fải ngâm cứu thế nào là TEEN & gì là ngôn ngữ TEEN?

TEEN của 10 năm trước khác với bây giờ & TEEN của 10 năm tới sẽ khác xa bây giờ

TEEN là cái gì đó rất tạm bợ, mơ hồ & chảnh & fá cách so với chúng bạn cùng trang lứa.

TEEN chỉ là nhóm nhỏ trong cộng đồng cùng trang lứa;

TEEN không đại diện cho toàn thể cộng đồng cùng trang lứa!



Đó là mình nghỉ vậy;

Mà đã như vậy thì không đáng làm từ điển cho nhóm này!


/(hà, Khà, khà,. . . . .
-=.,, -=.,, -=.,,
 
Upvote 0
Nếu ai có cái nhìn thoáng và tích cực sẽ thấy cách dùng bộ alphabet nguyên thủy để diễn đạt (không phải bộ chữ được chế thêm nhưng chữ quốc ngữ hiện nay) rất phù hợp trong việc lưu trữ, trao đổi và xử lý.
...
Sự sáng tạo của giới trẻ trong việc dùng bộ chữ Latinh chuẩn để truyền đạt thông tin có thể đem lại nhiều gợi ý hay cho việc phát triển bộ chữ quốc tinh giản và hợp với chuẩn lưu trữ dữ liệu ASCII cơ bản của máy tính.

Sáng tạo thì có sáng tạo. Nhưng "phát triển" thì có lẽ "nghiên cứu" của quý vị đề cao tinh thần của "teen" không đúng chỗ.
Họ chỉ ra cái ngôn ngữ này với mục đích text cho lẹ thôi.

Riêng về chuyện phê bình "các nhà sáng lập chữ quốc ngữ" thì quý vị nên nghiên cứu văn học sử cho chỉnh đã. Trên thế giới thiếu gì loại chữ sử dụng bộ ký tự không "Latinh chuẩn" (sic). Người Đức, Pháp, Đông Âu, Bắc Âu,... thấy họ có phiền hà gì đâu?

...
Mà đã như vậy thì không đáng làm từ điển cho nhóm này!

Đáng chứ. Nhưng mà để đợi lúc tôi có tiền rủng rỉnh, muốn theo mốt kiếm bồ nhí cho vui tuổi già. Bây giờ đang chạy gạo bở hơi tai, học cách nói chuyện giao tiếp hằng ngày cho mọi đối tác hiểu nhau cũng đủ mệt rồi.
 
Upvote 0
--> A dg o trg ch e
--> Anh dang o truong cho em
--> Nọc nó ra mà đánh!
 
Upvote 0
--> A dg o trg ch e
--> Anh dang o truong cho em
--> Nọc nó ra mà đánh!

Chỉ cần không có dấu thôi là có chuyện rồi nè
Nhân ngày 8-3 chàng nhắn tin cho nàng

"Em dung la nguoi con gai dam dang, anh yeu em vi em that dam dang."

Anh ta muốn nói là cô ấy thật đảm đang vậy mà lúc đọc cô ta lại hiểu là dâm đảng.

Và sau đó.... chuyện gì tới phải tới thôi.
 
Upvote 0
Cảm ơn các các thủ đã có ý voi, nhưng đây là hiện tượng xã hội nó bị biến dạng mà các bác không chấp nhận nó vẫn xảy ra. Như các bác xem phim Trò đời đầu thế kỷ ấy: văn minh là phải Toa, Moa,... họ muốn phá vỡ cái cũ để khẳng định cái mới. Đây là cái tất nhiên và đã có bác nào điều chỉnh, uốn nắn được nó đâu nên trước hết hãy hiểu nó đã.
Việc nghiên cứu nó để giúp phụ huynh hiểu con cái họ chứ nếu họ bỏ ngoài tai những cái này thì hậu quả thế nào các bác thử cho nhận xét nhé.
Ngoài ra, về mặt kỹ thuật tôi thấy đây như 1 bài mẫu về việc trích chọn dữ liệu từ các bảng số liệu với việc xử lý ngôn ngữ tự nhiên và đưa ra gợi ý có giá trị cao nhất.
Rất mong các bác có ý kiến thêm.

TEEN của 10 năm trước khác với bây giờ & TEEN của 10 năm tới sẽ khác xa bây giờ

TEEN là cái gì đó rất tạm bợ, mơ hồ & chảnh & fá cách so với chúng bạn cùng trang lứa.

TEEN chỉ là nhóm nhỏ trong cộng đồng cùng trang lứa;

TEEN không đại diện cho toàn thể cộng đồng cùng trang lứa!



Đó là mình nghỉ vậy;

Mà đã như vậy thì không đáng làm từ điển cho nhóm này!


/(hà, Khà, khà,. . . . .
-=.,, -=.,, -=.,,

Cảm ơn bạn đã có ý kiến và chúc bạn là người cha/mẹ tốt dạy dỗ mọi điều hay lẽ phải (theo ý kiến riêng của ban) và kiểm soát chặt chẽ mọi hành động của con cái (cũng theo kiểu của bạn) để con bạn tránh xa cái cộng đồng cùng trang lứa như bạn chỉ trích.
Đây không phải lời khuyên, nhưng là điều tôi cần nói: hãy thử là người trong cuộc để cảm nhận và hành động.
Cảm ơn một lần nữa.
 
Chỉnh sửa lần cuối bởi điều hành viên:
Upvote 0
Chỉ cần không có dấu thôi là có chuyện rồi nè
Nhân ngày 8-3 chàng nhắn tin cho nàng

"Em dung la nguoi con gai dam dang, anh yeu em vi em that dam dang."

Anh ta muốn nói là cô ấy thật đảm đang vậy mà lúc đọc cô ta lại hiểu là dâm đảng.

Và sau đó.... chuyện gì tới phải tới thôi.
Cám ơn anh đã đưa ra một ví dụ hay. Rõ ràng là bộ chứ này không tương thích lắm với các thiết bị công nghệ, có khi còn gây ra hiểu nhầm tai hải nữa phải không anh Hải?

Nếu chữ quốc ngữ hiện tại tương thích tốt thì tại sao người ta ko nhắn tin đầy đủ dấu bằng chữ quốc ngữ mà phải dùng chữ cái giản lược thế này?
 
Lần chỉnh sửa cuối:
Upvote 0
Bạn nói sai rùi, tiếng ả rập, TQ còn đưa lên máy tính được sao tiếng mình lại không đưa lên được nhỉ. Trước tiên phải trách mình chứ trách IBM, Microsoft,... làm sao được.
Nói chung là: bạn muốn tạo một tự điển Teen như thế nào, cho ví dụ cụ thể đi.
Nếu bạn so sánh Ả Rập hay TQ nào đó thì chẳng tôn trọng 2000 văn hóa VN rồi, Ả Rập là Ả Rập, TQ là TQ và An Nam là An Nam, bạn muốn An Nam là Ả Rập... sao?
Hình như bạn chỉ biết nói mà chẳng có một chút gợi ý nào.
Ví dụ:
ở trường và ở truồng thì tự điển Teen viết như thế nào?
Teen và sixteen đọc và hiểu ra sao?
Nếu không có gì là chuẩn mực và đại chúng thì chỉ là... híc. D ch d.
 
Lần chỉnh sửa cuối:
Upvote 0
Nói chung là: bạn muốn tạo một tự điển Teen như thế nào, cho ví dụ cụ thể đi.
Nếu bạn so sánh Ả Rập hay TQ nào đó thì chẳng tôn trọng 2000 văn hóa VN rồi, Ả Rập là Ả Rập, TQ là TQ và An Nam là An Nam, bạn muốn An Nam là Ả Rập... sao?
Hình như bạn chỉ biết nói mà chẳng có một chút gợi ý nào.
Ví dụ:
ở trường và ở truồng thì tự điển Teen viết như thế nào?
Teen và sixteen đọc và hiểu ra sao?
Nếu không có gì là chuẩn mực và đại chúng thì chỉ là... híc. D ch d.

Cảm ơn các bác đã tham gia chứ tôi thấy 1 học sinh lớp 9 làm 1 đề tài như vậy rồi nhưng chưa tiện dụng và chưa làm phần gợi ý cho câu tiếng Việt để có thể hiểu được. Các Bác xem bài các này nhé: Loạn ngôn ngữ tuổi teen
,Dương Đăng Trúc Khuyên cô “Phù thủy nhỏ” giải mã…teen để biết tại sao tôi đưa đề tài này ra nhé.
Còn về công cụ tôi đã dựng 2 bảng tra:
1. Từ hoàn chỉnh: để chứa các từ đối chiếu là đưa ra ngay được bản dịch
2. Từ cắt ghép: là định nghĩa các từ có ký hiệu chẳng giống ai vào cuối 1 chữ (như "thik" sẽ bằng "thích"), ở đầu chữ hay ở giữa của chữ. Khi đó phải cắt và ghép các từ theo các loại đầu, giữa, sau thành các từ hoàn chỉnh và đối chiếu với thiếng Việt chuẩn để đoán từ. Trong trường hợp có nhiều từ tạo thành thì đánh giá theo ý nghĩa và gợi ý cho bản dịch.
Tất cả các nội dung này tôi đã mô tả ngắn gọn ở phần đầu rồi còn gì. Phần code mới viết được việc tra từ hoàn chỉnh, chưa viết được phần cắt, ghép để tạo thành các từ có nghĩa, rồi từ các từ có nghĩa gợi ý 1 câu hoàn chỉnh. Công cụ tôi đưa lên đây để mọi người tham gia và bổ sung code xử lý ý tưởng này (bằng kỹ thuật VBA) chứ có bàn luận về ngôn ngữ đâu mà các bác chém rát quá.
Nếu các bác đọc bài ở 2 link trên mà không có ý kiến gì thì tôi cũng đành bó tay với các đàn anh thôi và để lời giải cho lớp teen thực hiện vậy.
 
Upvote 0
Cảm ơn bác Chanh đã nhắc nhở, nhưng đúng là mọi người hơi lạc đề. Mục đích tôi mở đề tài này là “Chung tay làm công cụ dịch Teen-Việt-Teen bằng excel + VBA” vì bộ từ điển trên excel dễ cập nhật và với kỹ thuật không đơn thuần chỉ là đối chiếu xong rồi hiển thị mà áp dụng chính cách xử lý chữ của teen để đoán chữ rồi tạo thành câu (nếu đoán có nhiều chữ thì đánh giá xem câu nào thích hợp nhất).
Ví dụ teen thay chữ “ch” bằng “k” (với mẫu biểu diễn là _k = _ch) thì các từ “thik, ngik, kik” sẽ là “thich, nghich, kich”.
Tôi vướng mắc ở chỗ khi nhiều chữ cùng bị thay 1 lúc thì sẽ tạo ra nhiều từ dự đoán. Ví dụ: cũng với từ “thich” nhưng đồng thời áp dụng th_ = t_ sẽ tạo ra nhiều từ: “tik” = “thich, tich, tic” = từ có nghĩa: “thích/thình thịch, tích điểm/tịch thu, tíc tắc/tíc tíc” việc dự đoán từ đến đây gặp khó khăn khi đưa dấu và nghĩa từ để đoán cùng với từ trước và sau nó.
Ở đây, tôi muốn nói đến kỹ thuật xử lý bằng lập trình trong xử lý ngôn ngữ tự nhiên chứ mọi người chém ra ngoài nhiều quá.
Bác nào đã lập trình làm từ điển rồi gợi ý cho anh/em cách xử lý với !!!
 
Upvote 0
Cái bạn muốn trong nghề gọi là "Fuzzy Matching". Nó có từ cơ bản đến nâng cao. Tuỳ theo bạn chấp nhận độ phức tạp cỡ nào mà có những giải pháp khác nhau. Cách dễ nhất là lên mạng tìm từ khoá này. Tuy có một vài ứng dụng Exxcel nhưng tôi không nghĩ là gần với nhu cầu của bạn. Bên Javascript có thể gần hơn vì nó cần đáp ứng nhu cầu AJAX. Chịu khó tìm code trong JS rồi dịch ra VBA.

Tôi chỉ cho biết từ khoá để bạn nào có ngẫu hứng thì tìm hiểu. Tôi thì không.
 
Upvote 0
Cảm ơn bác đã nhắc nhở; Nhưng đúng là mọi người hơi lạc đề. Mục đích tôi mở đề tài này là “Chung tay làm công cụ dịch Teen-Việt-Teen bằng excel + VBA” vì bộ từ điển trên excel dễ cập nhật và với kỹ thuật không đơn thuần chỉ là đối chiếu xong rồi hiển thị mà áp dụng chính cách xử lý chữ của teen để đoán chữ rồi tạo thành câu (nếu đoán có nhiều chữ thì đánh giá xem câu nào thích hợp nhất).
Ví dụ teen thay chữ “ch” bằng “k” (với mẫu biểu diễn là _k = _ch) thì các từ “thik, ngik, kik” sẽ là “thich, nghich, kich”.

Ngó đi, nhìn lại những người đã gé thăm & có bài trả lời trong topic này, bạn sẽ không nhận được sự trợ giúp từ nhiều thành viên sừng sỏ VBA trong diễn đàn này rồi!

Mong bạn tiếp tục nung nấu í chí của mình & chờ đợi thêm thời gian, biết đâu sẽ có người cộng tác với bạn!

Chúc vui!


 
Upvote 0
Ngó đi, nhìn lại những người đã gé thăm & có bài trả lời trong topic này, bạn sẽ không nhận được sự trợ giúp từ nhiều thành viên sừng sỏ VBA trong diễn đàn này rồi!

Mong bạn tiếp tục nung nấu í chí của mình & chờ đợi thêm thời gian, biết đâu sẽ có người cộng tác với bạn!

Chúc vui!



Đây là 1 ý tưởng khác biệt,

Cần được khuyến khích,

Tác giả nên tiếp tục trao đổi, Không có gì là không thể, - người ta đã làm thì bạn cũng có thể làm được - đừng nghe chuyền đàm phiến
 
Upvote 0

Bài viết mới nhất

Back
Top Bottom