Từ một cách làm từ điển mới…

04:52 CH @ Thứ Sáu - 21 Tháng Hai, 2020

Từ câu chuyện từ điển lạc hậu và cách tiếp cận hoàn toàn mới của dự án Glosbe, nghĩ về chuyện con người của tương lai cần tới một tư duy độc lập...

Người lớn thường “hù dọa” nhau bằng câu chuyện: đến 80% công việc của năm 2030 nay vẫn chưa xuất hiện. Vì thế họ cho rằng, điều quan trọng là ngay bây giờ phải dạy những em đang ngồi trên ghế nhà trường và sẽ vào đời ở thời điểm đó những kỹ năng gì, kiến thức nào.

Nói cách khác, có thể vào năm 2030 vẫn là những nghề bác sĩ, kỹ sư, thầy giáo, chuyên viên tiếp thị, nhân viên ngân hàng…ấy, nhưng nội dung công việc phải làm hàng ngày sẽ hoàn toàn khác bây giờ, sẽ phải vận dụng những kiến thức, kỹ năng nay chưa tồn tại. Nền giáo dục sẽ phải dạy gì bây giờ?

Một nghề lụi tàn

Hãy cùng nhau nhìn vào chuyện làm từ điển như một minh họa. Nghề làm và in từ điển trên giấy đang ngày càng mai một. Bây giờ không ai chịu lật cuốn từ điển dày cộp cả ngàn trang, mày mò đến đúng từ cần tra cứu; họ sẽ lên mạng hay mở ứng dụng gõ từ cần tìm để có ngay kết quả. Nhưng cũng như nghề báo, từ điển đưa lên mạng không thể bán để thu tiền ngoài một vài ô quảng cáo.

Chính vì thế các cuốn từ điển Anh - Việt, Việt - Anh hiện nay, là nền tảng cho các cuốn từ điển trực tuyến, đều lạc hậu ít nhất vài chục năm. Sự lạc hậu, đôi lúc dẫn tới sai sót có thể là nguyên nhân của nhiều trường hợp “thảm họa dịch thuật” vì người dịch chỉ biết bám vào nghĩa ghi trên từ điển.

Dĩ nhiên, khó mà kỳ vọng các từ mới phổ biến như “meme” được đưa vào các từ điển Anh - Việt kịp thời nhưng ngay cả các từ đã trở nên quen thuộc trong hai chục năm qua cũng vắng bóng trong các cuốn từ điển này hoặc chỉ ghi nhận nghĩa cũ của chúng. Từ “swipe” có thời rất phổ biến với nghĩa quẹt thẻ, nay “swipe” còn là quét ngón tay qua màn hình điện thoại, giới trẻ giờ nói “swipe right” là hiểu ngay đang dùng ứng dụng hẹn hò Tinder và đã “chấm” được một ai đó.

Các từ điển trực tuyến mà người viết có điều kiện truy cập và dùng thử đều không có các nghĩa này (chỉ liệt kê các nghĩa “cú đánh mạnh và liều”, “vụt, đập” một cách máy móc, sao chép của nhau). Đó là một ví dụ chọn ngẫu nhiên; hầu như có thể nêu hàng ngàn ví dụ như thế; hỏi sao người học tiếng Anh không bối rối lúng túng vì câu nào họ dùng từ điển hòng hiểu cho trọn vẹn đều trở nên mơ hồ hơn.

Nguyên nhân là do không ai bỏ công ra ngồi biên soạn từ điển một cách công phu như ngày xưa nữa. Làm từ điển không phải là chuyện dễ, việc biên soạn các cuốn từ điển nổi tiếng trên thế giới có cả một bộ máy đồ sộ đứng đằng sau. Một khi không còn động lực tài chính, rất khó tổ chức được một bộ máy như thế, bắt đầu bằng nguồn dữ liệu thô, thu gom hết mọi từ có nghĩa mới, cách chúng xuất hiện trên các văn bản, sàng lọc, tinh chỉnh và chọn những điều lắng đọng lại để liên tục cập nhật vào một cuốn từ điển ngày càng dày. Công sức một người không làm nổi chuyện này; còn hợp tác biên soạn từ điển hầu như chưa thấy tổ chức nào đứng ra làm một cách nghiêm túc.

Cách làm từ điển “nhân dân”: vừa hay vừa sai sót

May mắn thay, thế giới công nghệ làm nảy ra một phương cách khác: tận dụng công nghệ và trí tuệ đám đông để biên soạn từ điển. Đó chính là cách tiếp cận của dự án từ điển trực tuyến Glosbe (glosbe.com cho mọi ngôn ngữ hay vào ngay từ điển Anh Việt tại vi.glosbe.com). Có thể xem đây là một dạng từ điển bách khoa Wikipedia nhưng chuyên về dịch qua lại giữa hàng chục ngôn ngữ, trong đó có Anh Việt và Việt Anh.

Những "từ điển nhân dân" như kiểu Wikipedia tuy rất tiện lợi nhưng có rủi ro cao về độ chính xác (Ảnh: Wired)

Vì được tổ chức theo dạng Wikipedia nên Glosbe có những điểm mạnh đi kèm với những điểm yếu y như Wiki vậy. Điểm mạnh đầu tiên là Glosbe đã biết tận dụng khái niệm “translation memory” (bộ nhớ dịch) để trình bày mọi câu ví dụ có từ đang được tra cứu. Họ tải vào bộ nhớ của họ cả triệu trang dữ liệu đã từng được dịch nên mỗi khi có ai tra vấn nghĩa của một từ, họ trích từ bộ nhớ này những lần mà từ đó xuất hiện trong ngôn ngữ nguồn, kèm câu dịch theo ngôn ngữ đích.

Với một người làm nghề biên dịch, có gì sướng hơn là đang băn khoăn cách dịch một từ lại được cung cấp hàng chục ví dụ người ta từng dịch từ đó như thế nào. Còn gì thích thú hơn khi đi truy tìm nghĩa của một từ mà các từ điển trên mạng không có lại được bày biện đủ cả nghĩa lẫn cách dùng, lẫn cách dịch.

Theo giới thiệu của Glosbe, dự án này bắt đầu từ giữa năm 2011, bộ khung và phần mềm chạy ẩn đằng sau là do hai nhà lập trình người Ba Lan làm ra, còn nội dung là do đóng góp của cả một cộng đồng to lớn. Glosbe là từ điển đa ngôn ngữ (đến nay đã có 7.000 ngôn ngữ được hỗ trợ), dữ liệu thô lấy từ các nguồn mở, các cơ sở dữ liệu miễn phí và do người dùng đóng góp (hiện đã có hơn 1 tỷ câu được dịch). Riêng từ điển Anh - Việt đã có hơn 100.000 cụm từ và gần 3 triệu câu được dịch. Người dùng có thể đăng ký tài khoản để đóng góp câu dịch mới hay tải lên cả cuốn sách hay tài liệu mình từng dịch để đưa vào bộ nhớ chung; họ cũng có thể chỉnh sửa các câu dịch sai.

Glosbe đặc biệt hữu dụng khi chúng ta muốn dịch luôn cả cụm từ, điều mà các từ điển trực tuyến hiện nay còn rất yếu. Thử lấy hú họa câu trong một bài báo của Paul Krugman đăng trên The New York Times, ví dụ câu: “What still hangs in the balance is the outcome”. Thử tra các từ điển thông thường, không thể nào tìm ra nghĩa của cụm từ “hang in the balance” tất cả đều báo không tìm ra. Glosbe cho ngay hàng chục câu có cụm từ này, với cách dịch khác nhau; nhờ nghĩa tiếng Anh tương đương “To be in a precarious situation, unsure of the future”, người dùng sẽ chọn được cách dịch khá tốt là “treo lơ lửng”, “bất phân định”.

Với văn nói hay các lời thoại trong phim ảnh, từ điển Anh Việt bình thường hiện nay bó tay trong nhiều trường hợp. “It’s your call” – gõ nguyên cụm này thì từ điển báo không tìm thấy, gõ từ “call” thì ra hàng chục nghĩa tìm mãi cũng không biết nên áp nghĩa nào. Với Glosbe, bạn sẽ được cung cấp ngay cách dịch “Tùy anh thôi”, “Cậu quyết định đi”, “Quyết định là ở bạn”… tùy bạn muốn chọn câu nào cũng được.

Dĩ nhiên, như đã nói ở trên, thu gom cả thượng vàng hạ cám ắt sẽ có câu dịch sai xuất hiện. Ví dụ “She’s got a point” bên cạnh câu dịch đúng là “Bà ấy có lý đấy” vẫn có những câu tào lao nổi lên, kiểu “Cô ấy có một điểm”. Nói cách khác, những thảm họa dịch thuật từng xuất hiện ngoài đời thì cũng xuất hiện trong bộ nhớ của từ điển Glosbe. Glosbe thu gom rất tốt nhưng thiếu sàng lọc, tinh chỉnh nên vẫn còn nhiều hạt sạn lớn. Thế mạnh cũng chính là điểm yếu của cách làm từ điển theo kiểu Globse: đầu vào bị lỗi thì ắt đầu ra cũng bị lỗi theo. Kho bộ nhớ dịch Anh Việt bên cạnh những câu dịch hoàn chỉnh, tuyệt vời cũng có những câu dịch cẩu thả, bỏ sót và dịch sai nữa. Điều này phản ánh khá đúng tình hình dịch thuật của nước nhà.

Tìm cách sống với nền kinh tế kỹ thuật số

Kỹ năng của một người sống trong thời đại hiện nay là biết làm công việc sàng lọc, gạn đục khơi trong cho rất nhiều dịch vụ, sản phẩm chứ không riêng gì chuyện dùng từ điển Glosbe. Thuê nhà Airbnb rất thuận tiện, nhiều nơi có cả căn bếp để người thuê nấu ăn chứ không chỉ là căn phòng lạnh lẽo như ở khách sạn. Thế nhưng nếu không rà soát cẩn thận, rất dễ rơi vào tình huống bị lừa vào giờ phút chót. Đi xe Grab còn gì hiện đại hơn khi chỉ cần bấm nút, xe đến tận nơi nhưng cũng nhiều người gặp phải chuyện bực mình, phiền toái vì tài xế Grab. Mua hàng qua mạng giúp khỏi chạy ngoài đường phố vừa kẹt xe vừa bụi bặm nhưng cũng dễ mua nhằm hàng dỏm, hàng không đúng như quảng cáo.

Tính hai mặt của thế giới mạng rất rõ: chẳng hạn mạng xã hội giúp kết nối, giúp biết được mọi ngóc ngách của cuộc sống nhưng người dùng cũng dễ bị tác động, tin sái cổ vào tin giả, tin bịa. Không thể tự cô lập, không dùng những sản phẩm của thời đại công nghệ đem lại nhưng cũng không thể ngây thơ tin hết vào sự hào nhoáng, hiện đại của công nghệ. Nếu có cách tiếp cận như thế, người dùng sẽ an tâm mở từ điển Glosbe ra xài, biết cái nào tin được, cái nào cần kiểm chứng, đối chiếu với nguồn khác.

Từ câu chuyện từ điển lạc hậu và cách tiếp cận hoàn toàn mới của dự án Glosbe, người viết bỗng nghĩ nếu sau này các kỹ năng hành nghề sẽ biến đổi; bác sĩ sẽ không còn chẩn bệnh, cho toa điều trị mà chỉ còn đóng vai trò giao tiếp với bệnh nhân, việc chẩn đoán đã có máy làm; nhân viên ngân hàng không còn ngồi sau quầy để giải quyết từng khách đến rút tiền, chuyển tiền vì tất cả giao dịch thực hiện qua ứng dụng… con người của tương lai cần nhất là một tư duy độc lập, biết nhận định đúng sai, khả năng phản biện hết mọi dữ liệu đầu vào, khả năng phân tích, tổng hợp và chọn lọc dữ liệu cần cho mình. Khi đó môn toán giúp học sinh học tư duy lô-gich, môn văn giúp các em đọc hiểu ý nghĩa giữa hai hàng chữ, môn đạo đức giúp xây dựng lòng bao dung, sự trung thực… tất cả các môn nhắm tới đào tạo một con người có óc sáng tạo, trí tưởng tượng và sự miễn nhiễm trước các cạm bẫy của thế giới công nghệ mà dù muốn dù không các em cũng phải tiếp xúc.

FacebookTwitterLinkedInPinterestCập nhật lúc:

Nội dung liên quan

  • Cuốn “từ điển phiền não” của kiếp người

    12/11/2019BS Lê HùngNỗi lo âu và sự phiền não của con người cũng giống như một cuốn từ điển bách khoa, lật hết trang này thì tiếp đến trang khác, cứ thế kéo suốt một đời cho đến khi xuôi tay nhắm mắt. Chỉ những người có tinh thần lạc quan cao độ, với sự thấu hiểu rằng hạnh phúc là hy sinh, là cho bớt đi, buông xả và đơn giản đến tận cùng, mới có thể sống trong hạnh phúc trọn vẹn dài lâu.
  • Từ điển phụ nữ

    07/03/2019Lê HoàngMới đây, tổ chức đàn ông thế giới đã xuất bản một cuốn sách dày ba mươi tập, nhằm giúp cho các nhà nghiên cứu hiểu rõ hơn về phụ nữ, một phạm trù phức tạp nhất hành tinh. Chúng tôi xin lần lượt trích đăng một số chương trong đó, để các chàng trai tội nghiệp khỏi bỡ ngỡ và có được một số kiến thức cần thiết để sống sót...
  • Tương lai của bách khoa toàn thư mở Wikipedia

    11/02/2009Nguyệt Hàn (Theo The Independent)Đầu năm 2001 , bách khoa toàn thư mở trên mạng Wikipedia ra mắt trong bối cảnh Britannica đang xoay xở tính chuyện tài chính để số hóa. Sẽ là một kho chứa tri thức nhân loại lớn nhất từ trước đến nay?
  • Wikipedia 'trả miếng' Google bằng công cụ tìm kiếm

    06/01/2008Việt Toàn (theo The Age)Sau khi Google giới thiệu bách khoa thư trực tuyến Knol, Jimmy Wales, "cha đẻ" Wikipedia cũng tuyên bố triển khai dịch vụ tìm kiếm Wikia Search vào ngày 7/1 tới...
  • Cha đẻ Wikipedia lập website cạnh tranh với "con"

    18/10/2006Đỗ LinhLarry Sanger tuyên bố sẽ khai trương một trang từ điển có tên Citizendium để cạnh tranh với Wikipedia vào cuối năm nay. Ông chính là người đã cùng với Jimmy Wales sáng lập ra website từ điển toàn thư trực tuyến khổng lồ Wikipedia vào năm 2001...
  • Wikipedia làm nên một hiện tượng thông tin toàn cầu

    06/01/2006P.T. (theo Newsweek)Frieda Brioschi là chuyên gia lập trình máy tính ở Arcore (Italy) nhưng cô vẫn dành hơn 25 giờ mỗi tuần để biên tập nội dung phiên bản từ điển bách khoa trực tuyến miễn phí bằng tiếng nước này...
  • Wikipedia tiếng Việt

    06/12/2005Nguyễn HoàngDo công việc đòi hỏi, cũng do ham thích các tài liệu bách khoa thư, tôi rất hồ hởi với những bộ từ điển bách khoa mới, đặc biệt là các trang web chuyên phục vụ tra cứu. Tình cờ được một người bạn giới thiệu trang www.wikipedia.com, tôi thử vào và thật sự ngạc nhiên.
  • Từ điển bỏ túi về tham nhũng

    16/09/2005Ăn hối lộ: ăn tiền rồi hối hận không kịp khi bị lộ
    Bắn: Dùng tiền tiêu diệt mọi sự liêm chính
    Bao che, bưng bít: Bảo vệ đoàn kết nội bộ
    Bóc lịch: Việc làm ưa thích của quan tham sau khi tham nhũng bị phát hiện...
  • xem toàn bộ