AI có thể giải mã ngôn ngữ bí ẩn thời cổ đại?

GD&TĐ - Trong kỷ nguyên của trí tuệ nhân tạo và dữ liệu lớn, con người đã giải mã được bộ gen, mô phỏng khí hậu Trái đất và cho máy móc học cách sáng tạo.

Phiến đá Rosetta.
Phiến đá Rosetta.

Tuy nhiên, khoa học vẫn chưa giải mã được những hệ thống chữ viết cổ đại, dấu vết của các nền văn minh rực rỡ trong lịch sử.

Những ký hiệu không lời giải

Hãy tưởng tượng bạn được giao nhiệm vụ dịch một văn bản viết bằng ngôn ngữ hoàn toàn xa lạ mà không có từ điển, không có ngữ pháp, không có bản dịch song song, thậm chí không biết đó có thực sự là một ngôn ngữ hay chỉ là hệ thống ký hiệu.

Đó chính là tình thế mà các nhà khảo cổ và ngôn ngữ học đang đối mặt khi nghiên cứu nhiều hệ thống chữ viết cổ đại như chữ viết Rongorongo trên đảo Phục Sinh, Linear A của người Minoan hay chữ Proto-Elamite ở Iran…

Bà Svenja Bonmann, chuyên gia Ngôn ngữ học tại Đại học Cologne (Đức), nhận định: “Đây là những câu đố trí tuệ ở cấp độ cao nhất. Ngay cả những bộ óc xuất sắc nhất cũng chưa thể giải quyết”.

Theo Bonmann, mỗi văn bản cổ chưa được giải mã giống như một cỗ máy thời gian. Nó mở ra khả năng tiếp cận trực tiếp với một nền văn hóa đã biến mất hàng nghìn năm trước. Tuy nhiên, khác với những cỗ máy thời gian trong khoa học viễn tưởng, các nhà nghiên cứu chỉ có trong tay những mảnh vụn hay vài ký hiệu rải rác trên đất sét, đá hoặc gỗ mục.

Một trong những rào cản lớn nhất đối với việc giải mã là sự thiếu hụt tư liệu. Nghiên cứu hiện tại của chuyên gia Bonmann tập trung vào chữ viết Epi-Olmec, từng được sử dụng ở bờ biển phía Nam Mexico. Dù các chữ khắc cho thấy đây có thể là một hệ thống chữ viết sơ khai, số lượng văn bản còn lại quá ít, lại thiếu bối cảnh rõ ràng, khiến việc giải mã gần như rơi vào ngõ cụt.

Tình trạng tương tự xảy ra với chữ viết của nền văn minh Thung lũng Indus, còn gọi là Harappan, tồn tại cách đây hơn 4 nghìn năm tại khu vực nay thuộc Tây Bắc Ấn Độ và Pakistan.

Các ký hiệu Indus xuất hiện trên hàng trăm con dấu và mảnh gốm nhưng hầu như chỉ là những chuỗi rất ngắn, thường chỉ gồm vài ký hiệu. Đến nay, giới học thuật vẫn tranh luận liệu đây có phải là một ngôn ngữ hoàn chỉnh hay chỉ là hệ thống biểu trưng mang tính nghi lễ hoặc hành chính.

Trên đảo Phục Sinh (Chile), chữ viết Rongorongo được khắc trên các tấm gỗ với hình ảnh chim, người và những hình dạng trừu tượng. Chỉ còn vài tấm bảng tồn tại, nhiều tấm đã bị hư hại nghiêm trọng. Không có văn bản song ngữ, không có truyền thống đọc nối tiếp, Rongorongo trở thành một trong những bí ẩn lớn nhất của ngôn ngữ học.

Tại châu Âu, nền văn minh Minoan trên đảo Crete, Hy Lạp, cũng để lại 3 hệ thống chữ viết. Trong số đó, chỉ có Linear B, một dạng chữ Hy Lạp sơ khai, đã được giải mã. Hai hệ thống còn lại, chữ tượng hình Crete và Linear A, vẫn chưa được hiểu rõ, dù Linear A xuất hiện với tần suất khá lớn trên các bảng đất sét.

Nổi tiếng nhất trong số những bí ẩn này là đĩa Phaistos, một hiện vật bằng đất sét có niên đại khoảng năm 1700 trước Công nguyên, với các biểu tượng được dập theo hình xoắn ốc. Đây là tác phẩm độc nhất vô nhị, không có hiện vật tương tự để so sánh, khiến mọi nỗ lực giải mã đều thiếu điểm tựa.

Ở miền Trung Italy, tiếng Etruscan từng được sử dụng rộng rãi trước khi La Mã trỗi dậy. Dù bảng chữ cái có thể đọc được vì bắt nguồn từ tiếng Hy Lạp, bản thân ngôn ngữ Etruscan lại không có họ hàng gần nào còn tồn tại, khiến việc hiểu nội dung các văn bản trở nên vô cùng khó khăn.

Trong khi đó, chữ Proto-Elamite, hệ thống chữ viết hành chính cổ nhất tại khu vực Iran ngày nay, được ghi chép khá đầy đủ, nhưng các bảng đất sét thường bị vỡ và nội dung chủ yếu là các ghi chú kế toán. Ngôn ngữ này không thuộc bất kỳ ngữ hệ nào đã biết.

ai-co-the-giai-ma-ngon-ngu-bi-an-1.jpg
Đĩa Phaistos.

Phiến đá Rosetta: Chiếc chìa khóa hiếm hoi của lịch sử

Điểm chung của tất cả những hệ thống chữ viết kể trên là sự thiếu vắng một yếu tố mang tính quyết định. Đó là một “Phiến đá Rosetta”.

Phiến đá Rosetta, được phát hiện năm 1799 tại Ai Cập, là tấm bia đá khắc cùng một nội dung bằng 3 hệ thống chữ viết gồm chữ tượng hình Ai Cập, chữ Demotic (dạng chữ viết hành chính phổ biến thời đó) và tiếng Hy Lạp cổ. Vì tiếng Hy Lạp đã được hiểu rõ, các học giả có thể so sánh từng đoạn văn, xác định tên riêng, chức danh và cấu trúc câu, từ đó suy ra giá trị âm thanh và ý nghĩa của các ký hiệu tượng hình.

Cơ chế giải mã của Phiến đá Rosetta không phải là “dịch từng chữ”, mà là xây dựng cầu nối giữa cái đã biết và cái chưa biết. Nó cho phép các nhà nghiên cứu kiểm chứng giả thuyết, sửa sai và từng bước tái tạo toàn bộ hệ thống chữ viết Ai Cập cổ đại. Không có hiện vật này, chữ tượng hình Ai Cập có thể vẫn chỉ là những hình vẽ câm lặng.

Vấn đề là với nhiều hệ thống chữ viết bí ẩn, những điểm nối ấy hoàn toàn không tồn tại.

Trong những năm gần đây, trí tuệ nhân tạo được kỳ vọng sẽ mở ra hướng đi mới cho việc giải mã các ngôn ngữ cổ. AI có thể phân tích tần suất ký hiệu, tìm mẫu lặp lại, phân biệt biến thể, thậm chí đề xuất cách bổ sung các phần bị hỏng của văn bản.

Tuy nhiên, theo chuyên gia Bonmann, AI nhanh chóng chạm tới giới hạn khi phải làm việc với lượng dữ liệu cực nhỏ.

“AI cần rất nhiều dữ liệu để nhận dạng mẫu. Với vài trăm hoặc vài chục ký hiệu, khả năng suy luận của nó bị suy giảm nghiêm trọng”, chuyên gia này nhận xét.

Bà cũng cảnh báo rằng AI không thực sự “suy nghĩ” theo nghĩa con người. Nó tái tổ hợp những thông tin đã có. Điều đó có thể dẫn đến các cách diễn giải trông có vẻ hợp lý nhưng thiếu nền tảng khoa học. Nguy hiểm hơn, các mô hình AI có thể vô tình phản chiếu định kiến và kỳ vọng của chính những người huấn luyện chúng, khiến giả thuyết sai lầm được củng cố bằng vẻ ngoài của sự chính xác.

Những ký hiệu chưa được giải mã ấy là lời nhắc rằng lịch sử không phải lúc nào cũng sẵn sàng được kể lại. Và có lẽ, chính trong nỗ lực lắng nghe những tiếng nói câm lặng đó, con người tìm thấy ý nghĩa sâu xa của việc nghiên cứu quá khứ. Điều đó không chỉ để hiểu những nền văn minh đã mất, mà còn để hiểu chính mình.

Theo DW

Tin tiêu điểm

Đừng bỏ lỡ

Minh họa/CGT

Truyện ngắn: Qua một mùa nhớ

GD&TĐ - Cây bằng lăng trong sân trường bắt đầu bung nở những chùm hoa tím... Chỉ vài tuần thôi sắc hoa ấy sẽ nhuộm tím sân trường báo hiệu một mùa nhớ sắp qua, một chuyến đò nữa sẽ cập bến.

Từ trang sách: Cùng phiêu lưu để trưởng thành

Từ trang sách: Cùng phiêu lưu để trưởng thành

GD&TĐ - Văn học, đặc biệt là truyện thiếu nhi, trước hết phải chạm vào trái tim. Tập truyện “Ong Béo và Ong Gầy” của nhà văn Uông Triều đã làm được điều đó rất tự nhiên.

Học sinh tham gia workshop “Chạm vào công nghệ” tại hội thảo “Giáo dục STEM - Định hướng đào tạo nhân lực từ trường phổ thông”. Ảnh: Nguyễn Mạnh

Chuyển từ 'người dùng' sang 'làm chủ' công nghệ

GD&TĐ - Trong bối cảnh trí tuệ nhân tạo bùng nổ và chuyển đổi số trở thành trọng tâm của giáo dục, trang bị năng lực nghiên cứu khoa học cho học sinh phổ thông không còn là lựa chọn mà trở thành yêu cầu tất yếu.