Trí tuệ nhân tạo giải mã ngôn ngữ chết

Tuấn Sơn 28/10/2020 14:35

GD&TĐ - Các nhà khoa học ở Viện Công nghệ Massachusetts MIT (Mỹ) vừa tạo ra hệ thống sử dụng học máy (machine learning) để giải mã các ngôn ngữ đã chết.

Hiểu ngôn ngữ bị lãng quên là việc không dễ.

Nhiều nghiên cứu cho thấy, phần lớn các ngôn ngữ đang tồn tại trên thế giới không được sử dụng; hàng chục ngôn ngữ chết không thể nhận ra. Các nhà ngôn ngữ học không hiểu đầy đủ về ngữ pháp, từ vựng và cú pháp của những ngôn ngữ ấy.

Việc nghiên cứu các ngôn ngữ bị lãng quên là rất khó, bởi phần lớn các ngôn ngữ ấy không thể so sánh được với ngôn ngữ tương tự khác. Một số ngôn ngữ còn thiếu cả quy tắc ngữ pháp hay dấu câu.

Phòng thí nghiệm Tin học và Trí tuệ nhân tạo thuộc Viện Công nghệ Massachusetts MIT (Mỹ) đã thực hiện bước đột phá trong giải mã các ngôn ngữ bị lãng quên.

Các nhà khoa học đã phát triển hệ thống mới, có khả năng tự động giải mã ngôn ngữ bị lãng quên mà không cần có kiến thức về sự liên quan với các ngôn ngữ khác. Hệ thống có thể xác định mối liên quan giữa các ngôn ngữ.

“Hệ thống hoạt động dựa trên 7 nguyên tắc liên quan đến hiểu biết về lịch sử ngôn ngữ. Theo những nguyên tắc này, ngôn ngữ nói chung chỉ phát triển theo cách có thể dự đoán trước” – bà Regina Barzilay, Giám đốc dự án phát triển hệ thống giải mã ngôn ngữ chết của MIT, cho biết như vậy.

Trong lịch sử tiến hóa ngôn ngữ, rất hiếm khi xảy ra trường hợp thêm vào hoặc loại bỏ toàn bộ âm thanh, mà thường xảy ra các trường hợp thay thế âm thanh. Chẳng hạn như một từ với chữ cái “p” trong ngôn ngữ mẹ (ngôn ngữ gốc) có thể được thay thế bằng chữ cái “b” trong ngôn ngữ con, tuy nhiên không có khả năng chuyển thành “k”.

Tận dụng những giới hạn về ngôn ngữ này, các nhà khoa học của MIT đã phát triển một thuật toán giải mã, có khả năng đối phó với không gian khổng lồ của các phép biến đổi ngôn ngữ.

Thuật toán này học cách nhúng các âm thanh ngôn ngữ vào một không gian đa chiều - nơi sự khác biệt trong cách phát âm được phản ánh thông qua các từ, cụm từ được vector hóa tương ứng. Hệ thống có mục đích phân đoạn các từ trong một ngôn ngữ cổ và ánh xạ chúng thành các từ tương đương trong ngôn ngữ liên quan.

Theo Nauka

giải mã ngôn ngữ thuật toán giải mã Viện Công nghệ Massachusetts MIT giải mã ngôn ngữ chết ngôn ngữ chết Trí tuệ nhân tạo ngữ pháp

cùng chuyên mục

PGS.TS Võ Thanh Tùng, Hiệu trưởng Trường Đại học Khoa học, Đại học Huế (TP Huế).

Ứng cử viên đại biểu Quốc hội mong muốn tạo việc làm cho sinh viên

11/03/2026 14:07

Bà Choi Sang Ah, Lãnh sự Tổng Lãnh sự quán Hàn Quốc tại TPHCM trao đổi tại buổi lễ. Ảnh: Mạnh Tùng.

Khởi động dự án cải thiện chất lượng không khí tại Việt Nam

10/03/2026 21:37

Các diễn giả chia sẻ kinh nghiệm triển khai AI trong môi trường vận hành thực tế của doanh nghiệp tại hội thảo Swin- AAIIIS 2026.

Hội thảo Swin-AAIIIS 2026 bàn cách đưa AI vào vận hành doanh nghiệp

10/03/2026 11:05

Mô hình tàu vũ trụ Voyager. Ảnh: NASA/JPL-Caltech

Sứ mệnh đặc biệt của Voyager 1

10/03/2026 07:32

Những dự đoán thiên văn học năm 2026

08/03/2026 07:25

Tin tiêu điểm

Thiết giáp hạng nặng trên khung T-72 xuyên thủng tuyến phòng thủ đối phương?

Thế giới 16/07/2024 17:00

GD&TĐ - Những xe bọc thép chở quân sử dụng khung gầm xe tăng chiến đấu chủ lực có lẽ là phương tiện cần thiết với Quân đội Nga hiện nay.

Sẽ gọi tái ngũ hàng trăm tiêm kích MiG-31 trong kho dự trữ?

Thế giới 17/07/2024 13:00

GD&TĐ - Các nguồn thông tin mở cho biết đến năm 2018, Nga có thể vẫn lưu giữ tới 130 tiêm kích MiG-31 trong các kho dự trữ.

Forbes nêu tên quốc gia có lực lượng pháo binh lớn nhất thế giới

Thế giới 18/07/2024 06:01

GD&TĐ - Quân đội Nga có kho vũ khí pháo lớn nhất và cũng có nguồn cung cấp đạn dược ổn định – Tạp chí Forbes tuyên bố ngày 16/7.

Bài học quý giá từ phương tiện chủ chốt trong chiến dịch đặc biệt

Thế giới 19/07/2024 07:00

GD&TĐ - Xe tăng chiến đấu chủ lực T-90M do Nga sản xuất đã trở thành một trong những phương tiện chủ chốt trong chiến dịch quân sự đặc biệt ở Ukraine.

Đóng hàng loạt tàu đổ bộ Dự án 11711 với cấu hình mới

Thế giới 19/07/2024 15:00

GD&TĐ - Cấu hình mới của tàu đổ bộ Dự án 11711 mang lại khả năng tác chiến cao hơn cho Hải quân Nga.

Kỳ thi tốt nghiệp THPT 2024, Đình Thanh xuất sắc ẵm trên tay vị trí thủ khoa toàn tỉnh Lạng Sơn khối A01, với tổng điểm 28,35. Ảnh NVCC.

Nam sinh người Tày đỗ đầu khối A01 tỉnh Lạng Sơn từng bỏ vòng loại HSG quốc gia

Học đường 20/07/2024 07:04

GD&TĐ - Dù điều kiện học tập có phần hạn chế nhưng, Dương Đình Thanh người dân tộc Tày vẫn sở hữu điểm số ba môn Toán, Vật lí và tiếng Anh vô cùng ấn tượng.