Trí tuệ nhân tạo giải mã bản ghi chép cổ đại

Trọng Dương 05/08/2021 15:32

GD&TĐ - Thư viện Tu viện St. Gall ở Thụy Sĩ là nơi lưu giữ khoảng 160.000 tập bản thảo văn học và lịch sử có niên đại từ thế kỷ thứ 8.

Hệ thống tự động hóa phiên âm trang sách.

Tất cả đều được viết tay trên giấy da và bằng những ngôn ngữ hiếm khi được sử dụng trong thời hiện đại.

Để lưu giữ những “báu vật lịch sử” này của nhân loại, hàng triệu văn bản như vậy đã được cất trong các thư viện và tu viện trên khắp thế giới. Phần lớn bộ sưu tập được chia sẻ tới công chúng thông qua hình ảnh kỹ thuật số. Tuy nhiên, các chuyên gia cho rằng, có một lượng tài liệu “phi thường” chưa từng được đọc, được viết bằng ngôn ngữ cổ.

Giờ đây, các nhà nghiên cứu tại Đại học Notre Dame đang phát triển một mạng lưới thần kinh nhân tạo để đọc các chữ viết tay cổ phức tạp dựa trên nhận thức của con người. Walter Scheirer - Phó Giáo sư Khoa Khoa học và Kỹ thuật Máy tính tại Notre Dame, chia sẻ:

“Chúng tôi đang xử lý các tài liệu lịch sử có từ nhiều thế kỷ trước và bằng các ngôn ngữ như tiếng Latinh, hiếm khi được sử dụng ở hiện tại. Những gì chúng tôi đặt ra là tự động hóa phiên âm của trang sách, theo cách bắt chước nhận thức thông qua con mắt của người đọc chuyên nghiệp. Đồng thời, cung cấp khả năng đọc văn bản nhanh chóng, có thể tìm kiếm được”.

Trong nghiên cứu mới được công bố, Scheirer phác thảo cách nhóm của ông kết hợp các phương pháp học máy truyền thống với tâm sinh lý trực quan. Đây là một phương pháp đo lường mối liên hệ giữa các kích thích vật lý và hiện tượng tinh thần.

Ví dụ như khoảng thời gian cần thiết để một người đọc chuyên nghiệp nhận ra một ký tự cụ thể, đánh giá chất lượng của chữ viết tay hoặc xác định việc sử dụng các chữ viết tắt nhất định.

Nhóm của Scheirer đã nghiên cứu các bản viết tay bằng tiếng Latinh được số hóa. Bản này được viết bởi những người ghi chép ở Tu viện St. Gall vào thế kỷ thứ 9. Độc giả đã nhập các phiên âm thủ công của họ vào một giao diện phần mềm được thiết kế đặc biệt.

Sau đó, nhóm nghiên cứu đo thời gian phản ứng trong quá trình phiên âm để biết từ, ký tự và đoạn văn nào dễ hay khó. Ông Scheirer giải thích, phương pháp đó đã tạo ra một mạng lưới phù hợp hơn với hành vi của con người. Nhờ đó, giảm lỗi và cung cấp khả năng đọc văn bản chính xác, thực tế hơn.

“Đó là một chiến lược thường không được sử dụng trong học máy. Chúng tôi gắn nhãn dữ liệu thông qua các phép đo tâm sinh lý này. Chúng xuất phát trực tiếp từ các nghiên cứu tâm lý về nhận thức, bằng cách thực hiện các phép đo hành vi.

Sau đó, chúng tôi thông báo cho mạng lưới những khó khăn phổ biến và có thể sửa chữa dựa trên các phép đo đó”, ông Scheirer giải thích.

Tuy nhiên, theo Phó Giáo sư Scheirer, phương pháp này vẫn gặp nhiều thách thức. Nhóm của ông đang làm việc để cải thiện độ chính xác của các bản chép, đặc biệt là trong trường hợp tài liệu bị hỏng hoặc không đầy đủ. Đồng thời, tính toán các khía cạnh khác khi trang ghi chép có thể khiến hệ thống nhầm lẫn.

Tín hiệu đáng mừng là nhóm đã thành công điều chỉnh chương trình để phiên âm các văn bản tiếng Ethiopia. Sau đó, điều chỉnh nó sang một ngôn ngữ có bộ ký tự hoàn toàn khác. Đây được cho là bước đầu tiên để phát triển một chương trình có khả năng phiên âm và dịch thông tin cho người dùng.

Theo TechXplore

chữ viết tay cổ báu vật lịch sử mạng lưới thần kinh nhân tạo văn bản tiếng Ethiopia ngôn ngữ cổ

Cùng chuyên mục

Nhiều người trẻ ngày nay có xu hướng tìm đến các chatbot AI để giãi bày tâm sự thay vì gặp chuyên gia tâm lý.

AI có thay thế nhà trị liệu?

02/08/2026 18:52

Các đại biểu tham dự hội thảo. Ảnh: HIU.

Nhiều tiến bộ mới trong chẩn đoán, điều trị tiêu hóa - gan mật

01/08/2026 17:31

Sony ZV-1F phù hợp người mới muốn quay vlog gọn nhẹ và tự canh khung hình dễ hơn.

Người mới quay vlog nên chọn ZV-1F hay ZV-E10?

31/07/2026 16:22

Phó Chủ tịch UBND tỉnh Đồng Tháp, Huỳnh Minh Tuấn và Phó Giám đốc Đại học Cần Thơ, Trần Ngọc Hải, ký kết thỏa thuận hợp tác. Ảnh: Phương Thanh.

UBND tỉnh Đồng Tháp ký kết hợp tác chiến lược với Đại học Cần Thơ

31/07/2026 15:01

Sở GD&ĐT Thái Nguyên triển khai tập huấn công tác chuyển đổi số trong giáo dục mầm non.

Hiệu quả quản lý, chất lượng giáo dục là thước đo của chuyển đổi số

31/07/2026 12:32

Tin tiêu điểm

Thiết giáp hạng nặng trên khung T-72 xuyên thủng tuyến phòng thủ đối phương?

Thế giới 16/07/2024 17:00

GD&TĐ - Những xe bọc thép chở quân sử dụng khung gầm xe tăng chiến đấu chủ lực có lẽ là phương tiện cần thiết với Quân đội Nga hiện nay.

Sẽ gọi tái ngũ hàng trăm tiêm kích MiG-31 trong kho dự trữ?

Thế giới 17/07/2024 13:00

GD&TĐ - Các nguồn thông tin mở cho biết đến năm 2018, Nga có thể vẫn lưu giữ tới 130 tiêm kích MiG-31 trong các kho dự trữ.

Forbes nêu tên quốc gia có lực lượng pháo binh lớn nhất thế giới

Thế giới 18/07/2024 06:01

GD&TĐ - Quân đội Nga có kho vũ khí pháo lớn nhất và cũng có nguồn cung cấp đạn dược ổn định – Tạp chí Forbes tuyên bố ngày 16/7.

Bài học quý giá từ phương tiện chủ chốt trong chiến dịch đặc biệt

Thế giới 19/07/2024 07:00

GD&TĐ - Xe tăng chiến đấu chủ lực T-90M do Nga sản xuất đã trở thành một trong những phương tiện chủ chốt trong chiến dịch quân sự đặc biệt ở Ukraine.

Đóng hàng loạt tàu đổ bộ Dự án 11711 với cấu hình mới

Thế giới 19/07/2024 15:00

GD&TĐ - Cấu hình mới của tàu đổ bộ Dự án 11711 mang lại khả năng tác chiến cao hơn cho Hải quân Nga.

Kỳ thi tốt nghiệp THPT 2024, Đình Thanh xuất sắc ẵm trên tay vị trí thủ khoa toàn tỉnh Lạng Sơn khối A01, với tổng điểm 28,35. Ảnh NVCC.

Nam sinh người Tày đỗ đầu khối A01 tỉnh Lạng Sơn từng bỏ vòng loại HSG quốc gia

Học đường 20/07/2024 07:04

GD&TĐ - Dù điều kiện học tập có phần hạn chế nhưng, Dương Đình Thanh người dân tộc Tày vẫn sở hữu điểm số ba môn Toán, Vật lí và tiếng Anh vô cùng ấn tượng.